הרחבות ציקלוטומיות ובעיית הבניה של מצולע משוכלל

מבוא

בפוסטים הקודמים הצגתי באופן הדרגתי את תורת גלואה עד שהגענו אל המשפט היסודי שלה, ועכשיו אני רוצה לדבר על יישום אחד, פשוט יחסית, שלה: בעיית הבניה של מצולע משוכלל. אני הולך לחזור כאן על דברים שכתבתי בעבר בבלוג, אבל בתקווה אתייחס אליהם בצורה יותר מקיפה ובהירה מאשר בעבר, עבור מי שיש לו את הרקע של הפוסטים הקודמים.

מצולע משוכלל הוא צורה דו ממדית של מצולע שכל הצלעות וכל הזוויות שלו שוות. למשל: משולש שווה צלעות. למשל: ריבוע. למשל: מחומש משוכלל. למשל: משושה משוכלל. הבנתם לאן זה הולך מכאן והלאה. מעוין הוא דוגמא למצולע שכל הצלעות שלו שוות אבל הזוויות לאו דווקא שוות; מלבן הוא דוגמא למצולע שכל הזוויות שלו שוות אבל הצלעות לאו דווקא שוות, כך ששתי התכונות הללו - צלעות שוות, זוויות שוות - הן הכרחיות.

כשאני אומר “בניה של מצולע משוכלל” אני מתכוון לבניה בסגנון היוונים הקדמונים: בעזרת סרגל ומחוגה בלבד. כעת נשאלת השאלה - אם \( n \) הוא מספר הצלעות של המצולע שאני רוצה לבנות, מה הקריטריון לפיו ניתן לקבוע אם המצולע הזה ניתן לבניה או לא? אפשר לזהות בניה של צורה עם בנייה של הקודקודים שלה (כי מרגע שיש קודקודים, אפשר לקחת סרגל, לשים על כל זוג קודקודים עוקבים ולשרטט קטע ביניהם). הקודקודים הם נקודות ב-\( \mathbb{R}^{2} \); הנקודה \( \left(a,b\right) \) ניתנת לבניה אם הקואורדינטות \( a,b \) שתיהן ניתנות לבניה. בפוסט שכתבתי ממש לא מזמן על העניין הזה ראינו שמספר \( a \) ניתן לבניה אם ורק אם \( a \) שייך להרחבה של \( \mathbb{Q} \) שמתקבלת מסדרה של הרחבות פשוטות ממימד 2. בשפה שלנו: אם \( \left[\mathbb{Q}\left(a\right):\mathbb{Q}\right]=2^{k} \). אז זו הדרישה שלנו על \( a,b \). איך נתרגם את זה חזרה לדרישה על \( n \)? ובכן, אם אני בונה מצולע משוכלל בעל \( n \) צלעות אפשר לבחור שהמרחק שלו מראשית הצירים יהיה 1, ושאחד מהקודקודים שלו יהיה \( \left(1,0\right) \). כעת נרצה לפזר את כל יתר הקודקודים באופן אחיד על מעגל היחידה. מה הדרך הנוחה ביותר לעשות זאת? ובכן, יש לנו תעלול בשביל זה שמערב מספרים מרוכבים, וספציפית את המספרים המרוכבים שנקראים שורשי היחידה.

שורשי היחידה מסדר \( n \) הם המספרים המרוכבים שפותרים את המשוואה \( z^{n}=1 \). יש בדיוק \( n \) כאלו, ואנחנו יודעים בדיוק מיהם ואיך הם נראים: הם מספרים מרוכבים מהצורה \( e^{2\pi i\cdot\frac{k}{n}} \) עבור \( 0\le k<n \). אינטואיטיבית, אלו מספרים מרוכבים שהערך המוחלט שלהם - מרחקם מראשית הצירים - הוא 1, ואילו הזווית שהם יוצרים עם החלק החיובי של ציר \( x \) היא \( \frac{k}{n}2\pi \). כלומר: אנחנו מחלקים מעגל שלם (\( 2\pi \)) ל-\( n \) חלקים, ושורשי היחידה מתקבלים מדילוגים שווים לאורך החלקים הללו. זה בדיוק מה שקורה עם הקודקודים של מצולע משוכלל.

דרך פשוטה במיוחד לתאר את שורשי היחידה מסדר \( n \) היא לסמן \( \omega_{n}\triangleq e^{\frac{2\pi i}{n}} \) ואז להציג כל שורש יחידה אחר מסדר \( n \) בתור חזקה שלו, \( \omega_{n}^{k} \) עבור \( 0\le k<n \). מכיוון שלבצע את פעולות החשבון הרגילות אנחנו יודעים עם סרגל ומחוגה, ומכיוון שכפל מרוכבים הוא בסך הכל ביצוע של פעולות חשבון רגילות מסויימות על המרוכבים (\( \left(a,b\right)\cdot\left(x,y\right)=\left(ax-by,ay+bx\right) \)) הרי שמספיק לבנות את \( \omega_{n} \) ומכאן נובע שאפשר לבנות את כל יתר הקודקודים. “לבנות את \( \omega_{n} \)” פירושו לבנות את הקואורדינטות \( \left(x,y\right) \) שהוא מייצג - את החלקים הממשי והמדומה שלו. אם כבר הצלחנו לבנות את \( x \) אז \( y \) מתקבל בחינם - פשוט נעביר אנך לציר \( x \) שעובר דרך הנקודה \( x \) הזו (להעביר אנך עם סרגל ומחוגה זה קל) ונחתוך אותו עם מעגל היחידה. לכן נדבר עכשיו על השאלה מתי ניתן לבנות את \( x \). נתחיל מכך שיש לנו נוסחה פשוטה עבור \( x \): \( x=\text{Re}\omega_{n}=\frac{\omega_{n}+\overline{\omega_{n}}}{2} \) מהו \( \overline{\omega_{n}} \)? זה משהו בסיסי במרוכבים: \( \omega_{n}\cdot\overline{\omega_{n}}=\left|\omega_{n}\right|^{2}=1 \) ולכן \( \overline{\omega_{n}}=\omega_{n}^{-1}=\omega_{n}^{n-1} \). אם ניקח את \( x \) ונכפול ב-\( 2\omega_{n} \) נקבל: \( 2\omega_{n}x=2\omega_{n}\left(\frac{\omega_{n}+\omega_{n}^{-1}}{2}\right)=\omega_{n}^{2}+1 \) כך שקיבלנו ש-\( \omega_{n} \) הוא השורש של הפולינום \( t^{2}-2tx+1 \) מעל \( \mathbb{Q}\left(x\right) \) (לא להתבלבל; כאן \( x \). הוא מספר ממשי רגיל, לא משתנה של פולינום). מכיוון ש-\( x \) הוא מספר ממשי, לא ייתכן ש-\( \omega_{n}\in\mathbb{Q}\left(x\right) \) כי \( \omega_{n} \) הוא מספר מרוכב לכל \( n>2 \) (אין טעם לדבר על המקרים \( n=1,2 \); הם בכלל לא רלוונטיים למצולעים). המסקנה היא ש-\( \left[\mathbb{Q}\left(\omega_{n}\right):\mathbb{Q}\left(x\right)\right]=2 \).

מכל זה אפשר להסיק את הדבר הבא: אם \( x \) ניתן לבניה, אז \( \left[\mathbb{Q}\left(x\right):\mathbb{Q}\right]=2^{k} \) עבור \( k \) כלשהו, ולכן \( \left[\mathbb{Q}\left(\omega_{n}\right):\mathbb{Q}\right]=2^{k+1} \). כלומר, תנאי הכרחי לכך שניתן יהיה לבנות את המצולע המשוכלל על \( n \) צלעות הוא ש-\( \left[\mathbb{Q}\left(\omega_{n}\right):\mathbb{Q}\right] \) תהיה חזקה של 2.

מכאן ברור שהדבר הדחוף ביותר שאנחנו נזקקים לו הוא להבין את ההרחבה \( \mathbb{Q}\left(\omega_{n}\right)/\mathbb{Q} \) - ההרחבה שנוצרת על ידי הוספת \( e^{\frac{2\pi i}{n}} \) לרציונליים. הרחבה כזו נקראת הרחבה ציקלוטומית, ולמרבה המזל אנחנו יודעים הרבה עליהן.

הפולינום הציקלוטומי

השאלה המיידית שלנו היא מה המימד של הרחבה ציקלוטומית שכזו. כמובן שמדגדג לומר שהוא \( n \), אבל ברור מיידית שזה לא נכון - למשל, \( \omega_{4}=i \) אבל \( \left[\mathbb{Q}\left(i\right):\mathbb{Q}\right]=2 \). העניין הוא ש-\( \mathbb{Q}\left(\omega_{n}\right) \) היא שדה הפיצול של הפולינום \( x^{n}-1 \) מעל \( \mathbb{Q} \), אבל הפולינום הזה הוא פריק. כדי שמעלה של הרחבה פשוטה תהיה שווה למעלה של פולינום שמאפס את האיבר שמרחיבים איתו, הפולינום הזה צריך להיות הפולינום המינימלי של האיבר, וכאן זה לא המצב. למשל, עבור \( n=4 \) אנחנו מקבלים \( x^{4}-1=\left(x^{2}+1\right)\left(x^{2}-1\right)=\left(x^{2}+1\right)\left(x+1\right)\left(x-1\right) \) והפולינום המינימלי של \( \omega_{4} \) הוא \( x^{2}+1 \).

אז איך בכלל מוצאים את הפולינום המינימלי הזה? הנה אינטואיציה, שאיננה הוכחה פורמלית. \( \mathbb{Q}\left(\omega_{n}\right) \) הוא שדה שורש של הפולינום המינימלי הזה. אנחנו יודעים שכל שני שדות שורש של אותו פולינום הם איזומורפיים, מה שאומר שהשורשים של פולינום אי-פריק “מתנהגים אותו דבר מבחינה אלגברית” מעל שדה הבסיס. אני מבצע את נפנוף הידיים הזה כדי לומר למה זה ניחוש טוב שהפולינום המינימלי הזה יהיה הפולינום ששורשיו הם בדיוק שורשי היחידה הפרימיטיביים מסדר \( n \). מה זה אומר?

\( z \) הוא שורש יחידה פרימיטיבי מסדר \( n \) אם \( z^{n}=1 \) והחזקות של \( z \) הן כל שורשי היחידה מסדר \( n \). בניסוח אחר: \( z \) הוא יוצר של חבורת שורשי היחידה מסדר \( n \). אנחנו כבר מכירים איבר אחד כזה - \( \omega_{n} \). האם יש אחרים? ובכן, כן: אם \( \text{gcd}\left(n,k\right)=1 \) אז \( \omega_{n}^{k} \) הוא גם כן שורש פרימיטיבי. למה? תורת חבורות בסיסית: נניח ש-\( \left(\omega_{n}^{k}\right)^{i}=1 \), כלומר \( \left(\omega_{n}\right)^{ki}=1 \), כלומר הסדר של \( \omega_{n} \) מחלק את \( ki \). הסדר הזה הוא \( n \), כלומר \( n|ki \). מכיוון ש-\( n,k \) זרים, זה גורר ש-\( n|i \). כלומר, החזקה החיובית הקטנה ביותר של \( \omega_{n}^{k} \) שהיא 1 היא בעצמה \( n \), ולכן \( \omega_{n}^{k} \) הוא גם כן מסדר \( n \).

כמה שורשי יחידה פרימיטיביים מסדר \( n \) קיימים? כמספר ה-\( k \)-ים שקטנים מ-\( n \) וזרים לו; המספר הזה מסומן ב- \( \varphi\left(n\right) \) והפונקציה \( \varphi \) נקראת פונקצית אוילר. כעת הבה ונגדיר פולינום ששורשיו הם בדיוק אותם \( \varphi\left(n\right) \) שורשי יחידה פרימיטיביים:

\( \Phi_{n}\left(x\right)=\prod_{\left(k,n\right)=1}\left(x-\omega_{n}^{k}\right) \)

זה הולך להיות הפולינום המינימלי של \( \omega_{n} \), אבל עוד נצטרך לעבוד קצת כדי להראות את זה. לפולינום \( \Phi_{n} \) הזה קוראים הפולינום הציקלוטומי מסדר \( n \).

בואו נפתח עם תעלול שיאפשר לנו לחשב את \( \Phi_{n} \) בקלות יחסית ולראות שזה פולינום עם מקדמים ב-\( \mathbb{Q} \). אנחנו יודעים ש-\( x^{n}-1 \) הוא הפולינום ששורשיו הם כל שורשי היחידה מסדר \( n \), כלומר כל החזקות של \( \omega_{n} \):

\( x^{n}-1=\prod_{k=1}^{n}\left(x-\omega_{n}^{k}\right) \)

מה נעשה עם \( \omega_{n}^{k} \)-ים שעבורם \( k \) לא זר ל-\( n \)? ובכן, אם \( d=\text{gcd}\left(n,k\right) \) זה אומר ש-\( \frac{n}{d} \) ו-\( \frac{k}{d} \) שניהם כן זרים. עכשיו, למה שווה \( \omega_{n}^{k} \)? על פי הגדרה, \( \omega_{n}^{k}=e^{2\pi i\left(\frac{k}{n}\right)}=e^{2\pi i\left(\frac{k/d}{n/d}\right)}=\omega_{n/d}^{k/d} \). המסקנה היא ש-\( \omega_{n}^{k} \) הוא כן שורש יחידה פרימיטיבי, אבל לא מסדר \( n \) אלא מסדר \( n/d \) - כל שורש יחידה הוא פרימיטיבי אם אנחנו “הולכים מספיק אחורה”.

מכאן שאפשר לכתוב את המכפלה \( \prod_{k=1}^{n}\left(x-\omega_{n}^{k}\right) \) גם בצורה שונה: לכל \( d \) שמחלק את \( n \), נכתוב את מכפלת כל שורשי היחידה הפרימיטיביים מסדר \( n/d \). אבל המכפלה הזו היא בדיוק \( \Phi_{n/d} \). אני רק אבצע פה שינוי קוסמטי קטן - מעצבן לכתוב \( n/d \) כל הזמן, והתוצאה היא גם כן מספר שמחלק את \( n \), אז במקום לומר “מכפלת כל ה-\( \Phi_{n/d} \) כש-\( d \) מחלק את \( n \)” אפשר באותה מידה לומר “מכפלת כל ה-\( \Phi_{d} \) כש-\( d \) מחלק את \( n \)”. קיבלנו את השוויון:

\( x^{n}-1=\prod_{d|n}\Phi_{d}\left(x\right) \)

זה שוויון מקסים, בין היתר כי אם נשווה את המעלה של הפולינום באגף שמאל והפולינומים באגף ימין נקבל את השוויון \( n=\sum_{d|n}\varphi\left(d\right) \) שהוא לא מובן מאליו. עבורנו, השוויון \( x^{n}-1=\prod_{d|n}\Phi_{d}\left(x\right) \) יהיה מועיל כדי להוכיח ש-\( \Phi_{n}\left(x\right) \) הוא פולינום מתוקן אי-פריק עם מקדמים שלמים. הנה הוכחה, בנפנופי ידיים כלשהם אחרת הפוסט הזה יהיה ארוך מדי:

אנחנו מוכיחים את הטענה באינדוקציה שלמה על \( n \). עבור \( n=1 \) מתקיים פשוט \( \Phi_{n}\left(x\right)=x-1 \) והטענה ברורה. עבור \( n \) גדול יותר, אנחנו יודעים שאפשר לכתוב

\( x^{n}-1=\Phi_{n}\left(x\right)\cdot\Psi\left(x\right) \)

כאשר \( \Psi\left(x\right)=\prod\Phi_{d}\left(x\right) \) הוא מכפלת הפולינומים הציקלוטומיים עבור \( d \)-ים קטנים מ-\( n \) שמחלקים את \( n \). מהנחת האינדוקציה, כל הפולינומים הללו הם מתוקנים ועם מקדמים ב-\( \mathbb{Z} \) ולכן כך גם \( \Psi\left(x\right) \). אפשר להוכיח (נפנוף ידיים ראשון!) שמכיוון ש-\( x^{n}-1 \) ו-\( \Psi\left(x\right) \) שניהם ב-\( \mathbb{Z}\left[x\right] \), גם המנה שלהם חייבת להיות (נפנוף הידיים הזה מערב משהו שנקרא הלמה של גאוס ואני מקווה להציג בעתיד).

זה ש-\( \Phi_{n}\left(x\right) \) מתוקן, זה ברור - אחרת לא היה אפשרי שהמכפלה שלו בפולינום המתוקן \( \Psi\left(x\right) \) תיתן את הפולינום המתוקן \( x^{n}-1 \). מה שנותר להראות הוא ש-\( \Phi_{n}\left(x\right) \) הוא אי-פריק. הטיעון יהיה מורכב למדי, אז תרגישו חופשיים לקפוץ מעליו אם בלי זה לא תגיעו אל יתר הפוסט.

הרעיון הוא לכתוב \( \Phi_{n}\left(x\right)=f\left(x\right)g\left(x\right) \) עבור \( f,g\in\mathbb{Z}\left[x\right] \) כך ש-\( f\left(x\right) \) אי פריק לא קבוע, ולהסיק מזה ש-\( \Phi_{n}\left(x\right)=f\left(x\right) \) על ידי כך שנראה שכל שורש יחידה פרימיטיבי מסדר \( n \) הוא שורש של \( f\left(x\right) \). לצורך כך, בואו ניקח שורש כלשהו של \( f\left(x\right) \) ונקרא לו \( \omega \). מכיוון ש-\( f\left(x\right) \) מחלק את \( \Phi_{n}\left(x\right) \), הרי שכל השורשים של \( f\left(x\right) \) הם שורשי יחידה פרימיטיביים מסדר \( n \), ובפרט \( \omega \) הוא כזה.

אני ארצה להוכיח שלכל ראשוני \( p \) שזר ל-\( n \), \( \omega^{p} \) הוא שורש של \( f\left(x\right) \). למה דווקא עבור ראשוני? כי ראשוניים הם “אבני הבניין” של כל המספרים, ונראה בהמשך איך התוצאה הזו תיתן לנו ש-\( \omega^{a} \) הוא שורש של \( f\left(x\right) \) לכל \( a \) שזר ל-\( n \) (שזה היעד שלי).

ובכן, \( \omega^{p} \) הוא גם כן שורש יחידה פרימיטיבי מסדר \( n \), שהרי \( p \) זר ל-\( n \); מכאן ש-\( \omega^{p} \) הוא שורש של \( \Phi_{n}\left(x\right) \) ולכן הוא שורש של \( f\left(x\right) \) או של \( g\left(x\right) \). אם הוא שורש של \( f\left(x\right) \), סיימנו; אז נניח ש-\( g\left(\omega^{p}\right)=0 \). זה אומר ש-\( \omega \) הוא שורש של הפולינום שמתקבל מ-\( g \) כשמחליפים את \( x \) ב-\( x^{p} \) בכל מקום: הפולינום הזה מסומן ב-\( g\left(x^{p}\right) \). מכיוון ש-\( f\left(x\right) \) הוא פולינום מתוקן שמאפס את \( \omega \), הרי שהוא הפולינום המינימלי עבור \( \omega \); מכיוון ש-\( \omega \) הוא שורש של \( g\left(x^{p}\right) \) נובע מכך ש-\( g\left(x^{p}\right)=f\left(x\right)h\left(x\right) \) עבור \( h \) כלשהו.

וכעת מגיע תעלול.

התעלול הזה די נפוץ באלגברה ובתורת המספרים - במקום להמשיך לעבוד מעל \( \mathbb{Z} \), אנחנו עוברים לעבוד מודולו \( p \). הצמצום הזה של העולם עוזר לנו להתפקס על כל מני דברים. אז בואו נעשה את השינוי המחשבתי - מעכשיו ועד להודעה חדשה, כל החשבונות שלנו יהיו מעל השדה \( \mathbb{Z}_{p} \). אני לא יודע אם אתם זוכרים, אבל באחד מהפוסטים הקודמים אני דיברתי על משהו שנקרא אוטומורפיזם פרובניוס שעובד מעל שדות סופיים ואומר שאם השדה הסופי שלנו הוא ממציין \( p \) אז מתקיים \( \left(ab\right)^{p}=a^{p}b^{p} \) ו-\( \left(a+b\right)^{p}=a^{p}+b^{p} \). הדבר הזה מספיק כדי שנקבל את השוויון \( g\left(x^{p}\right)=\left(g\left(x\right)\right)^{p} \), כל זה כשאנחנו מעל \( \mathbb{Z}_{p} \). המסקנה היא ש-\( \left(g\left(x\right)\right)^{p}=f\left(x\right)h\left(x\right) \), וזה אומר שאם ניקח גורם אי-פריק של \( f\left(x\right) \) (גורם אי-פריק מעל \( \mathbb{Z}_{p}\left[x\right] \); הרי מעל \( \mathbb{Z}\left[x\right] \) אנחנו יודעים ש-\( f\left(x\right) \) עצמו אי-פריק) הוא יחלק את המכפלה \( \left(g\left(x\right)\right)^{p} \). פולינום אי-פריק שמחלק מכפלה מחלק את אחד מהמוכפלים, ולכן הוא מחלק את \( g\left(x\right) \). מסקנה: יש ל-\( f\left(x\right),g\left(x\right) \) גורם משותף מעל \( \mathbb{Z}_{p} \).

כעת, מכיוון ש-\( \Phi_{n}\left(x\right)=f\left(x\right)g\left(x\right) \) הרי שמעל \( \mathbb{Z}_{p} \) יהיה איבר (שחי בהרחבה כלשהי של \( \mathbb{Z}_{p} \)) שהוא שורש של הגורם המשותף של \( f\left(x\right),g\left(x\right) \) ולכן מופיע בשניהם ולכן הוא שורש מרובה של \( \Phi_{n}\left(x\right) \), מה שגורר שגם ל-\( x^{n}-1 \) יהיה את אותו שורש מרובה מעל \( \mathbb{Z}_{p} \). כעת, בפוסט שקישרתי אליו קודם הצענו שיטה פשוטה לבדוק אם כל השורשים של פולינום שונים זה מזה, כלומר הוא ספרבילי: השיטה אמרה לגזור אותו פורמלית ולבדוק אם התוצאה זרה לפולינום המקורי. במקרה שלנו הפולינום הוא \( x^{n}-1 \) והנגזרת הפורמלית היא \( nx^{n-1} \). מכיוון ש-\( p \) זר ל-\( n \) הנגזרת לא מתאפסת, ולכן היא זרה ל-\( x^{n}-1 \) וקיבלנו שהפולינום ספרבילי - סתירה לכך שאמור להיות לו שורש מרובה. מה בכלל הייתה הנחת השלילה שלנו? אה! ש-\( g\left(\omega^{p}\right)=0 \). מכיוון שזה לא יכול לקרות, הרי ש-\( f\left(\omega^{p}\right)=0 \) כפי שרצינו.

אם לסכם את מה שהוכחנו: הראיתי שאם \( \omega \) הוא שורש כלשהו של \( f \) וכמו כן \( p \) זר ל-\( n \), אז גם \( \omega^{p} \) שורש של \( f \). עכשיו, קחו מספר \( a \) כלשהו שזר ל-\( n \) ופרקו אותו לגורמים ראשוניים: \( a=p_{1}p_{2}\cdots p_{k} \). כל הגורמים הללו זרים ל-\( n \) אחרת \( a \) לא היה זר ל-\( n \), ולכן אפשר להפעיל את התוצאה הקודמת שוב ושוב: נתחיל עם \( \omega \). הוא שורש של \( f\left(x\right) \) ולכן גם \( \omega^{p_{1}} \); ולכן גם \( \left(\omega^{p_{1}}\right)^{p_{2}}=\omega^{p_{1}p_{2}} \), ולכן גם… הבנתם את הרעיון. בסוף מגיעים אל \( \omega^{p_{1}p_{2}\cdots p_{k}}=\omega^{a} \) שגם הוא שורש של \( f\left(x\right) \) וזה מסיים את ההוכחה, כי כל שורש יחידה פרימיטיבי מסדר \( n \) הוא מהצורה \( \omega^{a} \) עבור \( a \) שזר ל-\( n \).

אוקיי, זו הייתה הרבה מהומה, ובשביל מה? ובכן, עכשיו אנחנו יודעים ש-\( \Phi_{n}\left(x\right) \) הוא הפולינום המינימלי של שורשי היחידה הפרימיטיביים מסדר \( n \). בפרט, \( \mathbb{Q}\left(\omega_{n}\right) \) הוא שדה הפיצול של הפולינום הזה, ו-\( \left[\mathbb{Q}\left(\omega_{n}\right):\mathbb{Q}\right]=\varphi\left(n\right) \). זו התחלה.

פתרון בעיית המצולע המשוכלל

בואו נשלב את מה שלמדנו בשני החלקים הקודמים של הפוסט: ראשית, תנאי הכרחי לכך שאפשר יהיה לבנות מצולע משוכלל עם \( n \) צלעות הוא שיתקיים \( \left[\mathbb{Q}\left(\omega_{n}\right):\mathbb{Q}\right]=2^{k} \). שנית, \( \left[\mathbb{Q}\left(\omega_{n}\right):\mathbb{Q}\right]=\varphi\left(n\right) \). אז מה אנחנו יכולים להגיד על \( n \) מתוך השוויון \( \varphi\left(n\right)=2^{k} \)?

ובכן, צריך קודם כל להבין איך \( \varphi\left(n\right) \) נראית. למרבה המזל, יש לנו נוסחה פשוטה ל-\( \varphi\left(n\right) \) שמתבססת על הפירוק לגורמים של \( n \). אני לא אוכיח אותה כאן, כי ההוכחה היא פשוט יישום ישיר של משפט השאריות הסיני שכבר יש לי עליו פוסט. הנוסחה שמקבלים היא זו: אם \( n=p_{1}^{t_{1}}\cdots p_{r}^{t_{r}} \) אז \( \varphi\left(n\right)=\prod_{i=1}^{r}p_{i}^{t_{i}-1}\left(p_{i}-1\right) \)

עכשיו, אם אנחנו רוצים שהמכפלה הזו תהיה חזקה של 2, כל האיברים המוכפלים חייבים להיות 2. זה אומר שאם \( p^{t} \) הוא אחד מהגורמים של \( n \), אז אם \( p=2 \) הכל סבבה, ואילו אם \( p\ne2 \) אז \( p^{t-1} \) לא יהיה חזקה של 2 אלא אם \( t=1 \) ואז פשוט נקבל \( p^{t-1}=1 \). לכן בהכרח \( t=1 \); כלומר, \( n \) הוא מכפלה של חזקה כלשהי של 2 בראשוניים אי-זוגיים שכל אחד מהם מופיע לכל היותר פעם אחת.

אבל זה לא נגמר כאן. לכל \( p \) אי זוגי שכזה, אנחנו צריכים ש-\( p-1 \) יהיה חזקה של 2. כלומר, \( p=2^{t}+1 \) עבור \( t \) כלשהו. גם כאן הסיפור לא נגמר, כי אפשר להגיד עוד משהו על \( t \), בהתבסס על כך ש-\( p \) ראשוני, ואפילו מסתתר כאן סיפור טוב שכבר סיפרתי פעם בבלוג:

מעשה בפייר דה-פרמה, ההוא מהמשפט האחרון של פרמה. פרמה רצה לייצר ראשוניים גדולים. מה הדרך שלנו לייצר מספרים גדולים? לקחת חזקות של מספרים קטנים! מה המספר הקטן ביותר שיש טעם לקחת חזקות שלו? 2! האם חזקות של 2 הן ראשוניות? לא! איך נהפוך אותן לראשוניות? ובכן, נוסיף 1; זו התחלה טובה, כי זה הופך את המספר לאי-זוגי. אבל האם זה מספיק? אילו ערכים של \( t \) במובהק לא יאפשרו לנו לקבל ראשוני בצורה הזו?

ובכן, פרמה לא היה עצלן והוא אהב לעשות חשבונות, והוא שם לב לנוסחה הנחמדה הבאה, שעובדת רק עבור \( n \) אי-זוגי:

\( a^{n}+1=\left(a-1\right)\left(a^{n-1}-a^{n-2}+a^{n-3}-\dots-1\right) \)

הנוסחה הזו היא טור טלסקופי: אם פותחים את הסוגריים מקבלים שני סכומים של איברים - אחד מהמכפלות של \( a \) בכל מה שבסוגריים והשני מהמכפלות של \( -1 \) בכל מה שבסוגריים. כשמחברים את שני הסכומים הללו רוב האיברים מבטלים זה את זה, ונשארים רק עם האיבר הראשון והאחרון, שנותנים ביחד \( a^{n}+1 \). הכרחי ש-\( n \) יהיה אי-זוגי אחרת האיבר האחרון בסוגריים יהיה 1 ולא \( -1 \), מה שיקלקל את הכל.

עכשיו, נסתכל חזרה על \( 2^{t}+1 \). אם יש ל-\( t \) ולו מחלק אחד ויחיד \( x<t \) שהוא אי-זוגי, זה ימנע מ-\( 2^{t}+1 \) להיות ראשוני, כי נכתוב \( n=xy \) וכעת נבחר \( a=2^{y} \) ו-\( n=x \) ונקבל ש-\( 2^{y}-1 \) הוא גורם לא טריוויאלי של \( 2^{t}+1 \). לכן הכרחי ש-\( t \) יהיה מורכב כולו ממחלקים זוגיים - שהוא יהיה בעצמו חזקה של 2. המסקנה של פרמה הייתה ששווה להסתכל על מספרים מהצורה \( 2^{2^{t}}+1 \) והם נקראים על שמו - מספרי פרמה. הצבת ערכים בנוסחה הזו נותנת לנו את הסדרה \( 3,5,17,257,65537,\dots \) ופרמה בדק ידנית את האיברים הללו, ראה שכולם ראשוניים, התלהב ו… טען את הטענה השגויה המפורסמת בתולדותיו. הוא חשב שהאיברים בהמשך הסדרה יהיו גם כן ראשוניים אבל לא בדק בעצמו כי המספרים הבאים בסדרה היו גדולים למדי וכנראה לא היה לו כוח אליהם. התוצאה? עד היום לא התגלה שום ראשוני נוסף שהוא מספר פרמה. כל המספרים שנבדקו, התגלו כפריקים.

מה שראינו, אם כן, הוא שכדי שמצולע משוכלל עם \( n \) צלעות יהיה ניתן לבניה, אז \( n \) צריך להיות מכפלה של חזקה של 2 בראשוניי פרמה (“החלק האי-זוגי של \( n \) הוא מכפלה של ראשוניי פרמה). זה אומר, בפרט, שכיום אנחנו יודעים רק עבור מספר סופי של מצולעים משוכללים עם מספר צלעות אי-זוגי שניתן לבנות אותם בסרגל ומחוגה; גילוי מצולע נוסף כזה ילמד אותנו על קיום ראשוני פרמה חדש, וזו תהיה סנסציה מתמטית בזעיר אנפין.

אבל הסיפור לא נגמר פה; טיפלנו רק בחצי מהסיפור. מצאנו תנאי הכרחי לכך שהמצולע יהיה ניתן לבניה בסרגל ומחוגה; האם זה גם תנאי מספיק? בשביל זה נזדקק לתורת גלואה. הרי כדי להראות שמשהו כן ניתן לבניה אנחנו צריכים להראות שקיימת סדרה של הרחבות פשוטות ממעלה 2 שמובילות אליו. בעזרת תורת גלואה אפשר לתרגם את זה למשהו פשוט יותר - להראות שבחבורת הגלואה שלו קיימת סדרה של תתי-חבורות שכל אחת מאינדקס 2 בקודמת, ואת זה יהיה פשוט יותר לעשות.

אחזור לפרטים הטכניים של זה בקרוב, אבל לפני כן, הנה שאלה פשוטה - מהי חבורת גלואה של \( \mathbb{Q}\left(\omega_{n}\right)/\mathbb{Q} \)? מכיוון ש-\( \mathbb{Q}\left(\omega_{n}\right) \) הוא שדה הפיצול של הפולינום הספרבילי \( \Phi_{n}\left(x\right) \) אנחנו יודעים שזו הרחבת גלואה, ולכן ב-\( \text{Gal}\left(\mathbb{Q}\left(\omega_{n}\right)/\mathbb{Q}\right) \) יש בדיוק \( \left[\mathbb{Q}\left(\omega_{n}\right):\mathbb{Q}\right]=\varphi\left(n\right) \) אוטומורפיזמים, אבל מי הם? אנחנו יודעים שכל אוטומורפיזם חייב להעביר את \( \omega_{n} \) לאחד מהשורשים האחרים של הפולינום המינימלי שלו, \( \Phi_{n}\left(x\right) \), ומכיוון ש-\( \mathbb{Q}\left(\omega_{n}\right)/\mathbb{Q} \) נוצרת בידי \( \omega_{n} \) הזה לבדו, הקביעה לאן \( \omega_{n} \) יעבור קובעת חד משמעית את האוטומורפיזם. יש ל-\( \omega_{n} \) בדיוק \( \varphi\left(n\right) \) שורשי יחידה פרימיטיביים מסדר \( n \) לעבור אליהם, ולכן כל העברה כזו נותנת לנו אוטומורפיזם. בואו נסמן ב-\( \sigma_{a} \) את האוטומורפיזם שמבצע \( \sigma_{a}\left(\omega_{n}\right)=\omega_{n}^{a} \); יש לנו כזה לכל \( a \) שקטן מ-\( n \) וזר לו. כלומר, לכל \( a\in\mathbb{Z}_{n}^{*} \). זה כבר מתחיל לרמוז לנו מה בדיוק חבורת הגלואה פה. נשאר רק לבדוק את הפעולה: \( \sigma_{a}\sigma_{b}\left(\omega_{n}\right)=\sigma_{a}\left(\omega_{n}^{b}\right)=\omega_{n}^{ab} \) ולכן \( \sigma_{a}\sigma_{b}=\sigma_{ab} \), כאשר הכפל \( ab \) נלקח מודולו \( n \); זהו בדיוק הכפל של \( \mathbb{Z}_{n}^{*} \). בקיצור, \( \text{Gal}\left(\mathbb{Q}\left(\omega_{n}\right)/\mathbb{Q}\right)\cong\mathbb{Z}_{n}^{*} \).

זו בפני עצמה היא תוצאה יפה - הנה מצאנו “מימוש” לאחת החבורות החשובות שאנחנו מכירים בתור חבורת גלואה. רק שזה רק קצה הקרחון - לסיום הפוסט אני אראה איך התוצאה הזו מאפשרת לנו למצוא “מימוש” עבור כל חבורה אבלית. עם זאת, לפני שנגיע לדברים גרנדיוזיים כל כך, בואו נסיים את בעית המצולע המשוכלל שלנו.

מה שמעניין אותי כרגע הוא ש-\( \text{Gal}\left(\mathbb{Q}\left(\omega_{n}\right)/\mathbb{Q}\right) \) היא חבורה אבלית. כדי לראות איך זה יהיה רלוונטי, בואו ניזכר במשפט היסודי של תורת גלואה: אם \( E/F \) היא הרחבת גלואה ו-\( K \) הוא שדה ביניים, כלומר \( F\subseteq K\subseteq E \), אז \( E/K \) היא אוטומטית הרחבת גלואה. אם בנוסף לכך \( H=\text{Gal}\left(E/K\right) \) היא תת-חבורה נורמלית של \( G=\text{Gal}\left(E/F\right) \), אז גם \( K/F \) היא הרחבת גלואה, ו-\( \text{Gal}\left(K/F\right)\cong G/H \).

במקרה שלנו \( F=\mathbb{Q} \) ו-\( E=\mathbb{Q}\left(\omega_{n}\right) \) ואילו שדה הביניים שמעניין אותנו הוא \( K=\mathbb{Q}\left(x\right) \). מכיוון ש-\( G=\text{Gal}\left(\mathbb{Q}\left(\omega_{n}\right)/\mathbb{Q}\right) \) היא חבורה אבלית אז כל תת-חבורה שלה נורמלית, ובפרט \( H=\text{Gal}\left(\mathbb{Q}\left(\omega_{n}\right)/\mathbb{Q}\left(x\right)\right) \). המסקנה היא ש-\( \mathbb{Q}\left(x\right)/\mathbb{Q} \) היא הרחבת גלואה. עכשיו, אנחנו יודעים שהסדר של \( G \) הוא חזקה של 2. זה אומר שגם הסדר של כל תת-חבורה של \( G \) הוא חזקה של 2 (זה משפט לגראנז’), ולכן גם הסדר של כל חבורת מנה \( G/H \) הוא חזקה של 2. בקיצור, אנחנו יודעים ש-\( \mathbb{Q}\left(x\right)/\mathbb{Q} \) היא הרחבת גלואה עם חבורת גלואה אבלית מסדר שהוא חזקה של 2. בואו נשכח לגמרי מ-\( \mathbb{Q}\left(\omega_{n}\right) \) ונסמן מעכשיו \( G=\text{Gal}\left(\mathbb{Q}\left(x\right)/\mathbb{Q}\right) \), ואת הסדר של החבורה הזו נסמן ב-\( 2^{k} \) (כלומר, \( \left[\mathbb{Q}\left(x\right):\mathbb{Q}\right]=2^{k} \)).

המטרה שלי כעת היא למצוא שרשרת של שדות, \( F_{0}\subseteq F_{1}\subseteq F_{2}\subseteq\dots\subseteq F_{k} \) כך ש:

  1. \( F_{0}=\mathbb{Q} \)
  2. \( F_{k}=\mathbb{Q}\left(x\right) \)
  3. \( \left[F_{i+1}:F_{i}\right]=2 \) לכל \( 0\le i<k \).

שרשרת כזו תוכיח ש-\( x \) ניתן לבניה.

הדרך שלי להשתמש בתורת גלואה כדי לבנות את השרשרת הזו הולכת ככה: אני אראה שקיימת שרשרת \( G_{k}\subseteq G_{k-1}\subseteq G_{k-2}\subseteq\dots\subseteq G_{0} \) של חבורות כך ש:

  1. \( G_{k}=\left\{ e\right\} \)
  2. \( G_{0}=G \), כאשר \( G=\text{Gal}\left(\mathbb{Q}\left(x\right)/\mathbb{Q}\right) \).
  3. \( \left|G_{i}:G_{i+1}\right|=2 \) לכל \( 0\le i<k \) (האינדקס של \( G_{i+1} \) ב-\( G_{i} \) הוא 2).

שימו לב להיפוך שיש כאן: שרשרת השדות הולכת וגדלה ככל שהאינדקס של השדה גדל; שרשרת החבורות הולכת וקטנה ככל שהאינדקס של תת-החבורה קטן. ראינו את הדואליות ההפוכה הזו גם בפוסט הקודם, כשדיברנו על המשפט היסודי של תורת גלואה.

מרגע שיש לי את שרשרת החבורות הזו, אני יכול להגדיר את \( F_{i} \) בתור תת-השדה של \( \mathbb{Q}\left(x\right) \) שמקובע על ידי אברי \( G_{i} \). במילים אחרות, \( G_{i}=\text{Gal}\left(\mathbb{Q}\left(x\right)/F_{i}\right) \). מן הסתם \( F_{0}=\mathbb{Q} \) כי \( G_{0} \) נבחרה מראש להיות \( \text{Gal}\left(\mathbb{Q}\left(x\right)/\mathbb{Q}\right) \), ואנחנו יודעים שחבורת גלואה של הרחבה מקבעת בדיוק את שדה הבסיס (זה בדיוק מה שמייחד חבורת גלואה מ”סתם” חבורת אוטומורפיזמים - שהיא מקבעת בדיוק את שדה הבסיס ולא משהו גדול יותר). באופן דומה, \( F_{k}=\mathbb{Q}\left(x\right) \) כי תת-השדה של \( \mathbb{Q}\left(x\right) \) שמקובע על ידי \( \left\{ e\right\} \) יהיה כל \( \mathbb{Q}\left(x\right) \), שהרי \( e \) מקבעת כל איבר בו.

אז נשאר רק עניין ה-\( \left[F_{i+1}:F_{i}\right]=2 \). כדי לראות את זה, בואו ניזכר שוב באופן כללי מה המשפט היסודי של תורת גלואה אומר לנו. אם \( F\subseteq K\subseteq E \) הוא מגדל של הרחבות, ו-\( G=\text{Gal}\left(E/F\right) \) ו-\( H=\text{Gal}\left(E/K\right) \) ו-\( H \) נורמלית, אז \( \left[K:F\right]=\left|G:H\right| \). זה מתווה את מה שנעשה אצלנו: אנחנו רוצים לדעת מה יהיה \( \left[F_{i+1}:F_{i}\right] \) אז נבחר:

\( E=\mathbb{Q}\left(x\right) \)

\( K=F_{i+1} \)

\( F=F_{i} \)

כעת, \( G=\text{Gal}\left(E/F\right)=\text{Gal}\left(\mathbb{Q}\left(x\right)/F_{i}\right)=G_{i} \) ו-\( H=\text{Gal}\left(E/K\right)=\text{Gal}\left(\mathbb{Q}\left(x\right)/F_{i+i}\right)=G_{i+1} \). לכן נקבל:

\( \left[F_{i+1}:F_{i}\right]=\left|G_{i}:G_{i+1}\right| \)

כפי שרצינו. זה מסיים את ה”רדוקציה” - המרנו את הבעיה של הוכחת קיום שדות הביניים בבעיה של הוכחת קיום “חבורות הביניים”, אבל זה יהיה קל אם אני אגייס לצדי את הכלי האולטימטיבי לטיפול בחבורות אבליות סופיות - משפט המיון שלהן, שהזכרתי כבר בבלוג. אני אפילו לא צריך את כל המשפט - רק את הטענה שאם \( G \) אבלית סופית, אז היא מכפלה של חבורות ציקליות, כלומר \( G\cong\mathbb{Z}_{n_{1}}\times\dots\times\mathbb{Z}_{n_{t}} \). מכיוון שהסדר של \( G \) הוא מכפלת הסדרים של החבורות הציקליות הללו, ואנחנו יודעים ש-\( G \) היא מסדר שהוא חזקה של 2, גם כל הסדרים של החבורות הציקליות הללו הוא חזקה של 2. למשל, אם \( G \) הייתה מסדר 8, אז היינו יודעים שהיא אחת מבין החבורות הבאות: \( \mathbb{Z}_{8},\mathbb{Z}_{4}\times\mathbb{Z}_{2} \) או \( \mathbb{Z}_{2}\times\mathbb{Z}_{2}\times\mathbb{Z}_{2} \). כדי לקבל תחושה של מה שהולך פה, בואו נראה איך בכל אחת מהחבורות הללו אפשר למצוא תת-חבורה מאינדקס 2.

ובכן, ב-\( \mathbb{Z}_{2}\times\mathbb{Z}_{2}\times\mathbb{Z}_{2} \) בואו נסתכל על \( \mathbb{Z}_{2}\times\mathbb{Z}_{2}\times\left\{ 0\right\} =\left\{ \left(a,b,0\right)\ |\ a,b\in\mathbb{Z}_{2}\right\} \). קל לבדוק שזו תת-חבורה; למה האינדקס 2? ובכן, הנה הדרך שלי לחשוב על זה, לאו דווקא הדרך הטובה ביותר: אם יש לי חבורה שהיא מכפלה ישרה, \( G_{1}\times G_{2}\times\dots\times G_{n} \), ואם יש לי תת-חבורה שלה \( H_{1}\times H_{2}\times\dots\times H_{n} \) כך שכל \( H_{i} \) תת-חבורה של \( G_{i} \) (לא כל תת-החבורות של המכפלה נראות כך), אז המנה \( G_{1}\times G_{2}\times\dots\times G_{n}/H_{1}\times H_{2}\times\dots\times H_{n} \) איזומורפית, באופן לא מפתיע, למכפלת המנות: \( G_{1}/H_{1}\times\dots\times G_{n}/H_{n} \). לכן במקרה הנוכחי \( \mathbb{Z}_{2}\times\mathbb{Z}_{2}\times\mathbb{Z}_{2}/\mathbb{Z}_{2}\times\mathbb{Z}_{2}\times\left\{ e\right\} \cong\left\{ e\right\} \times\left\{ e\right\} \times\mathbb{Z}_{2} \) והמנה הזו היא חבורה מסדר 2.

באופן דומה אני יכול לטפל ב-\( \mathbb{Z}_{4}\times\mathbb{Z}_{2} \) - לחלק ב-\( \mathbb{Z}_{4}\times\left\{ e\right\} \), למשל. אבל מה קורה ב-\( \mathbb{Z}_{8} \)? האינטואיציה היא לומר שאני מחלק ב-\( \mathbb{Z}_{4} \), וזה בתכל’ס מה שאני אעשה, אבל צריך להיזהר קצת - \( \mathbb{Z}_{4} \) איננה תת-חבורה של \( \mathbb{Z}_{8} \); אבל יש ל-\( \mathbb{Z}_{8} \) תת-חבורה שאיזומורפית ל-\( \mathbb{Z}_{4} \): תת-החבורה \( \left\{ 0,2,4,6\right\} \). זה לא עניין מקרי; בחבורה ציקלית \( \mathbb{Z}_{n} \) יש תת-חבורה מכל סדר שמחלק את \( n \) - זה משהו שטרחתי להראות בבלוג בעבר. לכן אם יש לי חבורה \( \mathbb{Z}_{2n} \) אני תמיד אוכל למצוא בה תת-חבורה שאיזומורפית ל-\( \mathbb{Z}_{n} \), ולכן לקבל מנה \( \mathbb{Z}_{2} \).

זה מסביר גם מה עושים במקרה הכללי: הרי \( G \) היא מכפלה של חבורות ציקליות שכולן מסדר שהוא חזקה של 2. פשוט בוחרים אחת מהן, לוקחים את תת-החבורה מאינדקס 2 בתוכה, ומכפילים אותה עם יתר החבורות הציקליות. התוצאה תהיה תת-חבורה מאינדקס 2 ב-\( G \). עכשיו, גם תת-החבורה הזו היא מסדר שהוא חזקה של 2, אז אפשר למצוא גם בה תת-חבורה מאינדקס 2, וכן הלאה וכן הלאה. השרשרת הזו כמובן שחייבת להסתיים כי בכל צעד כזה אנחנו מקטינים פי 2 את הסדר של תת-החבורה שאנחנו עובדים איתה. זה מסיים את העניין הזה ופותר סופית את סיפור המצולע המשוכלל…

…מודולו העובדה שעדיין לא הראיתי איך בתכל’ס, עם הידיים, בונים את המצולעים הללו. אבל זה לא יקרה פה היום.

בעיית ההיפוך של תורת גלואה לחבורות אבליות

מה שאנחנו עושים בדרך כלל בתורת גלואה הוא לגשת להרחבת שדות קונקרטית, לחשב את חבורת גלואה שלה ואז להתחיל להסיק מסקנות מגניבות מזה. אבל אפשר גם לחשוב על “היפוך” של הגישה הזו - מתחילים עם חבורה סופית \( G \) כלשהי ומחפשים הרחבת גלואה ש-\( G \) היא חבורת הגלואה שלה. ספציפית, אנחנו מדברים על הרחבה של \( \mathbb{Q} \). אם לנסח במדויק: בהינתן חבורה \( G \), האתגר הוא למצוא הרחבת שדות \( K/\mathbb{Q} \) כך ש-\( \text{Gal}\left(K/\mathbb{Q}\right)=G \). השאלה היא אם זה תמיד אפשרי, או שיש חבורות סופיות שאי אפשר לייצג בתור חבורות גלואה של הרחבה כלשהי.

הבעיה הזו הייתה ונותרה פתוחה מאז שתורת גלואה הומצאה, אבל אני רוצה לשכנע אתכם פה, בנפנוף ידיים כלשהו, שאם \( G \) אבלית אז היא בהחלט חבורת גלואה של הרחבה כלשהי. ואפילו לא סתם הרחבה: הרחבה שהיא תת-שדה של שדה ציקלוטומי. כלומר, הטענה שאפשר להוכיח היא זו: אם \( G \) אבלית אז קיים שורש יחידה פרימיטיבי \( \omega_{n} \) ותת-שדה \( \mathbb{Q}\subseteq K\subseteq\mathbb{Q}\left(\omega_{n}\right) \) כך ש-\( \text{Gal}\left(K/\mathbb{Q}\right)\cong G \).

ההוכחה לא מסובכת עד כדי כך והיא אפילו אלגנטית מאוד לטעמי; היא פשוט נסמכת על כמה כלים כבדים סטנדרטיים שלא אוכיח כאן, והצגתי ברמה זו או אחרת בעבר.

אם כן, תהא \( G \) חבורה אבלית. על פי משפט המיון שכבר הזכרתי פה (ובעבר בבלוג, ולא הוכחתי עדיין) אני יכול לכתוב \( G\cong\mathbb{Z}_{n_{1}}\times\mathbb{Z}_{n_{2}}\times\dots\times\mathbb{Z}_{n_{k}} \). בהינתן המידע הזה על \( G \), אני רוצה לנסות למצוא \( \omega_{n} \) כך ש-\( \mathbb{Q}\left(\omega_{n}\right) \) תכיל את שדה ההרחבה שנותן את \( G \). ה-\( n \) הזה הולך להיות מכפלה של ראשוניים שונים זה מזה, כלומר \( n=p_{1}p_{2}\dots p_{k} \) כשכל ה-\( p \)-ים שונים, כי במקרה הזה המבנה של חבורת הגלואה שלו יהיה פשוט יחסית. איזה ראשוניים נבחר? ובכן, נבחר ראשוניים כך שמתקיים

\( p_{1}\equiv1\left(\text{mod }n_{1}\right) \)

\( p_{2}\equiv1\left(\text{mod }n_{2}\right) \)

\( \vdots \)

\( p_{k}\equiv1\left(\text{mod }n_{k}\right) \)

העובדה שאפשר תמיד לבחור ראשוניים בצורה הזו נובעת מייד ממשפט לא טריוויאלי בכלל שנקרא משפט דיריכלה לסדרות חשבוניות ש(ידעתם שזה יבוא) יש לי עליו פוסט בבלוג אבל (ידעתם שזה יבוא) אין בו הוכחה מלאה של המשפט. למעשה, משפט דיריכלה אומר יותר ממה שאנחנו צריכים פה; הוא אומר שאם \( a,n \) זרים אז יש אינסוף ראשוניים שמקיימים \( p\equiv a\left(\text{mod }n\right) \) (והוא אפילו אומר יותר מזה - הוא אומר משהו על ה”כמות” שלהם, אבל נעזוב את זה). אפשר להסתפק בגרסה חלשה יותר של דיריכלה, שההוכחה שלה פשוטה יותר ולא נכנסת לכלים מאנליזה, אבל נעזוב את זה. בהינתן משפט דיריכלה, למצוא את סדרת הראשוניים שלעיל זה טריוויאלי - בוחרים את \( p_{1} \) באקראי מבין אינסוף הראשוניים האפשריים; עכשיו כשבוחרים מישהו ששקול ל-1 מודולו \( n_{2} \) צריך להיזהר שלא לבחור את \( p_{1} \) שוב בטעות, אבל מכיוון שיש אינסוף ראשוניים מתאימים זה לא יוצר בעיות, וכן הלאה וכן הלאה.

עכשיו נגדיר \( n=p_{1}p_{2}\dots p_{k} \), נסתכל על \( \mathbb{Q}\left(\omega_{n}\right) \), וכפי שכבר ראיתי קודם בפוסט, \( \text{Gal}\left(\mathbb{Q}\left(\omega_{n}\right)/\mathbb{Q}\right)\cong\mathbb{Z}_{n}^{*} \). כעת אני מזכיר את משפט השאריות הסיני ש(ידעתם שזה יבוא) יש לי פוסט עליו בבלוג, ובמקרה הנוכחי אומר בדיוק ש-\( \mathbb{Z}_{n}^{*}\cong\mathbb{Z}_{p_{1}}^{*}\times\dots\times\mathbb{Z}_{p_{k}}^{*} \).

עכשיו, מה הסדר של \( \mathbb{Z}_{p}^{*} \)? החבורה הזו כוללת את כל מי שזרים ל-\( p \) וקטנים ממנו - כל המספרים הטבעים מ-1 עד \( p-1 \). כלומר, \( \left|\mathbb{Z}_{p}^{*}\right|=p-1 \). אפשר להגיד יותר מזה - ניתן להוכיח (ולא אעשה את זה כרגע) שהחבורה הזו ציקלית. כלומר, \( \mathbb{Z}_{p}^{*}\cong\mathbb{Z}_{p-1} \). קיבלנו:

\( \mathbb{Z}_{n}^{*}\cong\mathbb{Z}_{p_{1}-1}\times\dots\times\mathbb{Z}_{p_{k}-1} \).

עכשיו קצת יותר ברור למה בחרנו את הראשוניים בצורה שבה בחרנו אותם: אם \( p\equiv1\left(\text{mod }n\right) \) אז \( n \) מחלק את \( p-1 \). כזכור (אמרתי את זה קודם בפוסט) לחבורה ציקלית יש תת-חבורה מכל סדר שמחלק את סדר החבורה. אז בהינתן \( \mathbb{Z}_{p-1} \) בואו נבחר תת-חבורה \( H \) מסדר \( n \)… רגע, לא, לא. זה לא מה שאני רוצה.

אם אני אמצא תת-חבורה \( H_{1}\times\dots\times H_{k} \) של \( \mathbb{Z}_{p_{1}-1}\times\dots\times\mathbb{Z}_{p_{k}-1} \) כך ש-\( \left|H_{i}\right|=n_{i} \) אז אני אקבל את \( G \) בדיוק בתור תת-חבורה של \( \text{Gal}\left(\mathbb{Q}\left(\omega_{n}\right)/\mathbb{Q}\right) \). זה לא מה שאני מנסה לעשות. אני אוכל להגדיר שדה \( K \) בתור שדה השבת של \( G \), אבל כל מה שזה ייתן לי הוא ש-\( \text{Gal}\left(\mathbb{Q}\left(\omega_{n}\right)/K\right)\cong G \), ואני רציתי בדיוק ההפך: ש-\( K \) יהיה השדה הגדול ושדה הבסיס יהיה \( \mathbb{Q} \). המשפט היסודי של תורת גלואה מראה לנו שכדי להבין “מה קורה למטה”, מעל שדה השבת הבסיסי \( \mathbb{Q} \), צריך לקחת לא תת-חבורה של \( \text{Gal}\left(\mathbb{Q}\left(\omega_{n}\right)/\mathbb{Q}\right) \) אלא דווקא חבורת מנה שלה. אז בואו נעשה משהו טיפה הפוך.

אם \( n \) מחלק את \( p-1 \) אז המנה \( \frac{p-1}{n} \) היא מספר שלם, שגם הוא מחלק את \( p-1 \). לכן אני יכול לקחת תת-חבורה \( H \) מסדר \( \frac{p-1}{n} \) של \( \mathbb{Z}_{p-1} \), ואז המנה שלהן תהיה מסדר \( n \). אם כן, ניקח תת-חבורה \( H_{1}\times\dots\times H_{k} \) של \( \mathbb{Z}_{p_{1}-1}\times\dots\times\mathbb{Z}_{p_{k}-1} \) שמורכבת ממכפלות של תתי-חבורות מהסדרים המתאימים. חבורת המנה תהיה בדיוק \( \mathbb{Z}_{n_{1}}\times\dots\times\mathbb{Z}_{n_{k}}\cong G \), ואז מהמשפט היסודי של תורת גלואה נקבל שאם \( K \) הוא שדה השבת של \( H_{1}\times\dots\times H_{k} \), אז \( \text{Gal}\left(K/\mathbb{Q}\right)\cong\text{Gal}\left(\mathbb{Q}\left(\omega_{n}\right)/\mathbb{Q}\right)/\text{Gal}\left(\mathbb{Q}\left(\omega_{n}\right)/K\right)\cong G \), כפי שרצינו. זה מסיים את ההוכחה הזו.

לסיום, אני רוצה לנצל את ההזדמנות כדי להציג משפט כבד הרבה יותר - משפט קרונקר-וובר (שם לא כל כך הוגן כי הראשון שהוכיח את המשפט היה הילברט; וובר וקרונקר סיפקו הוכחות לא מלאות). המשפט הוא מעין “הפוך” למה שראינו עכשיו. מה שראינו הוא שאם \( G \) אבלית אז קיים \( K\subseteq\mathbb{Q}\left(\omega_{n}\right) \) כך ש-\( \text{Gal}\left(K/\mathbb{Q}\right)=G \). מה שמשפט קרונקר-וובר אומר הוא שאם \( K/\mathbb{Q} \) היא הרחבה של הרציונליים כך ש-\( \text{Gal}\left(K/\mathbb{Q}\right) \) היא חבורה אבלית (מה שנקרא, “הרחבה אבלית”) אז קיים שורש יחידה פרימיטיבי \( \omega_{n} \) כך ש-\( K\subseteq\mathbb{Q}\left(\omega_{n}\right) \); “כל הרחבה אבלית מוכלת בהרחבה ציקלוטומית”.

אני לא הולך להוכיח את המשפט כאן כי הטכניקות שנדרשות לשם כך כבר גולשות לתורת המספרים האלגברית (יש גם הוכחות יותר אלמנטריות, אבל גם הן ארוכות ודורשת ידע מוקדם). כן הייתי שמח לתת אינטואיציה כלשהי מדוע המשפט הוא “חזק”, אבל גם את זה יהיה לי קשה לעשות. במקום זה, אשתמש בדיוק ברמאות שבה ויקיפדיה האנגלית משתמשת ואציג את השוויון הבא:

\( \sqrt{5}=e^{2\pi i/5}-e^{4\pi i/5}-e^{6\pi i/5}+e^{8\pi i/5} \)

שהוא בעצם דרך מפחידה במתכוון לכתוב \( \sqrt{5}=\omega_{5}-\omega_{5}^{2}-\omega_{5}^{3}+\omega_{5}^{4} \). מה פשר השוויון הזה? ובכן, \( \mathbb{Q}\left(\sqrt{5}\right)/\mathbb{Q} \) היא הרחבה אבלית ולכן מוכלת בהרחבה ציקלוטומית - במקרה הזה, ב-\( \mathbb{Q}\left(\omega_{5}\right) \); והשוויון הוא דרך לעזור לנו “להרגיש” מה זה אומר, ההכלה הזו - זה אומר שכי איבר בהרחבה האבלית שלנו אפשר לכתוב בתור צירוף לינארי עם מקדמים רציונליים של שורשי היחידה מסדר \( n \) עבור \( n \) כלשהו. זה בהחלט מרגיש לי מאוד לא טריוויאלי, אז איפה הרמאות פה? ובכן, השווין עם \( \sqrt{5} \) הוא מקרה פרטי של משהו שנקרא סכום גאוס ומאפשר לכתוב כל שורש של ראשוני אי-זוגי בתור צירוף לינארי של שורשי יחידה מתאימים. העניין הוא שלא צריך את קרונקר-וובר כדי להוכיח את כל זה. עם זאת, זה מגניב מספיק כדי שאסיים את הפוסט כאן.


נהניתם? התעניינתם? אם תרצו, אתם מוזמנים לתת טיפ:

Buy Me a Coffee at ko-fi.com