תורת גלואה ופתרון משוואות באמצעות רדיקלים

מבוא

בסדרת הפוסטים הנוכחית הצגתי את הבסיס של תורת גלואה: ראינו את המשפט היסודי שמקשר בין המבנה של הרחבת שדות והמבנה של חבורת האוטומורפיזמים של ההרחבה, וראינו כמה שימושים של התורה הזו כדי להבין יותר טוב איך עובדות הרחבות של שדות. מה שלא ראינו עדיין הוא את הפואנטה - הסיבה שבגללה גלואה המציא מלכתחילה את כל זה: מה שנקרא פתרון משוואות פולינומיות באמצעות רדיקלים.

הנושא הזה הוא אחד מהשיאים בכל תיאור היסטורי של התפתחות המתמטיקה, כי זוהי הבעיה שהפכה את האלגברה הקלאסית למה שאנחנו קוראים לו היום “אלגברה מודרנית”. מה שגלואה עשה היה אחד מהבסיסים המרכזיים להמצאת המושגים של חבורה ושל שדה, ומרתק להיכנס לפרטים המלאים של הנושא. רק שלא אעשה את זה כרגע אלא כנראה במועד מאוחר יותר, כי בהיסטוריה של המתמטיקה אני חושב שצריך קודם להבין טוב את ה”איך” לפני שמדברים על ה”מה ולמה”.

בואו נתחיל עם הדוגמא המנחה שנותנת מוטיבציה לכל הסיפור הזה - הנוסחה לפתרון משוואה ריבועית. משוואה ריבועית היא ביטוי מהצורה \( ax^{2}+bx+c=0 \) כאשר \( x \) הוא משתנה ואילו ה-\( a,b,c \) הם מקדמים מספריים. פתרון של משוואה ריבועית הוא מספר \( \theta \) שאפשר להציב במקום \( x \), לבצע את החישוב \( a\theta^{2}+b\theta+c \) ולבדוק אם קיבלנו אפס או לא (בלשון של הפוסטים האחרונים - נתון לנו פולינום ממעלה שניה ואנחנו רוצים למצוא שורש שלו). מה שאנחנו באמת רוצים הוא נוסחה שנותנת לנו פתרונות של משוואה שכזו בלי שנצטרך להתאמץ, ובתיכון לומדים שהקסם הזה הוא אפשרי, במחיר אחת הנוסחאות המזעזעות ביותר שהציבור הרחב נחשף להן, ואחת מהיחידות שאני זוכר בעל פה עד היום:

\( x_{1,2}=\frac{-b\pm\sqrt{b^{2}-4ac}}{2a} \)

איך בכלל הגיעו לנוסחה מפלצתית שכזו? אחד מהפוסטים החביבים עלי בבלוג עוסק בדיוק בשאלה הזו. ברשותכם, אני רוצה לענות עליה שוב, אבל בצורה קצת שונה ויותר מתוחכמת, שתתאים למה שאני הולך לעשות בהמשך. ראשית, ההנחה הבסיסית שלי היא שאותם \( a,b,c \) וגם \( \theta \) נלקחים כולם מתוך שדה. כלומר, שאפשר לחבר, לכפול, לחסר ולחלק אותם. אפשר גם לדבר על פתרון משוואות מעל חוג, שהוא מקרה יותר כללי, אבל שם לא תמיד יהיו פתרונות וזה נושא לדיון נפרד; עדיף קודם כל להבין את המקרה הפשוט. כמו כן, הנחה נוספת שלי היא ש-\( a\ne0 \) אחרת יש לנו ביד משוואה אחרת, פשוטה יותר: \( bx+c=0 \). אם גם \( b=0 \) אז הפכנו למשוואה \( c=0 \) שהיא או נכונה או לא; אין לה “פתרונות” ספציפיים. אם \( b\ne0 \) אז אפשר לחלק בו ולקבל \( x=-\frac{c}{b} \), כלומר זה מקרה קל עם פתרון יחיד. לכן המקרה המעניין הראשון הוא \( ax^{2}+bx+c \) עם ההנחה הנוספת \( a\ne0 \).

אם \( a\ne0 \) אפשר לפשט את המשוואה על ידי חלוקה בו: נקבל את המשוואה \( x^{2}+\frac{b}{a}x+\frac{c}{a} \). בואו נסמן \( A=\frac{b}{x} \) ו-\( B=\frac{c}{a} \) ונקבל את המשוואה הפשוטה יותר \( x^{2}+Ax+B=0 \). המפתח לפתרון המשוואה הזו טמון בעוד תעלול, שנקרא “השלמה לריבוע” ואפשר לתאר בדרך ציורית ויפה ועשיתי את זה בפוסט ההוא, אבל בואו פשוט נציג אותו כאן בדרך שנוחה לי: אני מבצע החלפת משתנה על ידי הגדרת \( y=x+\frac{A}{2} \). חשוב לי שנראה את ההצבה הזו כי ההתמודדות עם משוואות ממעלה שלישית ורביעית מתחילה באותו האופן. מההצבה הזו אנחנו מקבלים

\( x=y-\frac{A}{2} \)

ולכן גם

\( x^{2}=y^{2}-Ay+\frac{A^{2}}{4} \)

ואחרי שנציב את זה במשוואה המקורית, נקבל

\( x^{2}+Ax+B=\left(y^{2}-Ay+\frac{A^{2}}{4}\right)+A\left(y-\frac{A}{2}\right)+B= \)

\( =y^{2}+\frac{A^{2}-2A^{2}+4B}{4}=y^{2}+\frac{-A^{2}+4B}{4}=y^{2}-\frac{A^{2}-4B}{4} \)

עכשיו אפשר להעביר את הביטוי הימני אגף, ולקבל:

\( y^{2}=\frac{A^{2}-4B}{4} \)

ועכשיו מגיע פתאום מהלך חדש, ששובר את כללי המשחק: אנחנו מוציאים שורש ריבועי ומקבלים \( y_{1,2}=\pm\frac{\sqrt{A^{2}-4B}}{2} \). השאלה “האם בכלל מותר לנו להוציא פה שורש?” היא מצויינת ועוד מעט נחזור אליה.

עכשיו, משיש לנו פתרון למשוואה עם \( y \), אפשר לחזור ממנו אל פתרון למשוואה עם \( x \):

\( x_{1,2}+\frac{A}{2}=\pm\frac{\sqrt{A^{2}-4B}}{2} \)

\( x_{1,2}=\frac{-A\pm\sqrt{A^{2}-4B}}{2} \)

ועכשיו אפשר לחזור למשוואה עם \( a,b,c \):

\( x_{1,2}=\frac{-\frac{b}{a}\pm\sqrt{\frac{b^{2}}{a^{2}}-4\frac{c}{a}}}{2}=\frac{a}{a}\frac{-\frac{b}{a}\pm\sqrt{\frac{b^{2}}{a^{2}}-4\frac{c}{a}}}{2}= \)

\( =\frac{-a\cdot\frac{b}{a}\pm\sqrt{a^{2}\cdot\left(\frac{b^{2}}{a^{2}}-4\frac{c}{a}\right)}}{2a}=\frac{-b\pm\sqrt{b^{2}-4ac}}{2a} \)

זה מסיים את הסיפור של המשוואה ממעלה שניה, אבל בואו נראה מה הדברים שלמדנו מפה:

ה"עולם" שבו כל הסיפור הזה מתרחש הוא שדה \( F \) כלשהו.
בעולם הזה אנחנו מקבלים פולינום \( p\left(x\right)\in F\left[x\right] \) ומחפשים שורש שלו (או אפילו טוב יותר, את כל השורשים בבת אחת אם אפשר)
הנוסחה שלנו נותנת לנו אלגוריתם שבונה את שורשי המשוואה באמצעות מספר סופי של פעולות.
הפעולות שבהן מותר לנו להשתמש הן: חיבור, חיסור, כפל, חילוק והוצאת שורש.
הקלטים האפשריים של האלגוריתם הם האיברים של \( F \). בפרט, המקדמים של הפולינום \( p\left(x\right) \) יכולים להיות חלק מהקלט.

דבר אחד ויחיד שלא הופיע בדוגמא הזו במפורש, וכן יופיע אם ננסה לפתור משוואה ממעלה שלישית הוא ש”הוצאת שורש” כאן אין פירושה רק “הוצאת שורש ריבועי” אלא הוצאה של שורש מכל סדר סופי, מה שאנחנו מסמנים בתור הפעולה \( \sqrt[n]{a} \).

אני אתן הגדרה פורמלית יותר בהמשך, אבל הנה רוח הדברים: אנחנו אומרים שפולינום \( p\left(x\right)\in F\left[x\right] \) ניתן לפתרון באמצעות רדיקלים אם יש נוסחה שעונה לתנאים למעלה עבור השורשים שלו. כעת אפשר לחזור לרגע לסיפור ההיסטורי: נוסחת השורשים עבור משוואה ממעלה שניה הייתה ידועה לאנושות עוד משחר ההיסטוריה; למשל, אצל הבבלים יש לה תיאורים מפורשים. צריך קצת להיזהר עם הניסוח האנכרוניסטי של הטענה הזו, כי המושג של נוסחה בכלל לא היה קיים אצל הבבלים, והם לא טיפלו בכל המקרים האפשריים של נוסחת השורשים; אבל מה שהיה להם הוא, בשורה התחתונה, אלגוריתם כדוגמת זה שתיארתי פה.

לעומת זאת, נוסחאות לפתרון באמצעות רדיקלים של משוואות ממעלה שלישית ורביעית זה עניין חדש הרבה יותר, שמקורו באיטליה של תקופת הרנסנס. הסיפור של הגילוי שלהן הוא אחד מהמרתקים בכל תולדות המתמטיקה, בגלל התחרות הקשה שהייתה מעורבת בכך, והאופן שבו המספרים המרוכבים צצו לראשונה מתוכו באופן בלתי נמנע בעליל (ועוד אחזור לזה כשאדבר על פתרון משוואות ממעלה שלישית). החיפוש אחר נוסחה כללית לפתרון משוואה ממעלה חמישית הפך מאז אותה תקופה לאחד מהנושאים הלוהטים ביותר במתמטיקה, עד שבשנת 1824 המתמטיקאי נילס הנריק אבל הוכיח (תוך היעזרות בתוצאה חלקית של פאולו רופיני מ-1799) שזה פשוט בלתי אפשרי: אין נוסחה כללית לפתרון באמצעות רדיקלים של משוואה ממעלה חמישית ומעלה. גם אחרי שאבל פרסם את ההוכחה שלו, עדיין נותרה פתוחה שאלה מהותית לא פחות - מתי כן אפשר לפתור משוואות ממעלה חמישית ומעלה באמצעות רדיקלים? אבל לא הספיק לפתור את השאלה הזו כי נפטר ב-1829 ממחלה, כשהוא רק בן 26. מי שכן פתר את השאלה הזו היה אווריסט גלואה, שחייו היו טראגיים אף יותר; הוא נהרג בדו-קרב ב-1832 כשהוא בן 20 בלבד, אבל התורה המתמטית שהשאיר אחריו (והראשון ש”פיענח” ופרסם היה ליוביל, ב-1846) הפכה להיות אחד מאבני היסוד באלגברה המודרנית, ובפרט ענתה באופן מלא על האתגר: היא סיפקה תנאי הכרחי ומספיק לכך שמשוואה כלשהי תהיה ניתנת לפתרון באמצעות רדיקלים. את התנאי ניתן לנסח בפשטות: לכל משוואה אפשר להתאים חבורה - חבורת גלואה של המשוואה הזו, והמשוואה היא פתירה אם ורק אם החבורה היא… אה… פתירה?

בניסוח הזה לא ברור מה בעצם גלואה עשה, עד שאנחנו נזכרים שכל המהות של תורת גלואה היא רדוקציה: רדוקציה של שאלות קשות על שדות לשאלות קלות יותר על חבורות. המושג של “חבורה פתירה”, שהצגתי לקראת סוף סדרת הפוסטים שלי על תורת החבורות, הוא פשוט יחסית. בפרט קל יחסית להראות שהחבורה שמייצגת את המשוואה הכללית ממעלה חמישית היא לא פתירה. מיותר לציין שהשם “חבורה פתירה” הגיע בדיוק מהמקום הזה; “חבורה פתירה” פירושו “חבורה שהיא חבורת גלואה של משוואה פולינומית שפתירה על ידי רדיקלים”.

המשך הסיפור כולל כמה עניינים עיקריים: ראשית, צריך לראות את התוצאה הכללית של גלואה שבה, בהינתן פולינום קונקרטי, הפתירות של הפולינום מומרת בפתירות של חבורה. בשביל זה נצטרך גם להזכיר לעצמנו את המושג של חבורה פתירה ולהוכיח עליהן דברים שלא הוכחתי עד כה בבלוג. שנית, צריך להבין את העניין הקצת חמקמק הזה של “משוואה כללית”, שתורת גלואה לכאורה לא מטפלת בה אבל עם עוד קצת עבודה טכנית נראה שהיא כן. לבסוף צריך להסביר למה החבורה הספציפית שמתאימה למשוואה הכללית ממעלה 5 ומעלה היא לא פתירה ואילו עבור מעלות 1,2,3,4 היא כן פתירה; זו עוד הוכחה שהתחמקתי ממנה בבלוג עד כה ולא אתחמק ממנה עתה.

מה הרעיון הכללי מאחורי ההוכחה של גלואה?

אם \( p\left(x\right)\in F\left[x\right] \) הוא פולינום ספרבילי אז שדה הפיצול שלו (כלומר, מה שמתקבל מ-\( F \) על ידי הוספת שורשי הפולינום הזה) הוא הרחבת גלואה ואפשר לדבר על חבורת הגלואה שלה; לחבורת הגלואה הזו גם קוראים בשם חבורת הגלואה של הפולינום \( p \) מעל \( F \). במקרים הנפוצים שמעניינים אותנו שבהם \( F \) הוא שדה ממציין 0 או שדה סופי, אין צורך לדרוש ש-\( p\left(x\right) \) יהיה ספרבילי; שדה הפיצול שלו עדיין יהיה גלואה, ולכן מעכשיו אדבר בחופשיות על חבורת הגלואה של כל פולינום (רק צריך לזכור שאם עובדים מעל שדה אינסופי שאינו מושלם צריך להיות זהירים מאוד). מה שאיברים בחבורה הזו עושים הוא לבצע פרמוטציות על שורשים של הפולינום הזה; למעשה, זו הייתה נקודת המוצא של גלואה. הוא לא דיבר על חבורות באופן כללי אלא על אוספי הפרמוטציות של פתרונות של משוואות, כאשר הפרמוטציות הללו גם “משחקות יפה” עם השדה (כלומר, הן אוטומורפיזם).

עכשיו נדבר על מה זה אומר לפתור על ידי רדיקלים. נניח ש-\( E/F \) היא הרחבת שדות כלשהי ו-\( a\in E \). נאמר ש-\( a \) ניתן להבעה בעזרת רדיקלים אם קיימת סדרה של שדות,

\( F=E_{0}\subseteq E_{1}\subseteq E_{2}\subseteq\dots\subseteq E_{n}=E \) כך שלכל \( 0\le i<n \) מתקיים ש-\( E_{i+1}=E_{i}\left(\sqrt[k_{i}]{a_{i}}\right) \) עבור \( k_{i}\ge2 \) טבעי ו-\( a_{i}\in E_{i} \) כלשהו (עוד אסביר בהמשך מה זה בדיוק שורש שכזה). הרחבה כזו של שדה, שמתקבלת מהוספה של שורש \( k \)-י של איבר בשדה, נקראת הרחבה רדיקלית פרימיטיבית; ואם יש לנו מגדל כזה של הרחבת שדות שבו כל צעד הוא הרחבה רדיקלית פרימיטיבית, אז כל העסק נקרא הרחבה רדיקלית; ואם יש לנו פולינום מעל שדה הבסיס אומרים שהוא ניתן לפתרון באמצעות רדיקלים אם כל השורשים שלו נמצאים בהרחבות רדיקליות של שדה הבסיס.

ההגדרה הזו מזכירה מאוד את מה שראינו לגבי בעיות בניה בסרגל ומחוגה; מספר \( a\in\mathbb{R} \) כלשהו הוא ניתן לבניה בסרגל ומחוגה אם ורק אם קיימת סדרה של שדות, \( \mathbb{Q}=E_{0}\subseteq E_{1}\subseteq E_{2}\subseteq\dots\subseteq E_{n}=F\left(a\right) \) כך ש-\( \left[E_{i+1}:E_{i}\right]=2 \). למרות הדמיון, חשוב גם לשים לב להבדל: ראשית, אם \( E_{i+1}=E_{i}\left(\sqrt[k_{i}]{a_{i}}\right) \) אז בהחלט ייתכן ש-\( \left[E_{i+1}:E_{i}\right] \) יהיה גדול מ-2 (הגודל חסום על ידי \( k_{i} \)). מצד שני, \( \left[E_{i+1}:E_{i}\right]=2 \) זה קצת פחות אינפורמטיבי לגבי איך בדיוק \( E_{i+1} \) מתקבל מ-\( E_{i} \). אנחנו יודעים שבמקרה הזה, \( E_{i+1} \) התקבל על ידי הוספת שורש של פולינום ממעלה שניה, אבל שורש של פולינום זה לא אותו דבר כמו הפעולה “הוצאת שורש”. דוגמא קלאסית לכך היא המספר \( \varphi=1.61803\dots \) המכונה “יחס הזהב”; הוא שורש של הפולינום \( x^{2}-x-1 \) מעל \( \mathbb{Q} \), אבל לא קיים מספר רציונלי \( a\in\mathbb{Q} \) כך ש-\( \varphi=\sqrt[k]{a} \), לכל \( k \). במילים אחרות, לא כל הרחבה ממימד 2 היא הרחבה רדיקלית פרימיטיבית, ובואו לא נדבר אפילו על ממדים גבוהים יותר.

אז מצד אחד, העובדה שאנחנו לא יכולים להגיד שום דבר על \( \left[E_{i+1}:E_{i}\right] \) מונעת מאיתנו להשתמש בטכניקות הסופר-פשוטות שהראו שאי אפשר לחלק זוויות לשלוש או להכפיל את הקוביה. מצד שני, העובדה שאנחנו כן יודעים משהו מהותי על האופן שבו \( E_{i+1}/E_{i} \) נוצרת מאפשר לנו להגיד משהו מהותי על חבורת הגלואה שמתאימה לה, וזה המפתח לסיפור כולו.

בנפנוף ידיים פרוע, הרעיון הוא שאם יש לנו הרחבה רדיקלית פרימיטיבית, ואם השדה שמעליו אנחנו עובדים הוא “נחמד מספיק”, אז חבורת הגלואה של ההרחבה הזו תהיה ציקלית. ה”נחמד מספיק” פשוט אומר כאן “כולל את כל שורשי היחידה מסדר כך וכך” ונדבר על זה במפורט בהמשך. הנקודה היא ששורשי יחידה הם בעצמם, ובכן, שורשים; ולכן אפשר תמיד, כשבונים הרחבה רדיקלית, להוסיף אותם “על הדרך”.

כשטיפלתי בבעיית הבניה של מצולע משוכלל, הסיטואציה הייתה שהייתה לנו סדרה של הרחבות:

\( E_{0}\subseteq E_{1}\subseteq E_{2}\subseteq\dots\subseteq E_{k} \)

שהתאימו לסדרה של חבורות:

\( G_{k}\subseteq G_{k-1}\subseteq G_{k-2}\subseteq\dots\subseteq G_{0} \)

והרעיון היה שמתקיים \( \text{Gal}\left(E_{i+1}/E_{i}\right)\cong G_{i}/G_{i+1} \) (אני אוכיח את זה בהמשך למקרה שזה לא ברור). לכן, אם יש לנו הרחבה רדיקלית שמקיימת את המה-שזה-לא-יהיה עם שורשי היחידה, אנחנו נקבל שחבורת הגלואה שלה כוללת סדרה עולה של תתי-חבורות (החל מהטריוויאלית ועד לחבורה כולה) כך שהמנה של כל שתי חבורות עוקבות היא ציקלית. לחבורה שמקיימת את התכונה הזו יש שם: חבורה פתירה. ליתר דיוק, ההגדרה שהראיתי עד כה לחבורות פתירות הייתה קצת שונה, אבל כאשר החבורה היא סופית אז היא פתירה אם ורק אם קיימת בה סדרת תתי-חבורות שכזו - את זה אני אוכיח בפוסט המשך שיתעסק כולו בחומר של תורת החבורות שרלוונטי לעניין הזה שלנו ועדיין לא הראיתי בבלוג.

הרחבות רדיקליות פרימיטיביות

בואו ננסה להבין עכשיו איך “עובדת” הרחבה רדיקלית פרימיטיבית. זו הרחבה \( E/F \) כך שמתקיים \( E=F\left(\sqrt[n]{a}\right) \) עבור \( a\in F \) ו-\( n\ge2 \) כלשהו, אבל מה המשמעות של \( \sqrt[n]{a} \) בכלל? זה ביטוי שהוא לא מוגדר היטב כי לכל \( a\in F \) השונה מאפס קיימים \( n \) שורשים שונים בשדה הפיצול של הפולינום \( x^{n}-a \) למעט במקרה שבו \( F \) הוא ממציין שמחלק את \( n \) - ועל מקרה כזה לא נדבר פה. בכל מקרה אחר, הנגזרת של \( x^{n}-a \) היא פשוט \( nx^{n-1} \) שזר ל-\( x^{n}-a \) (למשל, כי השורש היחיד של \( nx^{n-1} \) הוא 0, שאיננו שורש של \( x^{n}-a \)) ולכן \( x^{n}-a \) הוא פולינום ספרבילי, כלומר יש לו \( n \) שורשים שונים. אבל מי הם?

ובכן, ברור ש-0 אינו שורש. אם \( \alpha,\beta \) הם שניהם שורשים, אז \( \alpha^{n}=\beta^{n}=a \) ולכן \( \left(\frac{\alpha}{\beta}\right)^{n}=1 \), מה שאומר ש-\( \frac{\alpha}{\beta} \) הוא שורש יחידה מסדר \( n \). כרגיל, אני אסמן ב-\( \omega_{n}\triangleq e^{\frac{2\pi i}{n}} \) את אחד משורשי היחידה הפרימיטיביים מסדר \( n \), ואז כל שורש יחידה מסדר \( n \) הוא מהצורה \( \omega_{n}^{k} \), כך שאפשר לכתוב \( \beta=\alpha\omega_{n}^{k} \). יותר מכך: אם \( \omega_{n}^{k} \) הוא שורש יחידה מסדר \( n \) כלשהו, אז \( \left(\alpha\omega_{n}^{k}\right)^{n}=\alpha^{n}\cdot1=a \). המסקנה: אם ניקח שורש כלשהו של \( x^{n}-a \), לא משנה בכלל איזה, אז כל שורש של הפולינום מתקבל מהכפלה שלו בשורש יחידה פרימיטיבי, וכל הכפלה שלו בשורש יחידה פרימיטיבי נותנת שורש של הפולינום. המסקנה היא שאפשר לסמן ב-\( \sqrt[n]{a} \) את אחד מהשורשים של \( x^{n}-a \) באופן שרירותי לגמרי - לא משנה איזה שורש נבחר - ואז נקבל שכל השורשים של הפולינום הם בדיוק \( \omega_{n}^{k}\sqrt[n]{a} \) עבור \( 0\le k<n \).

הדוגמא הפשוטה ביותר היא זו של שורשים “רגילים”. למשל \( \sqrt{2} \). אנחנו יודעים שלמשוואה \( x^{2}-2=0 \) יש שני פתרונות: \( \sqrt{2} \) ו-\( -\sqrt{2} \), כשהקונבנציה היא ש-\( \sqrt{2} \) הוא הפתרון “החיובי”. זה על פניו לא לגמרי מסתדר עם מה שאמרתי לפני רגע על כך שאפשר לסמן כל אחד מהשורשים בתור \( \sqrt{2} \), אבל זה בגלל שההקשר שבו אנחנו מדברים על \( \sqrt{2} \) בדרך כלל הוא יותר ספציפי: זה ההקשר של \( \mathbb{R} \), שהוא שדה סדור. אפשר להשוות דברים ל-0 ולומר אם הם גדולים או קטנים יותר. בהקשר הכללי יותר של שדות זה לא קיים, ואם תחשבו על זה רגע - גם ההגדרה של “חיובי” ו”שלילי” היא מלכתחילה שרירותית. למה “שלילי” הוא מה שנמצא משמאל לציר \( y \) ולא מה שמימין?

הדוגמא הבאה שקל לנו יחסית להבין היא של המשוואה \( x^{4}=16 \). למשוואה הזו יש את הפתרון המתבקש \( x=2 \) וגם את \( x=-2 \), אבל כדי לראות את כל הפתרונות צריך לערב גם מרוכבים, ומקבלים את הפתרונות \( \pm2i \). כלומר, כל פתרון מתקבל מלקיחת אחד מהפתרונות וכפל באברי הקבוצה \( \left\{ 1,-1,i,-i\right\} \) של שורשי היחידה מסדר 4. הדוגמא הזו מעניינת, כי \( \mathbb{Q} \) מכיל חלק מהפתרונות אבל לא את כולם; כדי שנקבל את כל הפתרונות, אנחנו חייבים להוסיף ל-\( \mathbb{Q} \) גם את \( i \). הייתה לנו סיטואציה דומה בפוסט קודם, עם הפולינום \( x^{3}-2 \); שם השורשים שלו הם \( \sqrt[3]{2} \) ו-\( \omega_{3}\sqrt[3]{2} \) ו-\( \omega_{3}^{2}\sqrt[3]{2} \). במקרה הזה, \( \mathbb{Q}\left(\sqrt[3]{2}\right) \) הוא לא שדה הפיצול של הפולינום, אלא רק \( \mathbb{Q}\left(\omega_{3},\sqrt[3]{2}\right) \). זה מבהיר לנו שאם באופן כללי אנחנו רוצים ש-\( E=F\left(\sqrt[n]{a}\right) \) תהיה הרחבת גלואה, אז צריך ש-\( F \) כבר יכיל מראש את שורשי היחידה מסדר \( n \). לנו זה לא יפריע בכל מקרה, כי אם \( F \) לא מכיל אותן, אפשר לבנות שרשרת של הרחבות: \( F\subseteq F\left(\omega_{n}\right)\subseteq F\left(\omega_{n}\right)\left(\sqrt[n]{a}\right) \). בשרשרת הזו כל איבר התקבל מקודמו על ידי הוספת שורש \( n \)-י של פולינום, ולכן היא עדיין מהווה חלק לגיטימי משרשרת שמראה שהרחבה כלשהי היא רדיקלית. בנוסף לכך, \( F\left(\omega_{n}\right)/F \) היא הרחבת גלואה (הרחבה ציקלוטומית) ועכשיו גם \( F\left(\omega_{n}\right)\left(\sqrt[n]{a}\right)/F\left(\omega_{n}\right) \) תהיה הרחבת גלואה.

יפה, אז מעכשיו \( E=F\left(\sqrt[n]{a}\right) \) היא הרחבת גלואה של \( F \), אבל מה חבורת הגלואה שלה יכולה להיות? אם \( \sigma \) הוא אוטומורפיזם של \( E \) שמשמר את \( F \) אז בפרט הוא משמר את שורשי היחידה. לכן \( \sigma\left(\omega_{n}^{k}\sqrt[n]{a}\right)=\omega_{n}^{k}\sigma\left(\sqrt[n]{a}\right) \), מה שאומר שהערך של \( \sigma \) על כל שורש של \( x^{n}-1 \) נקבע באופן יחיד על ידי הפעולה שלו על \( \sqrt[n]{a} \). האם זה אומר שיש \( n \) אוטומורפיזמים, אחד שמעביר את \( \sqrt[n]{a} \) לכל אחד מ-\( n \) השורשים האפשריים של \( x^{n}-a \)? ובכן, לא בהכרח. בואו נסתכל למשל על השדה \( \mathbb{Q}\left(i\right) \) - כלומר, אחרי שהוספתי לרציונליים את שורשי היחידה מסדר 4. בשדה הזה ניקח את \( a=4 \) ונבנה את ההרחבה \( \mathbb{Q}\left(i,\sqrt[4]{4}\right)/\mathbb{Q}\left(i\right) \). כלומר, הוספנו שורש של הפולינום \( x^{4}-4 \). עכשיו, מכיוון ש-\( 4=2^{2} \), הרי ש-\( \sqrt[4]{4}=\sqrt{2} \), ולכן אנחנו מקבלים את ההרחבה \( \mathbb{Q}\left(i,\sqrt{2}\right)/\mathbb{Q}\left(i\right) \) שהיא במובהק ממימד 2 כי הפולינום המינימלי של \( \sqrt{2} \) מעל \( \mathbb{Q} \) הוא ממעלה 2. כלומר, יש רק שני אוטומורפיזמים. מה השתבש?

ובכן, אם נפרק את \( x^{4}-4 \) לגורמים נקבל את הפולינום \( \left(x-\sqrt{2}\right)\left(x+\sqrt{2}\right)\left(x-i\sqrt{2}\right)\left(x+i\sqrt{2}\right) \). בינתיים הכל מתקדם לפי התוכנית - השורשים של הפולינום הם אכן שורש אחד קונקרטי (\( \sqrt{2} \) למשל) כפול שורשי היחידה מסדר 4. רק מה, אם נכפול את זוג הגורמים הראשון והשני, ואת זוג הגורמים השלישי והרביעי, נקבל את הדבר הבא:

\( \left(x^{2}-2\right)\left(x^{2}+2\right) \)

זו מכפלה של שני פולינומים ששניהם כבר שייכים ל-\( \mathbb{Q}\left(i\right) \). כלומר, \( x^{4}-4 \) הוא פריק מעל \( \mathbb{Q}\left(i\right) \), למרות שאין לו אף שורש בשדה הזה. תורת גלואה אומרת לנו שכל אוטומורפיזם של השדה מבצע פרמוטציה בין השורשים של כל גורם אי פריק של הפולינום; אי אפשר שהוא “יקפיץ” שורש מגורם אי פריק אחד לגורם אי פריק אחר.

והנה הסבר מפורש: נניח ש-\( \sigma \) אוטומורפיזם של \( \mathbb{Q}\left(i,\sqrt{2}\right) \) שמשמר את \( \mathbb{Q}\left(i\right) \). נניח לרגע בשלילה ש-\( \sigma\left(\sqrt{2}\right)=i\sqrt{2} \), אז אם נעלה את שני האגפים בריבוע, נקבל ש-

\( 2=\sigma\left(2\right)=\sigma\left(\sqrt{2}\right)^{2}=\left(i\sqrt{2}\right)^{2}=-2 \)

וזו סתירה מפורשת שנובעת מכך שכבר הריבוע של ה”יוצר” \( \sqrt{2} \) שלנו שייך לשדה הבסיס ש-\( \sigma \) מחוייבת לשמר.

אז \( \sigma \) לא בהכרח מסוגלת להעביר את \( \sqrt[n]{a} \) לכל שורש אחר של \( x^{n}-a \), אבל כשהיא כן מעבירה את \( \sqrt[n]{a} \) למשהו, זה יהיה לאיבר מהצורה \( \omega_{n}^{k}\sqrt[n]{a} \). אם \( \sigma\left(\sqrt[n]{a}\right)=\omega_{n}^{k}\sqrt[n]{a} \) אפשר לסמן את \( \sigma \) בתור \( \sigma_{k} \). קל לראות ש-\( \sigma_{k}\sigma_{t}=\sigma_{k+t} \) כשהחיבור מתבצע מודולו \( n \), ולכן יש לנו איזומורפיזם בין \( \text{Gal}\left(F\left(\sqrt[n]{a}\right)/F\right) \) ובין תת-חבורה של \( \mathbb{Z}_{n} \). תת-חבורה של חבורה ציקלית היא בעצמה ציקלית, מה שמסיים את הכיוון הזה של ההוכחה: הראינו שחבורת גלואה של כל הרחבה רדיקלית היא חבורה ציקלית, בתנאי שהשדה שאותו מרחיבים כבר מכיל את שורשי היחידה הרלוונטיים.

תגידו יפה שלום לרזולבנטה של לגראנז'

לפני גלואה וגם לפני אבל ורופיני, לגראנז’ כבר התעסק עם התעלומה של פתרון משווואות פולינומיות. לומר מה בדיוק עשה - זה עניין לפוסט נפרד שיעסוק בהיסטוריה של הנושא, אבל אפשר לומר שבזכות לגראנז’ היה לבאים אחריו קרש קפיצה אל התגליות היפות שלהם. משפט לגראנז' בתורת החבורות נולד מתוך העבודה הזו של לגראנז’, וכך גם המושג שאני רוצה לתאר עכשיו - הרזולבנטה. שוב, לא אכנס כרגע לשאלה מה בדיוק לגראנז’ ניסה להשיג באמצעותה, אלא את מה שהיא הולכת לתת לנו עכשיו - היא תוכיח לנו שאם \( E/F \) היא הרחבת גלואה עם חבורת גלואה \( \mathbb{Z}_{n} \) ו-\( F \) מכיל את שורשי היחידה מסדר \( n \), והמציין שלו לא מחלק את \( n \) - אז במקרה זה, \( E=F\left(\sqrt[n]{a}\right) \) עבור \( a\in F \) כלשהו. כלומר, “כל הרחבה ציקלית היא רדיקלית”, כאשר “הרחבה ציקלית” זו הרחבה עם חבורת גלואה ציקלית, ואני מטאטא מתחת לשטיח את הפרטים הטכניים של שורשי היחידה והמציין.

אני בעצמי כבר לא זוכר את זה, אבל הזכרתי מתישהו בחטף את המושג של עקבה בתורת גלואה - העקבה (Trace) של איבר \( a\in E \) בהרחבת גלואה \( E/F \) הוא הסכום \( \sum_{\sigma\in\text{Gal}\left(E/F\right)}\sigma\left(a\right) \), והפואנטה איתו היא שהוא שייך ל-\( F \); קל לראות את זה אם מפעילים איבר כללי של חבורת הגלואה של \( E/F \) על הסכום הזה; בזכות התכונות של חבורה, נקבל בדיוק את אותו הסכום שוב, ולכן העקבה שייכת לשדה השבת של חבורת הגלואה של \( E/F \), שהיא \( F \).

הרזולבנטה של לגרנאז’ מזכירה מאוד את זה, פרט לכך שאנחנו מכניסים לתוך הסכום הזה גם חזקות של שורש יחידה. מכיוון שבמקרה שלנו, \( \text{Gal}\left(E/F\right) \) היא ציקלית, אפשר לקחת לה יוצר \( \sigma \) ואז אפשר לכתוב את העקבה בתור \( \sum_{k=0}^{n-1}\sigma^{k}\left(a\right) \). הרזולבנטה תהיה כמעט אותו דבר, אבל כשמכניסים לתמונה \( \omega \) שהוא שורש יחידה מסדר \( n \):

\( \left(a,\omega\right)\triangleq\sum_{k=0}^{n-1}\omega^{k}\sigma^{k}\left(a\right)=a+\omega\sigma\left(a\right)+\dots+\omega^{n-1}\sigma^{n-1}\left(a\right) \)

אם תרצו, אפשר לחשוב על זה כאילו העובדה ש-\( \text{Gal}\left(E/F\right) \) היא ציקלית מאפשרת לנו “לתאם” בין החזקות של \( \omega \) ובין האוטומורפיזם שמופעל על \( a \) בכל אחד מהאיברים בסכום.

הרזולבנטה, אם כן, היא איבר ב-\( E \) שמחושב מתוך \( a,\omega \) איכשהו. מה שהולך לעניין אותנו הוא מה קורה לאיבר הזה כשמפעילים עליו את \( \sigma \), היוצר של חבורת הגלואה של \( E/F \). מה שיקרה הוא שהסכום שמגדיר את הרזולבנטה “יזוז צעד אחד הצידה”:

\( \sigma\left(\left(a,\omega\right)\right)=\sigma\left(\sum_{k=0}^{n-1}\omega^{k}\sigma^{k}\left(a\right)\right)= \)

\( =\sum_{k=0}^{n-1}\omega^{k}\sigma^{k+1}\left(a\right)=\omega^{-1}\sum_{k=0}^{n-1}\omega^{k+1}\sigma^{k+1}\left(a\right) \)

וכעת מגיע הפאנץ’: הציקליות ה”משותפת” הן של \( \sigma \) והן של \( \omega \), שנובעת מכך ש-\( \sigma^{n}=\text{id} \) ו-\( \omega^{n}=1 \); היא מביאה לכך ש-\( \omega^{n}\sigma^{n}\left(a\right)=\omega^{0}\sigma^{0}\left(a\right) \), ולכן

\( \omega^{-1}\sum_{k=0}^{n-1}\omega^{k+1}\sigma^{k+1}\left(a\right)=\omega^{-1}\sum_{k=1}^{n}\omega^{k}\sigma^{k}\left(a\right)= \)

\( =\omega^{-1}\sum_{k=0}^{n-1}\omega^{k}\sigma^{k}\left(a\right)=\omega^{-1}\left(a,\omega\right) \)

כלומר, להפעיל את \( \sigma \) על הרזולבנטה זה כמו לכפול אותה ב-\( \omega^{-1} \). כעת, בואו נסתכל על האיבר \( \left(a,\omega\right)^{n} \). האיבר הזה הוא הרזולבנטה (הרזולבנטה היא איבר ב-\( E \)) כשמעלים אותה בחזקת \( n \). מה קורה כשמפעילים את \( \sigma \) על האיבר הזה? ובכן, מקבלים:

\( \sigma\left(\left(a,\omega\right)^{n}\right)=\left(\sigma\left(a,\omega\right)\right)^{n}=\left(\omega^{-1}\left(a,\omega\right)\right)^{n}= \)

\( \left(\omega^{n}\right)^{-1}\left(a,\omega\right)=\left(a,\omega\right) \)

במילים אחרות, \( \left(a,\omega\right)^{n} \) מקובע על ידי \( \sigma \), ומכיוון ש-\( \sigma \) יוצרת את כל \( \text{Gal}\left(E/F\right) \) אז \( \left(a,\omega\right)^{n} \) שייך לשדה השבת של \( \text{Gal}\left(E/F\right) \) ומכיוון שזו הרחבת גלואה אז שדה השבת הזה הוא בדיוק \( F \). קיבלנו ש-\( \left(a,\omega\right)^{n}\in F \), בדיוק כמו שקורה עם העקבה. עכשיו, מה יש לנו? איבר שהחזקה ה-\( n \)-ית שלו שייכת ל-\( F \), והוא עצמו שייך ל-\( E \)? זה נותן תחושה ש-\( \left(a,\omega\right)^{n} \) הוא מועמד טוב להיות האיבר שהוספת שורש \( n \)-י שלו יוצרת את כל \( E \) - איבר שאם אוכיח שקיים, הוכחתי ש-\( E/F \) היא הרחבה רדיקלית פרימיטיבית. העניין הוא שאני צריך כאן יותר מאשר תחושה, כי זה פשוט לא יעבוד בהכרח בלי הנחות נוספות. המזל שלי הוא שההגדרה של הרזולבנטה השאירה לי מרחב תמרון בבחירה של ה-\( a\in E \) שיוצר אותה.

בואו נשכח לרגע מרזולבנטה ונשאל שאלה כללית יותר בתורת גלואה: תהא \( E/F \) הרחבת גלואה ויהא \( a\in E \). מה ישכנע אותנו ש-\( E=F\left(a\right) \)? ובכן, הנה דבר אחד שיעבוד: נניח שלכל \( \sigma\in\text{Gal}\left(E/F\right) \) כך ש-\( \sigma\ne\text{id} \) מתקיים \( \sigma\left(a\right)\ne a \), כלומר \( a \) לא מקובע על ידי אף איבר לא טריוויאלי בחבורת הגלואה של \( E/F \). אני טוען שזה מספיק כדי להוכיח ש-\( E=F\left(a\right) \). למה? ובכן, \( F\left(a\right)\subseteq E \) תמיד, אבל על פי המשפט היסודי של תורת גלואה, \( \text{Gal}\left(E/F\left(a\right)\right) \) היא תת-חבורה של \( \text{Gal}\left(E/F\right) \). כל איבר של \( \text{Gal}\left(E/F\left(a\right)\right) \) מקבע את כל השדה \( F\left(a\right) \) ובפרט מקבע את \( a \), וכבר אמרנו שהאיבר היחיד שעושה זאת הוא \( \text{id} \). המסקנה היא ש-\( \text{Gal}\left(E/F\left(a\right)\right) \) היא החבורה הטריוויאלית מסדר 1, ולכן \( \left[E:F\left(a\right)\right]=1 \), כלומר \( E=F\left(a\right) \).

חזרה לרזולבנטה - מה שאני צריך לעשות הוא למצוא איברים \( a,\omega \) כך שהרזולבנטה \( \left(a,\omega\right) \) תקיים ש-\( \sigma^{k}\left(\left(a,\omega\right)\right)\ne\left(a,\omega\right) \) לכל \( 1\le k\le n-1 \). זה יוכיח ש-\( E=F\left(\left(a,\omega\right)\right) \), ובמקרה שלנו, אם אגדיר \( b=\left(a,\omega\right)^{n} \) אז \( b\in F \) ואני אקבל ש-\( E=F\left(\sqrt[n]{b}\right) \). מה שיסיים את ההוכחה.

על פניו לא מצפה לנו בעיה מהותית: ראינו כבר ש-\( \sigma^{k}\left(\left(a,\omega\right)\right)=\omega^{-k}\left(a,\omega\right) \), כך שכל מה שעלינו לעשות הוא לבחור את \( a,\omega \) כדי למנוע את האפשרות שיקרה משהו כזה, עבור \( 0\le k<t\le n-1 \):

\( \omega^{-k}\left(a,\omega\right)=\omega^{-t}\left(a,\omega\right) \)

יש שתי אפשרויות שעלולות לגרום לזה לקרות:

\( \omega \) אינו שורש יחידה פרימיטיבי מסדר \( n \), כלומר לא כל החזקות \( \omega^{0},\omega^{1},\omega^{2},\dots,\omega^{n-1} \) שונות זו מזו. אין כאן בעיה כי אני בוחר איזה \( \omega \) לקחת; אני כן אקח שורש יחידה פרימיטיבי.
\( \left(a,\omega\right)=0 \). בואו נדבר על זה.

האפשרות שיתקיים \( \left(a,\omega\right)=0 \) אינה מופרכת כלל. זה בהחלט קורה, למשל, אם \( a=1 \) ואז \( \left(a,\omega\right)=1+\omega+\dots+\omega^{n-1}=\frac{\omega^{n}-1}{\omega-1}=\frac{1-1}{\omega-1}=0 \). למעשה, אני הולך לגייס טיעון כבד משקל כדי לומר שקיים \( a \) עבורו זה לא קורה. אם נחשוב על זה לרגע, רזולבנטה היא צירוף לינארי של הפעלות של אברי גלואה על \( a \), כשהמקדמים של הצירוף הלינארי הזה הם החזקות של \( \omega \). אז בואו נשכח לרגע מ-\( a \) ונסתכל על צירוף לינארי של אוטומורפיזמים:

\( \sigma^{0}+\omega\sigma+\omega^{2}\sigma^{2}+\dots+\omega^{n-1}\sigma^{n-1} \)

העניין הוא שהוכחתי פה בעבר שאוטומורפיזמים של שדה הם בלתי תלויים לינארית (אפילו לא צריך הרחבת גלואה לשם כך). זה אומר ש-\( \sigma^{0}+\omega\sigma+\omega^{2}\sigma^{2}+\dots+\omega^{n-1}\sigma^{n-1}\ne0 \), כלומר קיים קלט לפונקציה-שהיא-סכום באגף שמאל שלא מאפס אותו. לקלט הזה אקרא \( a \), ואחרי שאני מציב אותו בסכום אני מקבל בדיוק את \( \left(a,\omega\right) \). זה מסיים את ההוכחה: \( \left(a,\omega\right) \) הוא האיבר שיוצר את \( E/F \).

האם זה מסיים את המשפט של גלואה? הו, אפילו לא קרוב.

הוכחת המשפט של גלואה

בואו נזכיר מה כבר הוכחנו, ומה אנחנו רוצים להוכיח. מה שכבר הוכחנו הוא שאם \( F \) הוא שדה ממציין 0 (אפשר גם מציינים אחרים מסויימים אבל נעזוב את זה) שכולל את כל שורשי היחידה מסדר \( n \), אז:

אם \( E/F \) הרחבת גלואה עם חבורת גלואה \( \mathbb{Z}_{n} \) אז \( E=F\left(\sqrt[n]{a}\right) \) עבור \( a\in F \).
אם \( E=F\left(\sqrt[n]{a}\right) \) עבור \( a\in F \) אז \( E/F \) הרחבת גלואה עם חבורת גלואה \( \mathbb{Z}_{d} \) כך ש-\( d|n \).

מה שאנחנו רוצים להוכיח הוא משפט שנוגע לפולינומים:

\( p\left(x\right) \) פתיר על ידי רדיקלים אם ורק אם חבורת הגלואה שלו פתירה.

נטפל בכל כיוון בנפרד. לאט מאוד ובזהירות מאוד.

ובכן, ראשית נניח ש-\( p\left(x\right) \) פתיר על ידי רדיקלים. זה אומר שלכל \( a \) בשדה הפיצול של \( p \) שמקיים \( p\left(a\right)=0 \), מתקיים ש-\( a\in E \) כך ש-\( E/F \) הרחבה רדיקלית. בשלב הראשון, נרצה להראות למה אפשר להניח ש-\( E/F \) גלואה עם חבורת גלואה פתירה. השלב הראשון הזה יהיה קשה למדי מבחינה טכנית, אז בואו לא נתייאש.

העובדה ש-\( E/F \) היא הרחבה רדיקלית אומרת לנו בדיוק את הדבר הבא: קיימת סדרת תת-שדות, \( F=E_{0}\subseteq E_{1}\subseteq E_{2}\subseteq\dots\subseteq E_{n}=E \), כך ש-\( E_{i+1}=E_{i}\left(\sqrt[k_{i}]{a_{i}}\right) \) עבור \( a_{i}\in E_{i} \). מה שאנחנו לא יודעים כרגע:

לא יודעים ש-\( E/F \) היא גלואה בכלל.
לא יודעים שב-\( E_{i} \) יש שורשי יחידה.
לא יודעים ש-\( E_{i+1}/E_{i} \) היא הרחבה עם חבורת גלואה ציקלית.

אנחנו לא יודעים את כל אלו כי הם לא בהכרח נכונים בכלל; אנחנו נרצה לקחת את סדרת ההרחבות הקיימת ולבנות מתוכה סדרה חדשה, טובה יותר, שכן תקיים את כל אלו. ראשית, ניקח סגור גלואה \( K/E \), כלומר את ההרחבה הקטנה ביותר של \( E \) שהיא גלואה מעל \( F \). עכשיו, אני ארצה להראות שגם \( K/F \) היא הרחבה רדיקלית. לצורך כך תהא \( G=\text{Gal}\left(K/F\right) \) ויהא \( \sigma\in G \) ונסתכל על סדרת ההרחבות שמתקבלת מ-\( E/F \) כש”מזיזים את הכל” בעזרת \( \sigma \): סדרת ההרחבות

\( F=\sigma\left(E_{0}\right)\subseteq\sigma\left(E_{1}\right)\subseteq\dots\subseteq\sigma\left(E_{n}\right)=\sigma\left(E\right) \)

אם \( E_{i+1}=E_{i}\left(\sqrt[k_{i}]{a_{i}}\right) \) אז \( \sigma\left(E_{i+1}\right)=\sigma\left(E_{i}\right)\left(\sigma\left(\sqrt[k_{i}]{a_{i}}\right)\right) \) ולכן גם הסדרה החדשה היא סדרת הרחבות רדיקליות פרימיטיביות ולכן \( \sigma\left(E\right)/F \) הוא אכן הרחבה רדיקלית. איך זה עזר לנו? כי עכשיו אפשר לקחת את הקומפוזיטום של כל השדות \( \sigma\left(E\right) \) כך ש-\( \sigma\in G \); הקומפוזיטום הזה הוא השדה הקטן ביותר שמכיל את כל ה-\( \sigma\left(E\right) \) הללו. מכיוון ש-\( K \) הוא השדה שמעליו מוגדרים כל האוטומורפיזמים \( \sigma \) הללו, הרי ש-\( K \) מכיל את כל ה-\( \sigma\left(E\right) \) הללו ולכן \( K \) מכיל את הקומפוזיטום. מצד שני, כל ה-\( \sigma \)-ות הללו הן אוטומורפיזמים של הקומפוזיטום (זה, כמובן, תרגיל לא טריוויאלי בפני עצמו) כך שגודל חבורת האוטומורפיזמים של הקומפוזיטום שמשמרים את \( F \) הוא לפחות המימד שלו מכל \( F \) - זה גורר שהוא חייב להיות שווה ל-\( K \) עצמו.

זה עדיין לא מסיים את השלב הזה, כי אני רוצה לומר ש-\( K \) הוא הרחבה רדיקלית, וכרגע ראיתי רק שהוא קומפוזיטום של הרחבות רדיקליות. מכיוון שלקחתי קומפוזיטום של מספר סופי של הרחבות, מספיק להסביר למה עובד עבור שתיים ומכאן להמשיך באינדוקציה. ובכן, בואו ניקח שתי הרחבות רדיקליות של שדה \( F \):

\( F=E_{0}\subseteq E_{1}\subseteq E_{2}\subseteq\dots\subseteq E_{n}=E \)

\( F=K_{0}\subseteq K_{1}\subseteq K_{2}\subseteq\dots\subseteq K_{m}=K \)

אני רוצה להראות ש-\( EK/F \) רדיקלית. ראשית, שימו לב לכך שאם אני מצרף את \( K_{1} \) לכל השדות בהרחבה הראשונה, עדיין קיבלתי הרחבה רדיקלית:

\( F\subseteq E_{0}K_{1}\subseteq E_{1}K_{1}\subseteq E_{2}K_{1}\subseteq\dots\subseteq E_{n}K_{1}=EK_{1} \)

זה עובד מהסיבה הבאה: \( E_{0}K_{1}/F \) זו פשוט ההרחבה \( K_{1}/F \) (הרי \( E_{0}=F\subseteq K_{1} \)) שאנחנו יודעים שהיא רדיקלית פרימיטיבית. כעת, \( E_{i+1}K_{1}/E_{i}K_{1} \) היא רדיקלית פרימיטיבית מאותה הסיבה ש-\( E_{i+1}/E_{i} \) היא כזו: \( E_{i+1}K_{1}=E_{i}K_{1}\left(\sqrt[k_{i}]{a_{i}}\right) \). כך זה ימשיך לעבוד לכל אורך סדרת השדות, ונקבל ש-\( EK_{1}/F \) היא רדיקלית. ואז נעשה את זה שוב, ונקבל ש-\( EK_{1}K_{2}=EK_{2} \) רדיקלית, וכן הלאה עד ל-\( EK/F \). זה מסיים, בנפנוף ידיים, את הטענה הבאה:

אם \( E/F \) הרחבה רדיקלית ניתן להניח שהיא גלואה.

עכשיו צריך לדבר על שורשי יחידה. כמקודם, מה שיש לנו כרגע הוא סדרה של הרחבות:

\( F=E_{0}\subseteq E_{1}\subseteq E_{2}\subseteq\dots\subseteq E_{n}=E \)

כל הרחבה מתקבלת מקודמתה על ידי הוספת שורש: \( E_{i+1}=E_{i}\left(\sqrt[k_{i}]{a_{i}}\right) \). מי שחשוב לי פה הוא ה-\( k_{i} \) - הסדר של השורש שהוספנו. כדי שהכל יתנהג נחמד בהמשך, אני אצטרך ש-\( F \) כבר יכיל את שורשי היחידה מסדר \( k_{i} \). אז אני אוסיף ל-\( F \) את שורשי היחידה מסדר \( k_{i} \) לכל \( k_{i} \) בסדרה (למשל, נוסיף את שורשי היחידה מסדר 3, 8 ו-11 אם ההרחבות בוצעו בעזרת \( \sqrt[3]{a_{1}} \) ו-\( \sqrt[8]{a_{2}} \) ו-\( \sqrt[11]{a_{3}} \)). ונקבל שדה חדש \( F^{\prime} \). ההרחבה \( F^{\prime}/F \) היא כמובן רדיקלית (היא התקבלה משרשרת של הוספת שורשים) ולכן נשאר להראות שההרחבה הבאה רדיקלית:

\( F^{\prime}=F^{\prime}E_{0}\subseteq F^{\prime}E_{1}\subseteq F^{\prime}E_{2}\subseteq\dots\subseteq F^{\prime}E_{n}=F^{\prime}E \)

הרדיקליות של ההרחבה נובעת מאותם טיעונים כמו קודם. מה שצריך להיזהר הוא שלא נאבד את זה שההרחבה היא גלואה; זה נובע מכך ש-\( F^{\prime}/F \) היא גלואה (כי \( F^{\prime} \) הוא שדה הפיצול של הפולינום ששורשיו הם כל שורשי היחידה הרלוונטיים) ומכך שקומפוזיטום של הרחבות גלואה הוא הרחבת גלואה (את זה הוכחתי בפוסט הקודם).

אז סיימנו את הטענה הבאה:

אם \( E/F \) רדיקלית אז אפשר להניח ש-\( E/F \) גלואה ו-\( F \) כולל את כל שורשי היחידה מהסדר שמתאים להרחבות הרדיקליות הפרימיטיביות ב-\( E/F \).

המסקנה היא שאם \( F=E_{0}\subseteq E_{1}\subseteq E_{2}\subseteq\dots\subseteq E_{n}=E \) היא סדרת ההרחבות הרלוונטית, אז \( E_{i+1}/E_{i} \) היא הרחבה ציקלית.

האם סיימנו? עדיין לא. מה שהוכחנו הוא שאם \( a \) הוא שורש כלשהו של הפולינום \( p\left(x\right) \) אז קיימת לו הרחבה רדיקלית עם התכונות היפות שתיארנו. אבל אנחנו רוצים הרחבה שתעבוד עבור כל השורשים של \( p\left(x\right) \) בו-זמנית. התעלול הוא שוב ביצוע קומפוזיטום של הרחבות באופן הדרגתי, כפי שתיארתי קודם, וזה באמת מסיים. אני יכול לטעון את הטענה הבאה:

אם \( p\left(x\right) \) פתיר על ידי רדיקלים אז קיימת הרחבת גלואה \( E/F \) שכוללת את כל שורשי \( p\left(x\right) \), וקיימת סדרת תת-שדות \( F=E_{0}\subseteq E_{1}\subseteq E_{2}\subseteq\dots\subseteq E_{n}=E \) כך שההרחבה \( E_{i+1}/E_{i} \) ציקלית לכל \( 0\le i<n \).

בואו נסמן \( G=\text{Gal}\left(E/F\right) \) ו-\( G_{i}=\text{Gal}\left(E/E_{i}\right) \). כלומר, קיבלנו סדרה של תת-חבורות \( \left\{ e\right\} =G_{n}\subseteq G_{n-1}\subseteq\dots\subseteq G_{0}=G \).

עכשיו, בואו וניזכר במשפט היסודי של תורת גלואה. המשפט הזה אומר לנו שעבור מגדל ההרחבות הבא:

\( E_{i}\subseteq E_{i+1}\subseteq E \)

מתקיים הקשר הבא בין חבורות הגלואה הרלוונטיות:

\( \text{Gal}\left(E_{i+1}/E_{i}\right)\cong\text{Gal}\left(E/E_{i}\right)/\text{Gal}\left(E/E_{i+1}\right)=G_{i}/G_{i+1} \)

מכיוון שבמקרה שלנו אנחנו יודעים ש-\( \text{Gal}\left(E_{i+1}/E_{i}\right) \) היא ציקלית, המסקנה היא ש-\( G_{i}/G_{i+1} \) היא ציקלית. כעת, הנה טענה שאני דוחה לפוסט הבא, כי היא טענה בתורת החבורות נטו:

אם \( G \) חבורה סופית אז \( G \) פתירה אם ורק אם קיימת סדרה של תת-חבורות \( \left\{ e\right\} =G_{0}\subseteq G_{1}\subseteq G_{2}\subseteq\dots\subseteq G_{n}=G \) כך ש-\( G_{i+1}/G_{i} \) ציקלית לכל \( 0\le i<n \) (שימו לב שהפכתי פה את האינדקסים).

אז נהדר! קיבלנו ש-\( G \) שלנו פתירה! האם סיימנו? ובכן לא!

המשפט שאני רוצה להוכיח הוא:

אם \( p\left(x\right) \) פתיר על ידי רדיקלים אז חבורת הגלואה של \( p\left(x\right) \) פתירה.

מה שהוכחתי כרגע היה:

אם \( p\left(x\right) \) פתיר על ידי רדיקלים אז שדה הפיצול של \( p\left(x\right) \) מוכל בשדה \( E \) כך ש-\( E/F \) הרחבת גלואה עם חבורת גלואה פתירה.

אנחנו רוצים להראות שזו חבורת הגלואה של שדה הפיצול שפתירה. שדה הפיצול הוא תת-שדה, \( F\subseteq K\subseteq E \), הוא לא בהכרח שווה ל-\( E \). בשלב הזה כבר מתחשק לי לבכות, אבל האמת היא שהמצב לא נורא במיוחד. אני יודע בזכות המשפט היסודי שש-\( \text{Gal}\left(K/F\right)\cong\text{Gal}\left(E/F\right)/\text{Gal}\left(E/K\right) \), ואני יודע ש-\( \text{Gal}\left(E/F\right) \) היא כן חבורה פתירה. כל מה שנשאר לי לעשות הוא לדחות לפוסט הבא את הוכחת הטענה

חבורת מנה של חבורה פתירה היא חבורת פתירה.

ועכשיו באמת סיימתי! כלומר, סיימתי כיוון אחד של ההוכחה. יש גם כיוון שני, קל יותר:

אם חבורת הגלואה של \( p\left(x\right) \) פתירה, אז \( p\left(x\right) \) פתיר על ידי רדיקלים.

ההוכחה מאוד מזכירה את הכיוון הקודם. נסמן את שדה הפיצול של \( p\left(x\right) \) בתור \( E \), אז ההרחבה \( E/F \) היא בעלת חבורת גלואה פתירה \( G \). תוך שימוש בטענה שחבורה סופית היא פתירה אם ורק אם קיימת שרשרת חבורות שמקיימת כך וכך, נקבל שיש \( \left\{ e\right\} =G_{n}\subseteq G_{n-1}\subseteq\dots\subseteq G_{0}=G \) כך ש-\( G_{i}/G_{i+1} \) ציקלית. עכשיו נגדיר את \( E_{i} \) להיות שדה השבת ב-\( E \) של \( G_{i} \), ונקבל סדרה של שדות \( F=E_{0}\subseteq E_{1}\subseteq\dots\subseteq E_{n}=E \) כמקודם. הדבר היחיד שמונע ממני להגדיר שזו שרשרת הרחבות רדיקלית היא העובדה שבשדות הללו לא בהכרח יש את שורשי היחידה המתאימים, אז מה שנעשה הוא לנקוט באותו תעלול כמו קודם - נרחיב את \( F \) על ידי הוספת כל שורשי היחידה הדרושים, ונקבל שדה \( F\subseteq F^{\prime} \), ושרשרת ההרחבות שלנו תיראה כעת כך:

\( F\subseteq E_{0}F^{\prime}\subseteq E_{1}F^{\prime}\subseteq\dots\subseteq E_{n}F^{\prime}=EF^{\prime} \)

כדי לסיים, צריך להשתכנע שכל ההרחבות הן עדיין הרחבות גלואה, ושחבורת הגלואה של כל זוג הרחבות ביניים היא עדיין ציקלית, ואז נוכל להשתמש במשפט שראינו קודם שמבטיח שכל הרחבה מתקבלת מקודמתה על ידי הוספת שורש.

זה נותן לנו מוטיבציה למשפט בסיסי בתורת גלואה שעד כה לא טרחתי להראות כי לא היה ברור למה הוא מעניין בכלל, והוא הולך כך: אם \( E/F \) היא הרחבת גלואה כלשהי, ו-\( F^{\prime}/F \) היא הרחבה (לאו דווקא גלואה) של שדה הבסיס, אז \( EF^{\prime}/F^{\prime} \) היא הרחבת גלואה, וחבורת גלואה שלה היא \( \text{Gal}\left(EF^{\prime}/F^{\prime}\right)\cong\text{Gal}\left(E/E\cap F^{\prime}\right) \). איך זה מועיל לנו? ובכן, במקרה שלנו זה אומר שיתקיים

\( \text{Gal}\left(E_{i+1}F^{\prime}/E_{i}F^{\prime}\right)\cong\text{Gal}\left(E_{i+1}/E_{i+1}\cap E_{i}F^{\prime}\right) \)

(כאן “שדה הבסיס” היה \( E_{i} \) וההרחבה שלו הייתה \( E_{i}F^{\prime} \); מכיוון ש-\( E_{i}\subseteq E_{i+1} \) אז הקומפוזיטום של \( E_{i+1} \) עם \( E_{i}F^{\prime} \) הוא פשוט \( E_{i+1}F^{\prime} \)).

עכשיו, החבורה \( \text{Gal}\left(E_{i+1}/E_{i+1}\cap E_{i}F^{\prime}\right) \) היא חבורת אוטומורפיזמים של \( E_{i+1} \) שמקבעים “קצת יותר מאשר את \( E_{i} \) בלבד”, כלומר תת-חבורה של \( \text{Gal}\left(E_{i+1}/E_{i}\right) \). מכיוון שאנחנו כבר יודעים ש-\( \text{Gal}\left(E_{i+1}/E_{i}\right) \) ציקלית, זה מוכיח שגם \( \text{Gal}\left(E_{i+1}F^{\prime}/E_{i}F^{\prime}\right) \) ציקלית (תת-חבורה של חבורה ציקלית היא ציקלית), מה שמסיים את ההוכחה עד כדי המשפט שטרם הוכחתי על כך ש-\( \text{Gal}\left(EF^{\prime}/F^{\prime}\right)\cong\text{Gal}\left(E/E\cap F^{\prime}\right) \).

אז בואו נוכיח את המשפט הזה ונסיים את הפוסט.

ראשית, להוכיח שאם \( E/F \) גלואה אז גם \( EF^{\prime}/F^{\prime} \) גלואה זה קל. לכאורה העובדה ש-\( F^{\prime}/F \) לא גלואה עלולה להקשות עלינו, אבל לא באמת. העובדה ש-\( E/F \) גלואה אומרת ש-\( E \) הוא שדה פיצול של פולינום \( p\left(x\right)\in F\left[x\right] \). אותו פולינום בדיוק הוא גם איבר של \( F^{\prime}\left[x\right] \) ושדה הפיצול שלו הוא \( EF^{\prime} \) (השדה שמתקבל מלקיחת כל האיברים של \( F^{\prime} \) ובנוסף השורשים של \( p\left(x\right) \)). החלק המעניין הוא להבין מהי חבורת הגלואה \( \text{Gal}\left(EF^{\prime}/F^{\prime}\right) \). כל איבר \( \sigma\in\text{Gal}\left(EF^{\prime}/F^{\prime}\right) \) הוא אוטומורפיזם של \( EF^{\prime} \), ואפשר לשאול את עצמנו מה קורה כשהוא מצומצם ל-\( E \), כלומר מה קורה עם \( \sigma|_{E} \). הפונקציה הזו היא פונקציה חח”ע מ-\( E \) לתוך \( EF^{\prime} \) - זה מה שנקרא שיכון. רק מה, כשהוכחנו את המשפט היסודי של תורת גלואה, ראינו שאם \( E/F \) גלואה, אז כל שיכון מתוך \( E \) שמשמר את \( F \) הוא בהכרח אוטומורפיזם של \( E \) (זה לא היה טריוויאלי לגמרי להוכחה). במקרה שלנו \( \sigma|_{E} \) משמר את \( F^{\prime} \) אז הוא בוודאי משמר גם את \( F \), ולכן הוא אוטומורפיזם של \( E \). אם כן, קיבלנו הומומורפיזם של חבורות \( \varphi:\text{Gal}\left(EF^{\prime}/F^{\prime}\right)\to\text{Gal}\left(E/F\right) \) שמוגדר על ידי \( \varphi\left(\sigma\right)=\sigma|_{E} \).

אני רוצה להראות שההתאמה הזו היא חח”ע, אז לשם כך בואו נבין מהו \( \ker\varphi=\left\{ \sigma\in\text{Gal}\left(EF^{\prime}/F^{\prime}\right)\ |\ \sigma|_{E}=\text{id}\right\} \). אני טוען שהאיבר היחיד ב-\( \ker\varphi \) יכול להיות אוטומורפיזם הזהות על \( EF^{\prime} \). למה? כי \( \sigma\in\ker\varphi \) אומר ש-\( \sigma \) הוא הזהות הן על השדה \( E \) והן על השדה \( F^{\prime} \) (כי \( F^{\prime} \) הוא שדה הבסיס בהרחבת הגלואה \( EF^{\prime}/F^{\prime} \) שמהחבורה שלה נלקח \( \sigma \)). אם הוא הזהות על שני השדות שמרכיבים את \( EF^{\prime} \) הוא חייב להיות הזהות על כל \( EF^{\prime} \), אחרת היינו מקבלים ששדה השבת שלו הוא תת-שדה ממש של \( EF^{\prime} \) שמכיל את \( E,F^{\prime} \), בסתירה למינימליות של \( EF^{\prime} \). זה מראה לנו ש-\( \varphi \) חח”ע. נשאר רק להשתכנע שהתמונה שלו היא בדיוק \( \text{Gal}\left(E/E\cap F^{\prime}\right) \).

בואו נסמן את התמונה ב-\( H \). זו חבורה של אוטומורפיזמים של \( E \), ולכן יש לה שדה שבת, \( E_{H} \), שאנחנו רוצים להשתכנע שהוא בדיוק \( E\cap F^{\prime} \). ההכלה \( E_{H}\supseteq E\cap F^{\prime} \) טריוויאלית: אנחנו יודעים שכל איבר של \( H \) הוא צמצום של אוטומורפיזם שהוא הזהות על כל \( F^{\prime} \); אז גם על האיברים של \( F^{\prime} \) שעדיין בתחום שלו אחרי שהצטמצמנו ל-\( E \) הוא עדיין יהיה הזהות, מה שאומר שהוא בוודאי הזהות על כל \( E\cap F^{\prime} \). הכיוון השני הוא המעניין יותר.

מכיוון ש-\( E_{H}\subseteq E \) באופן טריוויאלי, רק צריך להשתכנע ש-\( E_{H}\subseteq F^{\prime} \). כאן מגיע תעלול: נסתכל על הקומפוזיטום \( E_{H}F^{\prime} \). זה תת-שדה של \( EF^{\prime} \), ואנחנו יודעים שכל \( \sigma\in\text{Gal}\left(EF^{\prime}/F^{\prime}\right) \) משמרת אותו (שוב, כי היא הזהות על \( E_{H} \) ועל \( F^{\prime} \)). כלומר, \( E_{H}F^{\prime} \) משתמר על ידי כל חבורת הגלואה \( \text{Gal}\left(EF^{\prime}/F^{\prime}\right) \). אבל כבר ראינו שהרעיון בחבורת גלואה הוא שהשדה שהיא משמרת הוא בדיוק שדה הבסיס של ההרחבה, ולכן \( E_{H}F^{\prime}=F^{\prime} \). זה יכול לקרות אם ורק אם \( E_{H}\subseteq F^{\prime} \), מה שמסיים את ההוכחה.

דברי סיכום והסבר לאן פנינו מועדות

זהו! הוכחנו את המשפט הכבד ביותר שרציתי להוכיח בתורת גלואה! אבל האם הוכחתי כבר את עניין ה”אין פתרון על ידי רדיקלים למשוואה ממעלה חמישית ומעלה”? לא.

הוכחתי לעת עתה את המשפט “פולינום \( p\left(x\right) \) הוא פתיר על ידי רדיקלים אם ורק אם חבורת גלואה שלו פתירה”. זה המשפט המרכזי של גלואה והוא יפהפה, אבל כרגע עוד לא יישמתי אותו לשום מקרה מעשי. אני יכול לקחת פולינום ספציפי ממעלה חמישית, לחשב את חבורת הגלואה שלו, להוכיח שהיא לא פתירה ולסיים בזאת; אבל למען האמת, לטפל בפולינום כללי ממעלה חמישית ומעלה זה אפילו יותר פשוט, וגם יותר טוב לאינטואיציה (שכרגע אולי עדיין תוהה מה זה בעצם אומר, פולינום כללי). אז זה משהו שאטפל בו בהמשך, אחרי פוסט של תורת החבורות שיסביר לנו אחת ולתמיד את כל מה שאנחנו צריכים לדעת על חבורות פתירות בהקשר הזה. יהיה כיף.

נהניתם? התעניינתם? אם תרצו, אתם מוזמנים לתת טיפ: