המשפט היסודי של תורת גלואה

מה הולך כאן?

בשעה טובה הגענו אל אחת מאבני היסוד של האלגברה המופשטת - המשפט היסודי של תורת גלואה. כדי להבין מה המשפט אומר צריך להכיר את המושגים הבסיסיים שהוא מתעסק בהם - הרחבת שדות ואוטומורפיזמים של שדות והשדה שאוטומורפיזם משמר. מכירים? יופי, אז הנה המשפט:

תהא \( E/F \) הרחבת גלואה ו-\( G=\text{Gal}\left(E/F\right) \) חבורת הגלואה של ההרחבה. אז קיימת התאמה חד-חד-ערכית ועל בין שדות הביניים \( K \) המקיימים \( F\subseteq K\subseteq E \) ובין תתי-חבורות \( H\subseteq G \). ההתאמה מוגדרת כך: בכיוון אחד, בהינתן \( K \), היא מחזירה את כל האיברים של \( G \) שמשמרים את \( K \); בכיוון השני, בהינתן \( H \), היא מחזירה את כל האיברים של \( E \) שמשתמרים על ידי \( H \).

יותר מכך: ההתאמה שומרת על מבנה הסריג של תתי-השדות של \( E \) שמכילים את \( F \) ותתי-החבורות של \( G \), תוך שהיא הופכת את הסדר. כלומר, עבור תתי-שדות \( K_{1},K_{2} \) ותתי-החבורות שמתאימים להם \( H_{1},H_{2} \):

  • אם \( K_{1}\subseteq K_{2} \) אז \( H_{2}\subseteq H_{1} \).
  • תת-החבורה שמתאימה לשדה \( \left\langle K_{1},K_{2}\right\rangle \) שנוצר על ידי \( K_{1},K_{2} \) היא \( H_{1}\cap H_{2} \).
  • תת-החבורה שמתאימה לשדה \( K_{1}\cap K_{2} \) היא תת-החבורה \( \left\langle H_{1},H_{2}\right\rangle \) שנוצרת על ידי \( H_{1},H_{2} \).

יותר מכך: לכל \( F\subseteq K\subseteq E \) כזו אנחנו יודעים ש:

  • \( E/K \) הרחבת גלואה עם חבורת גלואה \( \text{Gal}\left(E/K\right)=H \). לכן בפרט \( \left[E:K\right]=\left|H\right| \) ו-\( \left[K:F\right]=\left|G:H\right| \) (האינדקס של \( H \) ב-\( G \)).
  • \( K/F \) היא הרחבת גלואה אם ורק אם \( H \) היא תת-חבורה נורמלית ב-\( G \) ובמקרה זה, \( \text{Gal}\left(K/F\right)\cong G/H \).

אני רוצה להסביר את הקטע עם הסריג קצת יותר בפירוט, אבל קודם - תמונות. כאן תמונה אחת באמת שווה אלף מילים.

\xymatrix{ & \mathbb{Q}\left(\sqrt{2},\sqrt{3}\right)\ar[dl]^{2}\ar[d]^{2}\ar[dr]^{2}\\ \mathbb{Q}\left(\sqrt{2}\right)\ar[dr]^{2} & \mathbb{Q}\left(\sqrt{6}\right)\ar[d]^{2} & \mathbb{Q}\left(\sqrt{3}\right)\ar[dl]^{2}\\ & \mathbb{Q}

\xymatrix{ & \left\{ e\right\} \ar[dl]^{2}\ar[d]^{2}\ar[dr]^{2}\\ \left\{ e,\left(1,0\right)\right\} \ar[dr]^{2} & \left\{ e,\left(1,1\right)\right\} \ar[d]^{2} & \left\{ e,\left(0,1\right)\right\} \ar[dl]^{2}\\ & \left\{ e,\left(1,0\right),\left(0,1\right),\left(1,1\right)\right\} }

מה אנחנו רואים פה? בתמונה הראשונה יש לנו את ההרחבה \( \mathbb{Q}\left(\sqrt{2},\sqrt{3}\right)/\mathbb{Q} \) (שדה הפיצול של הפולינום \( \left(x^{2}-2\right)\left(x^{2}-3\right) \) מעל \( \mathbb{Q} \) עם כל תת-השדות שלה. המספרים ליד החצים מתארים את המימדים של ההרחבות. למשל, \( \left[\mathbb{Q}\left(\sqrt{2},\sqrt{3}\right):\mathbb{Q}\left(\sqrt{6}\right)\right]=2 \).

בתמונה השניה יש לנו את החבורה \( \mathbb{Z}_{2}\times\mathbb{Z}_{2} \) עם כל תת-החבורות שלה. שימו לב שאני מצייר את החבורה ותתי-החבורות שלה בסדר הפוך: תת חבורה נמצאת מעל תתי-החבורות שהיא מוכלת בהן. גם המשמעות של המספרים השתנתה: אם יש לנו חץ מתת-החבורה \( H \) אל תת-החבורה \( G \) (כלומר, \( H\subseteq G \)) אז המספר הוא האינדקס של \( H \) ב-\( G \), מה שאני מסמן בתור \( \left|G:H\right| \) ושווה למספר הקוסטים של \( H \) ב-\( G \) ובמקרה שלנו, הסופי, גם פשוט ל-\( \frac{\left|G\right|}{\left|H\right|} \).

ברגע שבו הייתה לי הדיאגרמה הראשונה, היה קל לצייר את השניה - רק שיניתי את השמות של השדות כך שבמקומם יהיו תתי-חבורות מתאימות. את החצים עצמם והמספרים עליהם לא הייתי צריך לשנות. זו המהות של המשפט היסודי - המבנה של החצים (“סריג”, ועוד אסביר במפורש מהו בהמשך) הוא זהה לחלוטין עד כדי שינוי שמות - איזומורפי.

עוד דוגמא? עוד דוגמא. ראינו גם את עלילות שדה הפיצול של \( x^{3}-2 \). השורשים של הפולינום הזה היו \( \sqrt[3]{2},\omega\sqrt[3]{2},\omega^{2}\sqrt[3]{2} \), כאשר \( \omega=e^{\frac{2\pi i}{3}} \) הוא שורש יחידה פרימיטיבי מסדר 3 - מספר מרוכב שמקיים \( \omega^{3}=1 \) והחזקות שלו הן כל הפתרונות המרוכבים של המשוואה \( x^{3}=1 \). כל תמורה אפשרית של השורשים הללו נותנת אוטומורפיזם של שדה הפיצול, כך שחבורת הגלואה המתאימה היא \( S_{3} \) - חבורת כל התמורות על שלושה איברים. איך החבורה הזו נראית, אנחנו יודעים טוב: היא כוללת את תמורת היחידה \( e \), את החילופים \( \left(1\ 2\right),\left(1\ 3\right),\left(2\ 3\right) \) ואת המעגלים מאורך 3 \( \left(1\ 2\ 3\right) \) ו-\( \left(1\ 3\ 2\right) \). כל חילוף יוצר תת-חבורה מסדר 2 שכוללת את \( e \) ועצמו; התמורה \( \left(1\ 2\ 3\right) \) יוצרת תת-חבורה מסדר 3 שכוללת גם את \( \left(1\ 3\ 2\right) \); וזהו. אלו תתי-החבורות הלא טריוויאליות היחידות. אם מנסים למשל ליצור תת-חבורה מ-\( \left(1\ 2\right) \) ו-\( \left(1\ 3\right) \) אז המכפלה שלהם נותנת גם את \( \left(1\ 2\ 3\right) \) ו-\( \left(1\ 3\ 2\right) \) ומכאן כבר אפשר לקבל את כל \( S_{3} \). אם כן, את מבנה הסריג של \( S_{3} \) אפשר לצייר כך:

\xymatrix{ & \left\{ e\right\} \ar[ddl]^{3}\ar[d]^{2}\ar[dr]^{2}\ar[drr]\\ & \left\{ e,\left(1\ 2\right)\right\} \ar[dd]^{3} & \left\{ e,\left(1\ 3\right)\right\} \ar[ddl]^{3} & \left\{ e,\left(2\ 3\right)\right\} \ar[ddll]^{3}\\ \left\{ e,\left(1\ 2\ 3\right),\left(1\ 3\ 2\right)\right\} \ar[dr]^{2}\\ & S_{3} }

מה השדות שמשתמרים על ידי תת-החבורות המתאימות? ובכן, \( \left\{ e,\left(1\ 2\right)\right\} \) מחליפה שניים מהשורשים - נאמר ש”1” מתאר את \( \sqrt[3]{2} \) ואילו “2” מתאר את \( \omega\sqrt[3]{2} \), אז \( \left(1\ 2\right) \) מחליפה אותם ולא משנה את \( \omega^{2}\sqrt[3]{2} \), כך שנקבל את שדה השבת \( \mathbb{Q}\left(\omega^{2}\sqrt[3]{2}\right) \) ומשהו דומה יקרה עם שתי החבורות האחרות מסדר 2. ומה עם החבורה מסדר 3? היא כוללת תמורות שמזיזות את כל השורשים, אז אף שורש לא יהיה שייך לשדה השבת שלה. אם כך, מי כן יהיה שם? הנה תעלול שיאפשר לנו לראות את זה בקלות: התמורה \( \sigma=\left(1\ 2\ 3\right) \) מבצעת את הדברים הבאים:

\( \sigma\left(\sqrt[3]{2}\right)=\omega\sqrt[3]{2} \)

\( \sigma\left(\omega\sqrt[3]{2}\right)=\omega^{2}\sqrt[3]{2} \)

ולכן אם נחלק את האיברים הללו האחד בשני נקבל:

\( \sigma\left(\omega\right)=\sigma\left(\frac{\omega\sqrt[3]{2}}{\sqrt[3]{2}}\right)=\frac{\omega^{2}\sqrt[3]{2}}{\omega\sqrt[3]{2}}=\omega \)

באופן דומה, \( \tau=\left(1\ 3\ 2\right) \) מבצעת:

\( \tau\left(\sqrt[3]{2}\right)=\omega^{2}\sqrt[3]{2} \)

\( \tau\left(\omega\sqrt[3]{2}\right)=\sqrt[3]{2} \)

ולכן:

\( \tau\left(\omega\right)=\tau\left(\frac{\omega\sqrt[3]{2}}{\sqrt[3]{2}}\right)=\frac{\sqrt[3]{2}}{\omega^{2}\sqrt[3]{2}}=\omega^{-2}=\omega \)

המעבר האחרון נובע מכך ש-\( \omega^{3}=1 \).

אם כן, \( \omega \) בוודאי שייך לשדה ש-\( \left\{ e,\left(1\ 2\ 3\right),\left(1\ 3\ 2\right)\right\} \) משמרת. מכיוון שהפולינום המינימלי של \( \omega \) מעל \( \mathbb{Q} \) הוא \( x^{2}+x+1 \) (כי \( x^{3}-1=\left(x-1\right)\left(x^{2}+x+1\right) \)) אז מימד ההרחבה \( \mathbb{Q}\left(\omega\right)/\mathbb{Q} \) הוא 2, בהתאם לאינדקס של \( \left\{ e,\left(1\ 2\ 3\right),\left(1\ 3\ 2\right)\right\} \) ב-\( S_{3} \), כך שכבר ברור שזה כל שדה השבת, וקיבלנו את דיאגרמת השדות:

\xymatrix{ & \mathbb{Q}\left(\sqrt[3]{2},\omega\right)\ar[ddl]^{3}\ar[d]^{2}\ar[dr]^{2}\ar[drr]\\ & \mathbb{Q}\left(\omega^{2}\sqrt[3]{2}\right)\ar[dd]^{3} & \mathbb{Q}\left(\omega\sqrt[3]{2}\right)\ar[ddl]^{3} & \mathbb{Q}\left(\sqrt[3]{2}\right)\ar[ddll]^{3}\\ \mathbb{Q}\left(\omega\right)\ar[dr]^{2}\\ & \mathbb{Q} }

והמשפט היסודי של תורת גלואה גם מבטיח לנו שאלו כל שדות הביניים שיש. זו בעצם התכונה החשובה של המשפט היסודי: הוא הופך את הבעיה הקשה מאוד של מציאת שדות ביניים של הרחבות סופיות לבעיה הקצת פחות קשה של להבין את המבנה של חבורות סופיות.

עכשיו, תת-החבורה \( \left\{ e,\left(1\ 2\right)\right\} \) היא לא נורמלית ב-\( S_{3} \) (היא לא סגורה להצמדה; הצמדה של \( \left(1\ 2\right) \) מחזירה את \( \left(1\ 3\right) \) ו-\( \left(2\ 3\right) \)). זה אומר לנו שאם נסתכל על ההרחבה \( \mathbb{Q}\left(\omega^{2}\sqrt[3]{2}\right)/\mathbb{Q} \), היא לא תהיה הרחבת גלואה (וזה לא מפתיע - זו הרחבה שכוללת שורש אחד של הפולינום \( x^{3}-2 \) אבל לא את היתר). לעומת זאת, \( \left\{ e,\left(1\ 2\ 3\right),\left(1\ 3\ 2\right)\right\} \) כן נורמלית (היא מאינדקס 2; כל תת-חבורה מאינדקס 2 היא נורמלית) ואכן \( \mathbb{Q}\left(\omega\right)/\mathbb{Q} \) היא הרחבת גלואה (הרי היא שדה הפיצול של \( x^{2}+x+1 \) הספרבילי). בקיצור, נראה לי שהבנו - המשפט עובד!

בואו נסביר רק את הקטע של ה”סריג” הזה. המושג הבסיסי פה הוא קבוצה סדורה חלקית: זוג \( \left(P,\le\right) \) של קבוצה \( P \) ויחס בינארי \( \le \) מעליה הוא קבוצה סדורה חלקית אם \( \le \) הוא רפלקסיבי, טרנזיטיבי ואנטי-סימטרי. היחס \( \subseteq \) של שדות מקיים את זה, וגם \( \supseteq \) של חבורות מקיים את זה. ההיפוך של הסימון לא מקרי: במקרה של חבורות, אני אומר ש-\( G\le H \) אם ורק אם \( G\supseteq H \).

שתי קבוצות סדורות חלקית \( \left(P_{1},\le_{1}\right) \) ו-\( \left(P_{2},\le_{2}\right) \) הן איזומורפיות אם יש ביניהן העתקה חח”ע ועל \( f:P_{1}\to P_{2} \) כך ש-\( a\le b\iff f\left(a\right)\le f\left(b\right) \). המשמעות של איזומורפיזם כזה הוא ששתי הקבוצות הן אותו דבר בדיוק עד כדי שינוי שמות בכל הנוגע ליחסי הסדר בין האיברים שלהן. המשפט היסודי של תורת גלואה אומר (בין היתר) ששתי הקבוצות הסדורות שתיארתי - שדות ביניים של \( E/F \) עם הכלה רגילה, ותתי-חבורות של \( \text{Gal}\left(E/F\right) \) עם הכלה הפוכה - הן איזומורפיות. לכן הציור שלהן יהיה אותו הציור בדיוק.

ומה עניין ה”סריג” כאן? ובכן, סריג במתמטיקה זו מילה שמתארת כל מני דברים, ואחד מהם הוא קבוצה סדורה חלקית \( \left(P,\le\right) \) כך שלכל שני איברים \( a,b\in P \), לקבוצה \( \left\{ a,b\right\} \) יש חסם עליון וחסם תחתון. חסם עליון הוא איבר \( c \) כך ש-\( a\le c \) וגם \( b\le c \) (למי שמקיים את שני אלו קוראים חסם מלעיל של הקבוצה) וכמו כן לכל \( d \) שגם הוא חסם מלעיל, \( c\le d \). חסם תחתון זה אותו הדבר רק עם היפוך הכיוון של אי השוויונות. כדי שההגדרה הזו תהיה מעניינת בכלל צריך שיחס הסדר על \( P \) לא יהיה מלא - כלומר, שיהיו איברים \( a,b \) לא מתקיים לא \( a\le b \) וגם לא \( b\le a \) (כי אם למשל \( a\le b \) אז החסם העליון של \( \left\{ a,b\right\} \) הוא \( b \) והתחתון הוא \( a \)). הדוגמא הקלאסית לסריג היא המספרים הטבעיים עם יחס הסדר “\( a \) מחלק את \( b \)”. שם החסם העליון של כל זוג איברים הוא ה-\( \text{lcm} \) שלהם (הכפולה המשותפת המינימלית) והחסם התחתון הוא ה-\( \text{gcd} \) שלהם (המחלק המשותף המקסימלי).

במקרה שלנו, עבור שני שדות \( \left\{ K_{1},K_{2}\right\} \) ויחס ההכלה, החסם העליון הוא \( \left\langle K_{1},K_{2}\right\rangle \) והתחתון הוא \( K_{1}\cap K_{2} \), ועם חבורות זה ההפך כי יחס הסדר הוא הפוך. מכאן ברורה ההתאמה בין השניים: השדה שמתאים לחסם העליון של \( \left\{ K_{1},K_{2}\right\} \) צריך להתאים לחסם התחתון של \( \left\{ H_{1},H_{2}\right\} \) עבור החבורות המתאימות \( H_{1},H_{2} \).

ואיך מוכיחים את זה?

את רוב הרכיבים של ההוכחה כבר יש לנו, ורק החלק עם חבורת המנה יהיה קשה. נתחיל מההתאמה עצמה. אני לוקח הרחבת גלואה \( E/F \) ומסמן \( G=\text{Gal}\left(E/F\right) \). לכל תת-חבורה \( H\subseteq G \) אנחנו מתאימים את השדה \( \Psi\left(H\right)=\left\{ a\in E\ |\ \forall\sigma\in H:\sigma a=a\right\} \) שמשתמר על ידי \( H \). כבר ראינו שזה אכן שדה וש-\( F\subseteq\Psi\left(H\right)\subseteq E \), כך שיש לנו פונקציה מאוסף תת-החבורות של \( G \) אל אוסף שדות הביניים של \( E/F \).

בכיון השני, אנחנו לוקחים שדה ביניים \( F\subseteq K\subseteq E \) ומתאימים לו תת-חבורה \( \Phi\left(K\right)=\left\{ \sigma\in G\ |\ \forall a\in K:\sigma a=a\right\} \) של כל אברי \( G \) שמשמרים את כל \( K \). גם פה קל להשתכנע שזו תת-חבורה: אם \( \sigma a=a \) וגם \( \tau a=a \) אז \( \left(\sigma\tau\right)a=\sigma\left(\tau a\right)=\sigma a=a \) ו-\( \tau^{-1}a=\tau^{-1}\left(\tau a\right)=\left(\tau^{-1}\tau\right)a=a \), כך ש-\( \Phi\left(K\right) \) סגורה לכפל ולהופכי ולכן היא תת-חבורה. כעת הטענה היא ש-\( \Psi,\Phi \) הן הופכיות זו לזו, ולכן בפרט כל אחת מהן חד-חד-ערכית ועל.

בפוסט הקודם הראיתי שאם \( E \) הוא שדה ו-\( H \) היא תת-חבורה כלשהי של אוטומורפיזמים של \( E \) ואנחנו מסמנים \( K=\Psi\left(H\right) \), אז \( E/K \) היא הרחבת גלואה ו-\( \text{Gal}\left(E/K\right)=H \). הטענה הזו הגיעה בדם יזע דמעות ואלגברה לינארית. כעת, הייתי שמח לומר ש-\( \Phi\left(K\right)=\text{Gal}\left(E/K\right) \), מה שהיה מסיים את מה שאני צריך להראות פה, אבל צריך להיזהר: ההגדרה היבשה של \( \text{Gal}\left(E/K\right) \) היא בתור \( \left\{ \sigma\in\text{Aut}\left(E\right)\ |\ \forall a\in K:\sigma a=a\right\} \), ואילו \( \Phi\left(K\right)=\left\{ \sigma\in G\ |\ \forall a\in K:\sigma a=a\right\} \). רואים את ההבדל? ב-\( \text{Gal}\left(E/K\right) \) עלולים להיות עוד איברים שלא ב-\( \Phi\left(K\right) \) כי אולי יש לנו אוטומורפיזמים של \( E \) שמשמרים את \( K \) אבל לא שייכים ל-\( G \), כלומר לא משמרים את \( F \). אבל הרי \( F\subseteq K \) ולכן כל מי שמשמר את \( K \) משמר גם את \( F \) ושייך ל-\( G \), כך שכל הדקדוק הזה בקטנות נראה מיותר לגמרי - אבל אני רוצה שיהיה ברור שיש כאן משהו שצריך לומר.

יפה, אז ראינו ש-\( \Phi\left(\Psi\left(H\right)\right)=H \). צריך גם להראות את ההפך: \( \Psi\left(\Phi\left(K\right)\right)=K \) לכל \( F\subseteq K\subseteq E \). כאן קיימת סכנה: באופן כללי, אם \( G/F \) איננה הרחבת גלואה, בהחלט ייתכן ש-\( \Psi\left(\Phi\left(K\right)\right) \) יהיה שדה גדול יותר מ-\( K \) - זו הסיטואציה של “אין מספיק אוטומורפיזמים של \( E \) כדי לתפוס בדיוק את \( K \)”. בפוסט הקודם ראינו שלהגיד “הסיטואציה העגומה הזו לא מתרחשת” זה בדיוק להגיד שההרחבה שלנו היא הרחבת גלואה. נחדד:

\( E/K \) היא הרחבת גלואה אם ורק אם השדה ש-\( \text{Aut}\left(E/K\right) \) משמרת הוא \( K \).

במקרה שלנו, \( \Phi\left(K\right)=\text{Aut}\left(E/K\right) \) על פי הגדרה (אברי \( \Phi\left(K\right) \) הם איברים של \( G \), כלומר צריכים גם לשמר את \( F \), אבל מכיוון ש-\( F\subseteq K \) זה מתקיים תמיד). לכן לומר ש-\( E/K \) היא גלואה זה לומר ש-\( \Psi\left(\Phi\left(K\right)\right)=K \). אז הכיוון הזה של ההוכחה מצטמצם לטענה הבאה: אם \( E/F \) גלואה ו-\( F\subseteq K\subseteq E \) אז \( E/K \) גלואה. את זה אמרתי קודם, ב”יותר מכך” שבציטוט המשפט. אבל למה שזה יהיה נכון?

כאן נכנסת לתמונה העובדה שאנחנו מבינים הרחבות גלואה טוב מכמה כיוונים שונים. ראינו בפוסט הקודם ש-\( E/F \) היא גלואה אם ורק אם \( E \) היא שדה פיצול של פולינום ספרבילי \( p\left(x\right)\in F\left[x\right] \). העניין הוא שאותו פולינום בדיוק קיים גם מעל \( K\left[x\right] \). כלומר, אני יכול לקחת את \( p\left(x\right) \) כפי שהוא, לשכוח מקיומו של \( F \) ולומר “תכירו, הנה \( p\left(x\right)\in K\left[x\right] \), הוא פולינום ספרבילי מעל \( K \) ושדה הפיצול שלו הוא \( E \)”. שדה הפיצול של פולינום לא משתנה כשמשנים את השם של השדה שמכיל את המקדמים, כל עוד אלו בדיוק אותם מקדמים; הפולינום בוודאי לא יפסיק להיות ספרבילי פתאום. הדבר היחיד שעלול להשתנות כשמשנים את השדה הוא ש-\( p\left(x\right) \) פתאום יפסיק להיות אי-פריק (כפי ש-\( x^{3}-2 \) האי-פריק מעל \( \mathbb{Q} \) הופך פתאום מעל \( \mathbb{Q}\left(\sqrt[3]{2}\right) \) להיות פריק עם פירוק \( x^{3}-2=\left(x-\sqrt[3]{2}\right)\left(x^{2}+x\sqrt[3]{2}+\left(\sqrt[3]{2}\right)^{2}\right) \)). אלא ש”אי-פריק” זה לא משהו שנדרש מהפולינום כדי ששדה הפיצול שלו יהיה הרחבת גלואה, כך שזה לא רלוונטי. זה מסיים את השלב הזה של ההוכחה.

עד כה הראינו:

  1. קיימת התאמה חח"ע ועל \( \Phi \) בין שדות ביניים \( F\subseteq K\subseteq E \) ותתי-חבורות של \( \text{Gal}\left(E/F\right) \).
  2. אם \( K \) שדה ביניים שכזה אז \( E/K \) גלואה ו-\( \text{Gal}\left(E/K\right)=\Phi\left(K\right) \).

המסקנות המיידיות מ-2 הן שאם נסמן \( \Phi\left(K\right)=H \) אז \( \left[E:K\right]=\left|H\right| \) - זה נובע מכך שהרחבה היא גלואה אם ורק אם \( \left[E:K\right]=\left|\text{Aut}\left(E/K\right)\right| \) (זו ההגדרה המקורית שלנו להרחבת גלואה). מכיוון שאנחנו יודעים ש-\( \left[E:F\right]=\left[E:K\right]\left[K:F\right] \) (אחד המשפטים הבסיסיים בתורת השדות) ו-\( \left|G\right|=\left|G:H\right|\cdot\left|H\right| \) (אחד המשפטים הבסיסיים בתורת החבורות) ומכיוון ש-\( G=\text{Gal}\left(E/F\right) \) גלואה ולכן \( \left|G\right|=\left[E:F\right] \), נקבל ש-

\( \left|G:H\right|\cdot\left|H\right|=\left[E:K\right]\left[K:F\right] \)

ואחרי צמצום \( \left|H\right| \) משני האגפים (\( \left[E:K\right]=\left|H\right| \)) נקבל \( \left|G:H\right|=\left[K:F\right] \). זה היה ה”יותר מכך” הראשון בניסוח שנתתי למשפט.

חוב אחר שנשאר לי: להראות שאם \( K_{1}\subseteq K_{2} \) אז \( H_{2}\subseteq H_{1} \) (כאשר \( H_{i}=\Phi\left(K_{i}\right) \)). זה קל מאוד, כמובן: אם \( K_{1}\subseteq K_{2} \) אז כל אוטומורפיזם של \( E \) שמשמר את \( K_{2} \) חייב לשמר גם את \( K_{1} \), ולכן כל איבר של \( \text{Gal}\left(E/K_{2}\right) \) חייב להיות גם איבר של \( \text{Gal}\left(E/K_{1}\right) \) ולכן \( H_{2}=\text{Gal}\left(E/K_{2}\right)\subseteq\text{Gal}\left(E/K_{1}\right)=H_{1} \).

נשאר רק החלק שהבטחתי שיהיה כבד - להראות ש-\( K/F \) היא הרחבת גלואה אם ורק אם \( H \) היא תת-חבורה נורמלית ב-\( G \) ושבמקרה הזה, \( \text{Gal}\left(K/F\right)\cong G/H \).

כדי להבין אם \( K/F \) היא גלואה או לא, נרצה להבין האם \( \left|\text{Aut}\left(K/F\right)\right|=\left[K:F\right] \) או לא. מכיוון שכל המידע שיש לנו נוגע להרחבה “הגדולה” \( E/K \), אז כדי להבין את \( \text{Aut}\left(K/F\right) \) נרצה להסתכל על דרך לקשר אותה להרחבה הגדולה הזו. אז בואו ניקח \( \sigma\in\text{Gal}\left(E/F\right) \) וננסה להבין איך \( \sigma \) מתנהגת כשמצמצמים אותה ל-\( K \), מה שאני מסמן בתור \( \sigma|_{K} \). אני עדיין מקבל פונקציה חח”ע שהיא הומומורפיזם של שדות; התחום שלה הוא \( K \) והטווח שלה הוא \( E \), ואני גם יודע שעל \( F \) היא הזהות, אבל זה כל מה שאני יודע באופן כללי. פונקציה כזו איננה בהכרח אוטומורפיזם של \( K \); בשביל זה התמונה שלה הייתה צריכה להיות בדיוק כל \( K \). היא מה שנקרא שיכון של \( K \) בתוך \( E \) - הומומורפיזם חח”ע שהתמונה שלו היא עותק ש”נראה כמו” \( K \) בתוך \( E \) גם אם הוא לא זהה לו.

רוצים דוגמא? בטח. זוכרים את \( \mathbb{Q}\left(\sqrt[3]{2}\right) \) ו-\( \mathbb{Q}\left(\omega\sqrt[3]{2}\right) \)? אלו שני שדות שורש שונים של הפולינום \( x^{3}-2 \) מעל \( \mathbb{Q} \) והם בוודאי איזומורפיים, אבל הם שונים זה מזה. אני יכול לעבור מאחד לשני על ידי הפונקציה \( \sigma:\mathbb{Q}\left(\sqrt[3]{2}\right)\to\mathbb{Q}\left(\omega\sqrt[3]{2}\right) \) המוגדרת על ידי \( \sigma\left(\sqrt[3]{2}\right)=\omega\left(\sqrt[3]{2}\right) \) שעל כל \( \mathbb{Q} \) היא הזהות. אז \( \sigma\in\text{Gal}\left(E/F\right) \) כאשר \( E \) הוא שדה הפיצול של \( x^{3}-2 \), אבל התמונה שלה על \( K=\mathbb{Q}\left(\sqrt[3]{2}\right) \) היא לא \( K \) אלא עותק איזומורפי של \( K \) ששונה מ-\( K \). זה ההבדל בין שיכון ובין אוטומורפיזם.

אם תסתכלו על הדוגמא האחרת, של \( \mathbb{Q}\left(\sqrt{2},\sqrt{3}\right) \), תגלו ששם זה לא עובד - אין לנו שיכונים שאינם אוטומורפיזמים. \( \mathbb{Q}\left(\sqrt{2}\right) \) ו-\( \mathbb{Q}\left(\sqrt{3}\right) \) הם שדות לא איזומורפיים, כי באחד מהם יש פתרון למשוואה \( x^{2}-2 \) ובשני אין.

בשלב הזה אפשר אולי לנחש שכדי ש-\( K/F \) יהיה הרחבת גלואה, התנאי שנדרש מאיתנו הוא שכל שיכון יהיה אוטומורפיזם. כל שיכון של \( K \) שמשמר את \( F \), כלומר. בואו ניתן סימונים: \( \text{Emb}\left(K/F\right) \) תהיה קבוצת השיכונים של \( K \) שמשמרת את \( F \). אני אוכיח ש-\( \left|\text{Emb}\left(K/F\right)\right|=\left[K:F\right] \); מכיוון ש-\( \text{Aut}\left(K/F\right)\subseteq\text{Emb}\left(K/F\right) \) זה יגרור ש-\( K/F \) גלואה (כלומר, \( \left|\text{Aut}\left(K/F\right)\right|=\left[K:F\right] \)) אם ורק אם \( \text{Aut}\left(K/F\right)=\text{Emb}\left(K/F\right) \).

נתחיל מכך ששיכונים ב-\( \text{Emb}\left(K/F\right) \) לא יכולים להתפרע יותר מדי - כולם מתקבלים על ידי כך שאני לוקח איבר \( \sigma\in\text{Gal}\left(E/F\right) \) ופשוט מצמצם אותו ל-\( K \), כלומר \( \text{Emb}\left(K/F\right)=\left\{ \sigma|_{K}\ |\ \sigma\in\text{Gal}\left(E/F\right)\right\} \). כשאני מבצע את הצמצום הזה חלק מהאוטומורפיזמים של \( \text{Gal}\left(E/F\right) \) עשויים להצטמצם לאותו איבר - אבל נדבר על זה בהמשך. כרגע השאלה היא למה בכלל כל שיכון של \( K \) מתקבל בצורה כזו.

בשביל לענות על השאלה הזו צריך להיזכר במשפט שתיארתי בחטף כשדיברנו על שדות פיצול - שוב, אולי לא במפתיע, אחד מהמשפטים הטכניים ביותר בנושא. זה הלך כך: אם \( K_{1},K_{2} \) שדות עם איזומורפיזם \( \sigma:K_{1}\to K_{2} \), ואם \( p\left(x\right)\in K_{1}\left[x\right] \) הוא פולינום עם שדה פיצול \( E_{1} \) ואם נסמן את שדה הפיצול של \( \sigma\left(p\right) \) (הפולינום שמתקבל מ-\( p\left(x\right) \) על ידי הפעלת \( \sigma \) על המקדמים) ב-\( E_{2} \) אז קיים איזומורפיזם \( \tau:E_{1}\to E_{2} \) כך ש-\( \tau|_{K_{1}}=\sigma \). ההוכחה, כזכור, הייתה סוג של אינדוקציה שמתבססת על כך ש-\( E_{1} \) מתקבל מ-\( K_{1} \) על ידי שרשרת של הרחבות פשוטות.

במקרה שלנו \( K_{1} \) הוא פשוט \( K \) ואילו \( K_{2}=\sigma\left(K\right) \) - התמונה של \( K \) תחת השיכון \( \sigma \). מן הסתם \( \sigma \) הוא איזומורפיזם של שני השדות הללו כי ככה הוא נבחר מלכתחילה. כמו כן \( E_{1}=E \) הוא שדה הפיצול של פולינום ספרבילי \( p\left(x\right)\in F\left[x\right] \) - זו המשמעות של כך ש-\( E/F \) היא הרחבת גלואה. אם כן, מהו \( E_{2} \)? זה שדה הפיצול של הפולינום \( \sigma\left(p\right) \) מעל \( K_{2} \); אלא ש-\( \sigma\left(p\right)=p \) כי \( p \) הוא פולינום עם מקדמים ב-\( F \) - בדיוק השדה ש-\( \sigma \) משמר. לכן \( E_{2}=E_{1} \) ואנחנו מקבלים שאפשר להרחיב את \( \sigma \) לאוטומורפיזם \( \tau:E\to E \), כפי שרצינו.

הסברנו למה \( \text{Emb}\left(K/F\right)=\left\{ \sigma|_{K}\ |\ \sigma\in\text{Gal}\left(E/F\right)\right\} \); נשאיר להבין כמה איברים בדיוק יש ב-\( \text{Emb}\left(K/F\right) \). לצורך כך, בואו ניקח \( \sigma_{1},\sigma_{2}\in\text{Gal}\left(E/F\right) \) וננסה להבין מתי \( \sigma_{1}|_{K}=\sigma_{2}|_{K} \). זה קורה אם ורק אם \( \sigma_{1}\sigma_{2}^{-1}|_{K}=\text{Id}_{K} \), כלומר אם ורק אם \( \sigma_{1}\sigma_{2}^{-1}\in\text{Gal}\left(E/K\right) \). במילים אחרות: שני אוטומורפיזמים של \( E \) נותנים את אותו שיכון של \( K \) אם הם באותו קוסט של חבורת הגלואה של \( E/K \). אם ניקח נציג לכל קוסט, אז קבוצת הצמצומים של הנציגים הללו ל-\( K \) תיתן לנו את כל \( \text{Emb}\left(K/F\right) \) (כל איבר אחר של \( E/K \) נמצא באחד הקוסטים ולכן יתן את אותו שיכון כפי שהנציג שלו בקוסט נתן). כזכור, ראינו קודם ש-\( \left|G:H\right|=\left[K:F\right] \) כאשר \( H=\text{Gal}\left(E/K\right) \), והרי \( \left|G:H\right| \) הוא בדיוק מספר הקוסטים של \( H \) ב-\( G \). לכן קיבלנו ש-\( \left|\text{Emb}\left(K/F\right)\right|=\left[K:F\right] \), כמו שרצינו.

זה משאיר אותנו עם הטענה הבאה: \( K/F \) היא גלואה אם ורק אם כל שיכון של \( K \) ב-\( E \) שמשמר את \( F \) הוא למעשה אוטומורפיזם של \( K \) שמשמר את \( F \). כלומר, אם \( \sigma\in\text{Gal}\left(E/F\right) \) אז \( \sigma\left(K\right)=K \).

בואו נסמן \( K^{\prime}=\sigma\left(K\right) \). באילו סיטואציות \( K=K^{\prime} \)? ראינו קודם שהפונקציה \( \Phi \) שמקבלת תת-שדה של \( E \) ומחזירה את תת-החבורה של \( G \) שמשמרת אותו היא חד-חד-ערכית: כלומר, \( K=K^{\prime} \) אם ורק אם \( \Phi\left(K\right)=\Phi\left(K^{\prime}\right) \). בואו נסמן \( H=\Phi\left(K\right) \) ו-\( H^{\prime}=\Phi\left(K^{\prime}\right) \). נשאלת כעת השאלה: אם \( K^{\prime}=\sigma\left(K\right) \) אז מהי \( H^{\prime} \)? התשובה היא ש-\( H^{\prime}=\sigma H\sigma^{-1} \) - ההצמדה של \( H \) באמצעות \( \sigma \). זו דוגמא יפה מאוד לאופן שבו פעולת ההצמדה בחבורות היא רלוונטית לחיים, ליקום ובכלל.

התוצאה הזו כנראה לא מפתיעה אתכם אם אתם זוכרים אלגברה לינארית, כי יש שם משהו מאוד דומה: שתי מטריצות מייצגות את אותה העתקה לינארית בבסיסים שונים אם אחת מתקבלת מהשניה על ידי הצמדה, ובמקרה הזה המטריצה המצמידה היא מטריצת המעבר מאחד הבסיסים לשני. באנלוגיה הזו, השדות אצלנו הם ה”בסיסים” ואוטומורפיזמי הגלואה הם ה”מטריצות” שמייצגות את ההעתקה הלינארית.

בואו נוכיח ש-\( H^{\prime}=\sigma H\sigma^{-1} \); מספיק להראות את “ההפך”, כלומר את \( \sigma^{-1}H^{\prime}\sigma=H \), אז בואו נעשה את זה: \( \tau\in H^{\prime} \) אם ורק אם \( \tau\left(b\right)=b \) לכל \( b\in K^{\prime} \). מכיוון ש-\( K^{\prime}=\sigma\left(K\right) \) ו-\( \sigma \) חח”ע ועל, זה מתקיים אם ורק אם \( \tau\left(\sigma\left(a\right)\right)=\sigma\left(a\right) \) לכל \( a\in K \). כלומר, אם ורק אם \( \tau\sigma=\sigma \) מעל \( K \), כלומר אם ורק אם \( \sigma^{-1}\tau\sigma=\text{Id}_{K} \), כלומר אם ורק אם \( \sigma^{-1}\tau\sigma\in H \), כפי שרצינו.

לסיכום: קיבלנו ש-\( K/F \) גלואה אם ורק אם \( \sigma H\sigma^{-1}=H \) לכל \( \sigma\in G \) - זו בדיוק ההגדרה של תת-חבורה נורמלית (טוב, אחת מההגדרות). נשאר רק לדבר על המבנה של \( \text{Gal}\left(K/F\right) \) במקרה הזה. ובכן, הבה ונגדיר הומומורפיזם של חבורות באופן הבא: \( \varphi:G\to\text{Gal}\left(K/F\right) \) מוגדר על ידי \( \varphi\left(\sigma\right)=\sigma|_{K} \). לא קשה לבדוק ישירות שזה אכן הומומורפיזם. מה הגרעין שלו? \( \sigma|_{K}=\text{Id}_{K} \) אם ורק אם \( \sigma\in\text{Gal}\left(E/K\right)=H \). לכן נקבל ממשפט האיזומורפיזם הראשון של חבורות ש-\( G/H\cong\text{Gal}\left(K/F\right) \) - בדיוק מה שרצינו.

אתם יכולים לשאול את עצמכם, ובצדק, איפה בשלב האחרון של ההוכחה, עם משפט האיזומורפיזם הראשון, השתמשנו בכך ש-\( H \) נורמלית. הרי \( H \) יוצאת נורמלית מכך שהיא הגרעין של \( \varphi \) שאני בונה שם. ובכן, אם \( H \) לא הייתה נורמלית, אז \( \varphi \) לא הייתה מוגדרת היטב; הטווח שלה הוא \( \text{Gal}\left(K/F\right) \) אבל כפי שראינו, אם \( H \) לא נורמלית לא מובטח ש-\( \varphi\left(\sigma\right)=\sigma|_{K} \) יהיה אוטומורפיזם של \( K \); הוא יכול להיות “סתם” שיכון.

זה מסיים את הוכחת המשפט היסודי של תורת גלואה, ובעצם מביא אותנו לסוג של נקודת שיא בסדרת הפוסטים שלנו על אלגברה מופשטת. אפשר לכאורה לעצור כאן, אבל זו למעשה הנקודה הכי גרוע לעצור בה. תורת גלואה לא נוצרה סתם בשביל היופי של לראות את הדמיון בין שדות וחבורות. היא נוצרה כדי להתמודד עם בעיות מתמטיות קונקרטיות, ואנחנו נראה דוגמאות לכך בפוסטים הבאים.


נהניתם? התעניינתם? אם תרצו, אתם מוזמנים לתת טיפ:

Buy Me a Coffee at ko-fi.com