מבוא לתורת גלואה

בשעה טובה הגענו עם סדרת הפוסטים שלי על אלגברה מופשטת אל מה שהוא כנראה השיא של המבוא לתחום הזה, כמו גם אחת מהמוטיבציות המקוריות לקיומו - תורת גלואה. הרעיון בתורת גלואה הוא לקחת את תורת השדות ותורת החבורות, לשים אותן במאיץ חלקיקים, לגרום להן להתנגש ולבדוק מה קורה, וזה מרהיב למדי.

בפוסט הזה נציג את המושגים הבסיסיים, אבל לפני שנגיע לפורמליזם שלהם אני רוצה לתת דוגמת צעצוע. זו דוגמא טריוויאלית מאוד ולא כל כך מעניינת מבחינת מה שתורת גלואה אומרת לנו, אבל יש לה יתרון אדיר - אנחנו כבר מכירים אותה טוב, אולי אפילו מבית הספר. הדוגמא הזו היא מה שנקרא צמוד מרוכב.

דוגמא: צמוד מרוכב

ה”עולם” שלנו כרגע הוא שדה המספרים המרוכבים, \( \mathbb{C} \). זה שדה שנבנה איכשהו מתוך שדה המספרים הממשיים \( \mathbb{R} \) באופן הבא: מוסיפים ל-\( \mathbb{R} \) איבר חדש שנקרא \( i \) והוא שורש של \( x^{2}+1 \) (כלומר, \( i^{2}=-1 \)) ואז “סוגרים” את \( \mathbb{R} \) בהתאם; כלומר, \( \mathbb{C} \) הוא מה שקראתי לו שדה שורש של \( x^{2}+1 \) או, בניסוח שקול, הוא ההרחבה הפשוטה \( \mathbb{C}=\mathbb{R}\left(i\right) \). המסקנה בפועל היא ש-\( \mathbb{C}=\left\{ a+bi\ |\ a,b\in\mathbb{R}\right\} \), כלומר כל מספר מרוכב אפשר להציג בתור \( z=a+bi \) כאשר \( a,b \) הם ממשיים (ומסמנים לפעמים \( z=\text{Re}z \) ו-\( b=\text{Im}z \)). ואז, ברוב ההצגות של מספרים מרוכבים, אחרי שנותנים את ההגדרות הללו מספרים על עוד משהו שנקרא “צמוד מרוכב”. אם \( z=a+bi \) הוא מספר מרוכב אז הצמוד שלו \( \overline{z} \) מוגדר כך: \( \overline{z}=a-bi \). כלומר, שינינו את הסימן של המקדם של \( i \) והשארנו את היתר ללא שינוי. אם חושבים על מספרים מרוכבים בתור יצורים שחיים במישור, אז לקחת צמוד זה כמו לשקף ביחס לציר \( x \). עכשיו אני רוצה לסכם כמה תכונות של הצמוד שגם אותם רואים בדרך כלל די מהר:

\( \overline{\overline{z}}=z \)
\( \overline{z_{1}+z_{2}}=\overline{z_{1}}+\overline{z_{2}} \)
\( \overline{z_{1}\cdot z_{2}}=\overline{z_{1}}\cdot\overline{z_{2}} \)
\( z=\overline{z} \) אם ורק אם \( z\in\mathbb{R} \)
אם \( p\left(x\right)\in\mathbb{R}\left[x\right] \) הוא פולינום במקדמים ממשיים ו-\( z\in\mathbb{C} \) מקיים \( p\left(z\right)=0 \), אז גם \( p\left(\overline{z}\right)=0 \).
\( z\cdot\overline{z}=\left|z\right|^{2} \)
\( z+\overline{z}=2\text{Re}z \)

תכונה 1 אומרת שהצמוד הוא פונקציה הפיכה מ-\( \mathbb{C} \) לעצמו. תכונות 2 ו-3 אומרות שהפונקציה הזו היא הומומורפיזם של שדות. להומומורפיזם חח”ע ועל משדה לעצמו קוראים אוטומורפיזם של השדה; מה שאנחנו רואים כאן הוא שהצמדה היא אוטומורפיזם של המרוכבים. תכונה 4 מעניינת כי היא מכניסה למשחק את הממשיים: אנחנו רואים שהצמדה משמרת את הממשיים, במובן זה שעל כל מספר ממשי היא פועלת כמו פונקציית הזהות. יותר מכך, אנחנו רואים שאפשר לאפיין את הממשיים בצורה הזו: הממשיים הם בדיוק קבוצת כל האיברים של \( \mathbb{C} \) שאוטומורפיזם ההצמדה משמר.

תכונה 5 היא מעניינת במיוחד; היא אומרת שאם יש לנו פולינום מעל \( \mathbb{R} \), הצמדה מבצעת מעין פרמוטציה של השורשים שלו. לדוגמא, אם נסתכל על הפולינום \( p\left(x\right)=x^{2}-2x+5 \) נגלה שהשורשים שלו הם \( 1+2i \) ו-\( 1-2i \), והצמדה מחליפה ביניהם: מעבירה את \( 1+2i \) אל \( 1-2i \) וההפך.

בגלל שזה יהיה רלוונטי מאוד להמשך, בואו ניזכר איך מוכיחים את התכונה הזו: אם \( p\left(x\right)=a_{n}x^{n}+\dots+a_{1}x+a_{0} \) הוא פולינום עם מקדמים ממשיים ו-\( p\left(z\right)=0 \), זה אומר שמתקיים \( 0=a_{n}z^{n}+\dots+a_{1}z+a_{0} \). עכשיו אפשר להפעיל צמוד על שני האגפים: אם נשתמש בכללים 2 ו-3 של הצמוד כדי “לפתוח” את הצמוד שמופעל על כל אגף ימין, נקבל:

\( \overline{0}=\overline{a_{n}}\overline{z}^{n}+\dots+\overline{a_{1}}\overline{z}+\overline{a_{0}} \)

אם נשתמש עכשיו בתכונה מספר 4 הן על ה-0 באגף שמאל והן על המקדמים של הפולינום באגף ימין (ההנחה הייתה שהם ממשיים) נקבל:

\( 0=a_{n}\overline{z}^{n}+\dots+a_{1}\overline{z}+a_{0}=p\left(\overline{z}\right) \)

בהוכחה הזו השתמשנו בתכונות 2,3 של הצמוד ובחצי מתכונה 4 - בחצי שאומר שאם \( z\in\mathbb{R} \) אז \( \overline{z}=z \), כלומר בטענה שהצמוד משמר את \( \mathbb{R} \) (אבל לא בטענה שהצמוד מאפיין את \( \mathbb{R} \)). לכן אותה הוכחה בדיוק תעבוד עבור כל אוטומורפיזם של המרוכבים שמשמר את \( \mathbb{R} \). זה קורה בפרט עבור הפולינום \( x^{2}+1 \) שהוא זה שייצר את \( \mathbb{C} \) מלכתחילה והשורשים שלו הם \( i \) ו-\( -i \); המסקנה היא שאם \( \varphi:\mathbb{C}\to\mathbb{C} \) הוא אוטומורפיזם כלשהו של המרוכבים שמשמר את \( \mathbb{R} \) אז \( \varphi\left(i\right)=i \) או \( \varphi\left(i\right)=-i \). אין דרך אחרת. כעת, \( \varphi\left(a+bi\right)=\varphi\left(a\right)+\varphi\left(b\right)\varphi\left(i\right)=a+b\varphi\left(i\right) \) ומכאן שההתנהגות של האוטומורפיזם על כל \( \mathbb{C} \) נקבעת על פי מה שהוא עושה ל-\( i \); קיבלנו שיש בסך הכל שני אוטומורפיזמים של \( \mathbb{C} \) שמשמרים את \( \mathbb{R} \) והם הזהות (\( \varphi\left(z\right)=z \)) וההצמדה (\( \varphi\left(z\right)=\overline{z} \)). עם הידיעה הזו, תכונות 6 ו-7 ניתנות לתיאור טיפה שונה ממה שהתרגלנו אליו: הערך \( z\cdot\overline{z} \) הוא מה שמקבלים אם לוקחים את \( z \), מפעילים על \( z \) את כל האוטומורפיזמים של \( \mathbb{C} \) שמשמרים את \( \mathbb{R} \) ואז כופלים את כל התוצאות שקיבלנו; ואילו \( z+\overline{z} \) הוא מה שמקבלים כשעושים את אותו דבר רק שבסוף מחברים את כל התוצאות במקום לכפול. שתי הפעולות הללו של להפעיל את כל האוטומורפיזמים ואז לכפול/לחבר נותנות את מה שנקרא בתורת השדות הנורמה והעקבה של איבר.

ההגדרה הכללית

ההגדרות הכלליות לא יהיו שונות מהותית ממה שכבר ראינו. אם \( F \) הוא שדה כלשהו, אז הומומורפיזם חח”ע ועל \( \sigma:F\to F \) נקרא אוטומורפיזם של \( F \). מסמנים את אוסף כל האוטומורפיזמים של \( F \) ב-\( \text{Aut}\left(F\right) \), וקל לראות שזו חבורה כאשר הפעולה היא הרכבת פונקציות: העובדה שכל איבר של \( \text{Aut}\left(F\right) \) הוא חח”ע ועל מראה שיש לנו הופכי לכל איבר בקבוצה הזו, איבר היחידה הוא אוטומורפיזם הזהות, \( \text{Id}\left(x\right)=x \), ואסוציאטיביות נובעת מכך שהרכבת פונקציות באופן כללי היא אסוציאטיבית. כדי לפשט סימונים, בדרך כלל במקום לכתוב \( \sigma\left(\alpha\right) \) אני פשוט אכתוב \( \sigma\alpha \); זה מועיל כדי לחסוך סוגריים בביטויים שבהם כבר יש מראש יותר מדי כאלו.

עד כאן הכל טוב ויפה, אבל \( \text{Aut}\left(F\right) \) היא לא באמת האובייקט שמעניין אותנו. \( \text{Aut}\left(\mathbb{C}\right) \), למשל, היא חבורה ענקית. כזכור, בתורת השדות האובייקט המרכזי שמעניין אותנו הוא לא שדה בודד, אלא הרחבה של שדות, אז בואו ניקח הרחבה \( E/F \), ונסתכל על אותם אוטומורפיזמים של \( E \) שבנוסף לכך משמרים את \( F \). כלומר, נסתכל על הקבוצה \( \text{Aut}\left(E/F\right)\triangleq\left\{ \sigma\in\text{Aut}\left(E\right)\ |\ \forall\alpha\in F:\sigma\alpha=\alpha\right\} \). גם הקבוצה הזו היא חבורה, ומהווה תת-חבורה של \( \text{Aut}\left(E\right) \).

התוצאה הראשונה שאפשר לומר על \( \text{Aut}\left(E/F\right) \) היא מה שראינו עבור מרוכבים: אם \( p\left(x\right)\in F\left[x\right] \) הוא פולינום עם מקדמים מעל השדה שהאוטומורפיזמים משמרים, ואם \( p\left(\alpha\right)=0 \) אז גם \( p\left(\sigma\alpha\right)=0 \) לכל \( \sigma\in\text{Aut}\left(E/F\right) \); האוטומורפיזם \( \sigma \) מבצע פרמוטציה על השורשים של \( p\left(x\right) \). כדי לראות את זה, בואו נסמן \( p\left(x\right)=a_{n}x^{n}+\dots+a_{1}x+a_{0} \), אז

\( 0=a_{n}\alpha^{n}+\dots+a_{1}\alpha+a_{0} \)

ועל ידי הפעלת \( \sigma \) על שני האגפים נקבל

\( 0=\sigma\left(a_{n}\right)\left(\sigma\alpha\right)^{n}+\dots+\sigma\left(a_{1}\right)\sigma\alpha+\sigma\left(a_{0}\right) \)

נשתמש בכך ש-\( \sigma \) משמרת את אברי \( F \) ונקבל

\( 0=a_{n}\left(\sigma\alpha\right)^{n}+\dots+a_{1}\sigma\alpha+a_{0}=p\left(\sigma\alpha\right) \)

הרעיון הזה, של הסתכלות על הפרמוטציות של השורשים של פולינומים היה במקור של לגראנז’, אבל הוא לא לקח אותו רחוק מספיק; מי שבאמת הבין מה לעשות איתו היה גלואה, כשהאבחנה המכרעת שלו הייתה שאפשר לקחת פרמוטציות שונות של שורשים של פולינומים ולהרכיב אותן כדי לקבל פרמוטציה חדשה - שלפרמוטציות יש את מה שאנחנו קוראים לו כיום מבנה של חבורה. זו הייתה נקודה מכרעת בהתפתחות הן של תורת השדות והן של תורת החבורות - בהגזמה פרועה אפשר אפילו לומר שזו הייתה הלידה שלהן (אחרי הריון ארוך ופורה לכשעצמו).

עכשיו אפשר להסביר את הרעיון הבסיסי מאחורי תורת גלואה. עד כה בדיון שלי על הרחבת שדות, היה דבר אחד שנמנעתי לגמרי מלעסוק בו: אם \( E/F \) היא הרחבת שדות, אילו שדות ביניים יש בהרחבה הזו? כלומר, אילו שדות \( K \) קיימים כך ש-\( F\subseteq K\subseteq E \)? זו שאלה דומה לשאלה “בהינתן חבורה \( G \), מהן תת-החבורות שלה”; מה שתורת גלואה אומרת היא שזה לא סתם דומה אלא שבמקרים מסויימים זה אותו הדבר בדיוק. ראינו שבהינתן הרחבת שדות \( E/F \) אפשר להתאים לה חבורה \( \text{Aut}\left(E/F\right) \). המשפט היסודי של תורת גלואה אומר שאם \( E/F \) מקיימת תנאי מסויים שאתאר עוד מעט (אבל הוא נפוץ למדי) יש התאמה חח”ע ועל בין תת-החבורות של \( \text{Aut}\left(E/F\right) \) ובין שדות הביניים של \( E/F \). ההתאמה נתונה בצורה הפשוטה הבאה: אם \( F\subseteq K\subseteq E \) אז ל-\( K \) מותאמת תת-החבורה \( H\subseteq\text{Aut}\left(E/F\right) \) של כל האוטומורפיזמים ב-\( \text{Aut}\left(E/F\right) \) שמשמרים את השדה \( K \); ובכיוון השני, בהינתן תת-חבורה \( H\subseteq\text{Aut}\left(E/F\right) \) אפשר לקבל שדה \( F\subseteq K\subseteq E \) אם מסתכלים על קבוצת האיברים ב-\( E \) שמשתמרים על ידי כל אברי \( H \). זה משפט יפהפה, ועדיין לא תיארתי את הפרטים שלו במלואם, אבל נחכה איתו לפוסט הבא; כדי להוכיח אותו אנחנו צריכים להבין את הסיטואציה טוב יותר.

השאלה הבסיסית היא - מה עשוי להשתבש בהרחבה \( E/F \) שבגללה המשפט היסודי לא יעבוד? ובכן, הרעיון במשפט היסודי הוא ש-\( \text{Aut}\left(E/F\right) \) היא “עשירה” מספיק - כוללת מספיק איברים כדי שתתי- החבורות שלה יתאימו בדיוק לכל שדות הביניים של \( E/F \). אבל לפעמים קורה אסון והחבורה \( \text{Aut}\left(E/F\right) \) היא קטנה מדי; חסרים אוטומורפיזמים כדי שהעסק יעבוד. כפי שנראה בהמשך, התכונה שנדרשת כדי שהמשפט היסודי יתקיים עבור הרחבות סופיות היא ש-\( \left|\text{Aut}\left(E/F\right)\right|=\left[E:F\right] \) - שהגודל של חבורת האוטומורפיזמים הזו יהיה שווה למימד של ההרחבה. במקרה שבו התנאי הזה מתקיים אומרים ש-\( E/F \) היא הרחבת גלואה ומסמנים את \( \text{Aut}\left(E/F\right) \) בסימון \( \text{Gal}\left(E/F\right) \) וקוראים לה חבורת גלואה של ההרחבה \( E/F \). יש כאן עניין טרמינולוגי קטן: יש מקומות שקוראים בשם “חבורת גלואה” ל-\( \text{Aut}\left(E/F\right) \), בין אם \( E/F \) היא הרחבת גלואה ובין אם לאו. אני אישית מחבב את ההפרדה הזו בין \( \text{Aut}\left(E/F\right) \) שהוא סימון שבו משתמשים תמיד, ובין \( \text{Gal}\left(E/F\right) \) שמרמז על תכונה נחמדה שיש לחבורה הזו.

דוגמא

כבר ראינו דוגמא אחת להרחבת גלואה: \( \mathbb{C}/\mathbb{R} \). במקרה הזה \( \text{Aut}\left(\mathbb{C}/\mathbb{R}\right) \) כללה שני איברים - אוטומורפיזם הזהות, ואוטומורפיזם ההצמדה; ואכן \( \left[\mathbb{C}:\mathbb{R}\right]=2 \). העניין הוא שזו לא הרחבת גלואה מעניינת במיוחד כי אין שדות ביניים לא טריוויאליים פה בכלל. לחבורת הגלואה יש שתי תת-חבורות: או החבורה כולה, שהשדה שהיא משמרת הוא \( \mathbb{R} \), או החבורה הטריוויאלית שכוללת רק את אוטומורפיזם הזהות שהשדה שהיא משמרת הוא \( \mathbb{C} \). אז יופי, ראינו איך יש כאן התאמה בין תתי החבורות ובין שדות הביניים בהרבה, אבל קשה לומר שזה היה מרשים.

אז כדי שהסיטואציה לא תהיה משעממת, כדאי לקחת הרחבה קצת יותר מתוחכמת. הדוגמא הקלאסית מתבססת על הפולינום \( p\left(x\right)=\left(x^{2}-2\right)\left(x^{2}-3\right) \) מעל \( \mathbb{Q} \). שדה הפיצול שלו הוא ההרחבה \( \mathbb{Q}\left(\sqrt{2},\sqrt{3}\right) \), שבתורו מתקבל בתור הרחבה פשוטה של הרחבה פשוטה, כשבכל אחד מהמקרים הפולינום המינימלי הוא ממעלה 2. כלומר \( \left[\mathbb{Q}\left(\sqrt{2},\sqrt{3}\right):\mathbb{Q}\right]=4 \) ולכן התקווה שלנו היא שבחבורת האוטומורפיזמים יהיו ארבעה איברים.

מכיוון ש-\( \mathbb{Q}\left(\sqrt{2},\sqrt{3}\right) \) נוצרת על ידי \( \mathbb{Q} \) - שכל איבר בחבורת הגלואה אמור לשמר - ועל ידי \( \sqrt{2},\sqrt{3} \) הרי שכל אוטומורפיזם בחבורת האוטומורפיזמים נקבע באופן יחיד על ידי הפעולה שלו על \( \sqrt{2} \) ו-\( \sqrt{3} \). אנחנו יודעים שכל אוטומורפיזם כזה אמור לבצע פרמוטציה של השורשים של \( p\left(x\right)=\left(x^{2}-2\right)\left(x^{2}-3\right) \), אבל למעשה הוא מוגבל יותר מכך. אי אפשר להעביר את השורש \( \sqrt{2} \) לשורש \( \sqrt{3} \) של הפולינום, למשל. למה? כי אוטומורפיזם שמשמר את \( \mathbb{Q} \) אמור לבצע פרמוטציה גם על השורשים של \( x^{2}-2 \), כלומר להחליף את \( \sqrt{2} \) אך ורק בעצמו או ב-\( -\sqrt{2} \), ובדומה גם עבור \( \sqrt{3} \). ה”לקח” פה הוא שמה שבאמת מעניין אותנו כשמדברים על פרמוטציה של השורשים של פולינום הוא שהפולינום יהיה אי-פריק; אחרת אפשר לקחת פירוק שלו ולדבר על פרמוטציית שורשים של כל איבר בפירוק.

בואו נסמן ב-\( \sigma \) את האוטומורפיזם שמקיים \( \sigma\left(\sqrt{2}\right)=-\sqrt{2} \) ו-\( \sigma\left(\sqrt{3}\right)=\sqrt{3} \) ואילו ב-\( \tau \) את האוטומורפיזם שמקיים \( \tau\left(\sqrt{2}\right)=\sqrt{2} \) ו-\( \tau\left(\sqrt{3}\right)=-\sqrt{3} \). האוטומורפיזמים הנוספים הם הזהות \( e \) והאוטומורפיזם \( \sigma\tau \). קיבלנו חבורה \( G \) בת ארבעה איברים שאיזומורפית ל-\( \mathbb{Z}_{2}\times\mathbb{Z}_{2} \) - מה שנקרא חבורת קליין. אנחנו יודעים בדיוק מהן תת-החבורות של \( G \):

\( G,\left\{ e\right\} ,\left\{ e,\sigma\right\} ,\left\{ e,\tau\right\} ,\left\{ e,\tau\sigma\right\} \)

מה השדות שמתאימים לכל תת-חבורה? ובכן, עבור \( G \) השדה המתאים הוא \( \mathbb{Q} \) כי \( \sigma\in G \) לא משמרת את \( \sqrt{2} \) ואילו \( \tau\in G \) לא משמר את \( \sqrt{3} \) ולכן אף איבר שכולל אותם לא ישתמר. בדומה, עבור \( \left\{ e\right\} \) נקבל את השדה \( \mathbb{Q}\left(\sqrt{2},\sqrt{3}\right) \). שדות הביניים ממש הם עסק יותר מעניין. עבור \( \left\{ e,\sigma\right\} \), מי שמשתמר הוא השדה שנוצר על ידי \( \mathbb{Q} \) ו-\( \sqrt{3} \), כלומר \( \mathbb{Q}\left(\sqrt{3}\right) \). בדומה \( \left\{ e,\tau\right\} \) מתאים ל-\( \mathbb{Q}\left(\sqrt{2}\right) \). עד כאן זה לא מפתיע במיוחד, אבל מה עם \( \left\{ e,\tau\sigma\right\} \)?

לכאורה \( \tau\sigma \) לא משמרת שום דבר ב-\( \mathbb{Q}\left(\sqrt{2},\sqrt{3}\right) \) מלבד \( \mathbb{Q} \), אבל חשיבה קצרה מראה שזה לא נכון. מה זה \( \mathbb{Q}\left(\sqrt{2},\sqrt{3}\right) \)? זה שדה שמורכב מכל הפולינומים באיברים \( \sqrt{2},\sqrt{3} \), כולל פולינומים שבהם שני אלו מופיעים ביחד, כשהם מוכפלים. כלומר, השדה מורכב גם מ-\( \sqrt{2}\cdot\sqrt{3}=\sqrt{6} \). ומכיוון ש-\( \tau\sigma\left(\sqrt{6}\right)=\tau\sigma\left(\sqrt{2}\cdot\sqrt{3}\right)=\left(-\sqrt{2}\right)\left(-\sqrt{3}\right)=\sqrt{6} \) קיבלנו ששדה הביניים השלישי יהיה \( \mathbb{Q}\left(\sqrt{6}\right) \) שעד כה לא הזכרתי פה בכלל.

בפוסט הקודם שלי כשדיברתי על בניית סגורים אלגבריים, אמרתי שיש לנו בעיה סתם לקחת שדות פיצול לכל הפולינומים האפשריים ולאחד אותם, כי יש קשרים אלגבריים בין איברים של שדות פיצול של פולינומים שונים. הנה לנו דוגמא פשוטה: אם יש לנו שדה שכולל שדה פיצול עבור \( x^{2}-2 \) וכולל שדה פיצול עבור \( x^{2}-3 \), אז יכלל בו איבר שהוא שורש של הפולינום הלכאורה-לא-קשור \( x^{2}-6 \) - השורש הזה הוא מכפלה של השורשים של שני הפולינומים האחרים. אמרתי אז שצריך יהיה משהו שידע לעקוב אחרי הקשרים האלגבריים הללו, שעשויים להיות מורכבים למדי, ואת בניית הסגור האלגברי עשיתי בדרך אחרת. ובכן, חבורת הגלואה היא בדיוק מה שיודע לעקוב אחרי הקשרים המורכבים למדי הללו, שמתבטאים במבנה של תת-השדות של ההרחבה. במקרה שלנו, החבורה פשוטה למדי וגם מבנה ההרחבות פשוט למדי, אבל באופן כללי חבורות סופיות יכולות להיות יצורים מאוד מסובכים; זוכרים את הקושי של מיון חבורות לא אבליות?

האם אני יכול לתת דוגמא להרחבה שאיננה הרחבת גלואה? בוודאי. בואו נסתכל על הפולינום \( p\left(x\right)=x^{3}-2 \). יש לו שלושה שורשים, שאחד מהם ממשי ושני האחרים מרוכבים. אם אני אגדיר \( \omega=e^{\frac{2\pi i}{3}} \) אז נקבל ש-\( \omega^{0},\omega^{1},\omega^{2} \) הם שלושת הפתרונות של המשוואה \( x^{3}=1 \) מעל המרוכבים, והשורשים של \( p\left(x\right) \) יהיו \( \omega^{k}\sqrt[3]{2} \) עבור \( 0\le k\le2 \). שדה הפיצול של הפולינום הזה, אם כן, הוא ההרחבה \( \mathbb{Q}\left(\omega,\sqrt[3]{2}\right) \). שדה הפיצול הזה הוא כן הרחבת גלואה, אבל אפשר להסתכל על חלק משדות הביניים שלו. למשל, השדה \( \mathbb{Q}\left(\omega\right) \). גם השדה הזה הוא הרחבת גלואה של \( \mathbb{Q} \) ואפילו אחת חשובה מאוד (מה שנקרא הרחבה ציקלוטומית ונדבר עליה בהמשך). אז מה לא גלואה? ההרחבה הזו: \( \mathbb{Q}\left(\sqrt[3]{2}\right)/\mathbb{Q} \). ולמה היא לא גלואה? ראשית, הפולינום המינימלי של \( \sqrt[3]{2} \) מעל \( \mathbb{Q} \) הוא \( p\left(x\right)=x^{3}-2 \) עצמו (כי הוא אי-פריק מעל \( \mathbb{Q} \)) ולכן \( \left[\mathbb{Q}\left(\sqrt[3]{2}\right):\mathbb{Q}\right]=3 \). מצד שני, אילו אוטומורפיזמים של \( \mathbb{Q}\left(\sqrt[3]{2}\right)/\mathbb{Q} \) כבר יש לנו? אוטומורפיזם כזה חייב לשלוח את \( \sqrt[3]{2} \) לשורש של \( p\left(x\right) \), אבל השורש היחיד ב-\( \mathbb{Q}\left(\sqrt[3]{2}\right) \) זה \( \sqrt[3]{2} \) עצמו; השורשים האחרים לא שם. לכן יש לנו רק אוטומורפיזם אחד: \( \left|\text{Aut}\left(\mathbb{Q}\left(\sqrt[3]{2}\right)/\mathbb{Q}\right)\right|=1 \), וקיבלנו הרחבה שאינה הרחבת גלואה (בהמשך, כשנלמד על המשפט היסודי של תורת גלואה, נראה שאפשר להסיק את העובדה שזו לא הרחבת גלואה מכך שחבורת הגלואה של \( \mathbb{Q}\left(\omega,\sqrt[3]{2}\right)/\mathbb{Q} \) היא החבורה הסימטרית \( S_{3} \) שאינה אבלית ויש לה תתי-חבורות לא נורמליות, שבתורן מתאימות להרחבות שאינן הרחבות גלואה).

הבעיה של ההרחבה הזו הייתה שהיו “חסרים לנו שורשים” של הפולינום שבו השתמשנו כדי לבנות אותה. חוסר בשורשים גורר חוסר באוטומורפיזמים, מה שמוביל להרחבה שאיננה גלואה. נראה שהפתרון כאן הוא פשוט “להרחיב עוד קצת” - לקחת את שדה הפיצול, וזה גם נכון: אפשר להוכיח (ואעשה זאת פחות או יותר בפוסט הבא) שהרחבה סופית \( E/F \) היא הרחבת גלואה אם ורק אם \( E \) הוא שדה פיצול של פולינום ספרבילי מעל \( F \). מה זה “ספרבילי”? זה אומר שאין לו שורש מרובה, אבל זה מצדיק דיון נפרד שאיתו אסגור עכשיו את הפוסט הזה. השורה התחתונה היא שדרישת הספרביליות הזו רלוונטית רק למקרים שככל הנראה כמעט ולא אדבר עליהם; היא לא רלוונטית לא להרחבות של \( \mathbb{Q} \) או כל שדה אחר ממציין 0, וגם לא להרחבות של שדות סופיים. רק להרחבות של שדות אינסופיים ממציין שונה מאפס. ועדיין, הגיע הזמן לדבר קצת על זה, בין היתר כי זה מאפשר לנו להציג כמה דברים מגניבים.

פולינומים ספרביליים

פולינום הוא ספרבילי אם אין לו שורש מריבוי גדול מ-1. מה זה אומר, ריבוי של שורש? פשוט מאוד: כתבו את הפולינום בתור מכפלה של גורמים מהצורה \( \left(x-a\right) \) ותבדקו אם יש גורם כזה שמופיע פעמיים או יותר. למשל: \( x^{2}-2=\left(x-\sqrt{2}\right)\left(x+\sqrt{2}\right) \) הוא פולינום ספרבילי - לשני השורשים שלו יש ריבוי 1. אבל בואו נעלה את הפולינום הזה בריבוע ונקבל

\( x^{4}-2x^{2}+4=\left(x-\sqrt{2}\right)\left(x-\sqrt{2}\right)\left(x+\sqrt{2}\right)\left(x+\sqrt{2}\right) \) והנה קיבלנו פולינום לא ספרבילי.

הסיבה האינטואיטיבית שבגללה אנחנו צריכים פולינום ספרבילי שמשדה הפיצול שלו תתקבל ההרחבה שלנו כדי שההרחבה תהיה גלואה היא שאם פולינום הוא לא ספרבילי, זה אומר שיש שורש ש”סתם מנפח את המעלה” של הפולינום - הוא מגדיל את המעלה שלו, אבל לא מוסיף לנו שורשים חדשים ולכן לא מגדיל את כמות האוטומורפיזמים שתעמוד לרשותנו. האם זה מנפח גם את מימד ההרחבה שלנו? כמעט תמיד לא. שדה הפיצול של \( x^{4}-2x^{2}+4 \) הוא \( \mathbb{Q}\left(\sqrt{2}\right) \); אותו שדה פיצול בדיוק כמו זה של \( x^{2}-2 \) שהוא כן ספרבילי. אז גם אם אני אקח פולינום לא ספרבילי ואסתכל על שדה הפיצול שלו, זה לא אומר בהכרח שאותו שדה לא יכול להתקבל בדרך אחרת בעזרת פולינום ספרבילי. מה שאנסה לשכנע אתכם בו עכשיו הוא שצריכות להיות נסיבות מיוחדות יחסית כדי שניתקל בפולינום לא ספרבילי שאי אפשר “לפשט” כדי לקבל את אותו שדה פיצול.

אבל נתחיל, כמובן, מדוגמא. יחסית לכך שאני צריך לייצר נסיבות מוזרות עבורה, היא די פשוטה. הנסיבות המוזרות הן, כפי שהזכרתי קודם, שדה ממציין שאינו 0 ואיננו סופי. המציין הפשוט ביותר שאיננו 0 הוא \( 2 \), אז בואו ניקח הרחבה אינסופית של \( \mathbb{F}_{2}=\left\{ 0,1\right\} \). איך בונים הרחבה אינסופית כזו? מוסיפים איבר טרנסנדנטי \( t \), כלומר מסתכלים על השדה \( \mathbb{F}_{2}\left(t\right) \). שאבריו הם פונקציות רציונליות ב-\( t \) עם מקדמים שהם 0 או 1 וחיבור וכפל מקדמים הוא מודולו 2. מעל השדה הזה אסתכל על הפולינום שהשורש המרובה שלו הוא \( \sqrt{t} \), שכמובן לא נכלל בשדה. כלומר, אני מסתכל על הפולינום \( x^{2}-t \) ששייך לחוג הפולינומים \( \mathbb{F}_{2}\left(t\right)\left[x\right] \) (אני מקווה שהשימוש גם ב-\( t \) וגם ב-\( x \) לא מבלבל). זה בבירור כן פולינום לא ספרבילי, כי \( x^{2}-t=\left(x-\sqrt{t}\right)^{2} \), מה שנובע מכך שבשדה ממציין 2, \( \sqrt{t} \) ו-\( -\sqrt{t} \) הם אותו איבר בדיוק. מצד שני, אני לא יכול “לפשט” את הפולינום הזה ולהסתכל על \( x-\sqrt{t} \), כי הפולינום הזה לא שייך ל-\( \mathbb{F}_{2}\left(t\right)\left[x\right] \); הוא כולל את המקדם \( \sqrt{t} \) שלא שייך ל-\( \mathbb{F}_{2}\left(t\right) \).

בואו נעבור עכשיו להבין למה הסיטואציה הזו לא יכולה להתרחש מעל שדה ממציין 0 ומה הקריטריון הכללי שמונע ממנה להתרחש, גם מעל שדות סופיים וגם מעל חלק מהשדות האינסופיים ממציין שונה מאפס.

הדבר הראשון והמגניב שאני רוצה לדבר עליו הוא קריטריון מאוד פשוט שמאפשר לנו לזהות מתי פולינום הוא ספרבילי ומתי לא, גם בלי למצוא את השורשים שלו בכלל. פורמלית, אם \( p\left(x\right)\in F\left[x\right] \) הוא פולינום עם מקדמים ב-\( F \), הקריטריון שאציג יאפשר לנו לבדוק אם \( p\left(x\right) \) ספרבילי באמצעות ביצוע אך ורק פעולות חשבון שמערבות פולינומים מעל השדה \( F \) ולא שדה הרחבה כלשהו של \( F \) (למשל, אם כל מה שאנחנו יודעים לעשות הוא חשבון ב-\( \mathbb{Q} \) ולא להתעסק עם שורשים, אז השיטה תאפשר לנו לבדוק עבור כל פולינום מעל \( \mathbb{Q} \) אם הוא ספרבילי, אפילו שאין לנו דרך טובה למצוא את השורשים שלו או לעשות חשבון מעבר ל-\( \mathbb{Q} \)).

הקריטריון משתמש בפונקציה פשוטה למדי, שלוקחת פולינום אחד ומחזירה פולינום אחר. בואו נקרא לפונקציה הזו \( D_{x}:F\left[x\right]\to F\left[x\right] \). אם אני אבחר את \( D_{x} \) בצורה חכמה, אני אקבל שהשאלה אם \( p\left(x\right) \) הוא ספרבילי שקולה לשאלה האם המחלק המשותף המקסימלי של \( p \) ושל \( D_{x}\left(p\right) \) הוא 1; אם כן, \( p \) ספרבילי, ואחרת \( p \) אינו ספרבילי. אז \( D_{x} \) אני אגדיר בתור פונקציה \( F \)-לינארית שמקיימת \( D_{x}\left(x^{n}\right)\triangleq nx^{n-1} \). דהיינו:

\( D_{x}\left(a_{n}x^{n}+\dots+a_{1}x+a_{0}\right)=na_{n}x^{n-1}+\dots+2a_{2}x+a_{1} \)

נראה מוכר? אני בטוח שנראה מוכר לרובכם - זה נראה בדיוק כמו הנוסחה של נגזרת של פולינום. אבל נגזרת היא מושג מחדו”א; הוא מוגדר מעל השדה \( \mathbb{R} \) ושדות דומים לו, ומתבסס חזק על תכונת הרציפות של \( \mathbb{R} \) ועל מושג הגבול. אני מתעסק כאן באלגברה ולכן “לא מכיר” את המושג הזה; פשוט הגדרתי פונקציה שלוקחת פולינום ומחזירה פולינום, כפי שכמובן מותר לי לעשות. כמובן, אני משחק איתכם כרגע בהעמדת פנים פורמליסטית; הרי ברור לי וברור לכם שזו בדיוק נגזרת “אמיתית” ומכאן יש לנו אינטואיציה לכך שהיא אמורה לקיים גם את החוקים הרגילים שמקיימת נגזרת אמיתית. ספציפית, שיתקיים:

\( D_{x}\left(p+q\right)=D_{x}\left(p\right)+D_{x}\left(q\right) \)
\( D_{x}\left(pq\right)=D_{x}\left(p\right)q+pD_{x}\left(q\right) \)
\( D_{x}\left(p\left(q\left(x\right)\right)\right)=D_{x}\left(p\right)\left(q\left(x\right)\right)D_{x}\left(q\right) \)

את שתי התכונות הללו אפשר להוכיח ישירות מההגדרה של \( D_{x} \), בלי להסתמך על טיעונים בסגנון “בנגזרות של חדו”א זה עובד”. בואו נפעיל את זה עכשיו על פולינום \( p \) עם שורש \( a \). פולינום כזה אפשר לכתוב בתור \( p\left(x\right)=\left(x-a\right)^{n}g\left(x\right) \) כאשר \( n \) הוא הריבוי של \( a \) ואילו \( g\left(x\right) \) הוא פולינום ש-\( a \) אינו שורש שלו. נגזור על פי הנוסחאות למעלה ונקבל:

\( D_{x}\left(p\right)=n\left(x-a\right)^{n-1}g\left(x\right)+\left(x-a\right)^{n}D_{x}\left(g\left(x\right)\right) \)

אם \( a \) מריבוי גדול מ-1, כלומר \( n>1 \), קיבלנו ש-\( D_{x}\left(p\right) \) הוא מהצורה \( \left(x-a\right) \) כפול משהו, ולכן בוודאי של-\( p,D_{x}\left(p\right) \) יהיה מחלק משותף מקסימלי גדול מ-1 - הוא יתחלק ב-\( \left(x-a\right) \). אז ראינו את הכיוון שאם \( p \) לא ספרבילי, אז יש לו ול-\( D_{x}\left(p\right) \) מחלק משותף גדול מ-1. בכיוון השני, אם יש להם מחלק משותף כזה, אז כל שורש שלו הוא שורש של שניהם. בואו נניח ש-\( a \) הוא שורש משותף כזה, כלומר \( p\left(a\right)=D_{x}\left(p\right)\left(a\right)=0 \) ונוכיח ש-\( a \) הוא שורש מריבוי גדול מ-1. מכיוון ש-\( a \) שורש של \( p \) אפשר לכתוב \( p=\left(x-a\right)g\left(x\right) \), לגזור ולקבל \( D_{x}\left(p\right)=g\left(x\right)+\left(x-a\right)D_{x}\left(g\right) \), וכעת אפשר להציב \( a \) בתוך \( D_{x}\left(p\right) \); אנחנו אמורים לקבל 0, ולכן יש לנו את המשוואה

\( 0=g\left(a\right)+0\cdot D_{x}\left(g\right)\left(a\right) \)

כלומר קיבלנו ש-\( a \) הוא שורש גם של \( g\left(x\right) \) ומכאן שזה שורש מרובה (כי \( p\left(x\right)=\left(x-a\right)g\left(x\right) \)), מה שמסיים את ההוכחה.

עכשיו אפשר לנצל את הכלי שרכשנו זה עתה כדי להראות שכל מני פולינומים הם ספרביליים. נתחיל מכך שכל פולינום אי-פריק מעל שדה ממציין 0 הוא ספרבילי. הרעיון טריוויאלי: המעלה של \( D_{x}\left(p\right) \) קטנה ב-1 מהמעלה של \( p \) ולכן, אלא אם \( D_{x}\left(p\right) \) הוא פולינום האפס, המחלק המשותף המקסימלי שלו ושל \( p \) חייב להיות ממעלה קטנה מזו של \( p \), אבל מכיוון ש-\( p \) אי-פריק, המחלק היחיד שלו ממעלה קטנה ממנו הוא 1.

אם \( D_{x}\left(p\right) \) הוא כן פולינום האפס, אז אוטומטית המחלק המשותף המקסימלי שלו ושל \( p \) הוא \( p \) עצמו והכל קורס, רק שזה לא יכול לקרות אם אנחנו במציין אפס, כי המקדם המוביל של \( D_{x}\left(p\right) \) הוא \( na_{n} \), ובשדה ממציין 0 הביטוי הזה תמיד שונה מאפס (אם נחזור אל \( x^{2}-t \) מעל \( \mathbb{F}_{2} \), שם הנגזרת אכן יוצאת אפס, מה שמסביר למה הפולינום לא ספרבילי).

ומה קורה בשדות ממציין שונה מאפס? כאן נצטרך להשתמש בתעלול שונה. ראשית, בואו ננסה להבין למה הדוגמא של \( x^{2}-t \) לא עובדת אם אנחנו מעל שדה סופי. הנה דוגמא לשדה עם ארבעה איברים: ניקח את הפולינום \( x^{2}+x+1 \) שקל לבדוק שהוא אי-פריק מעל \( \mathbb{F}_{2} \) כי אין לו שורש, ונבנה לו שדה שורש, \( \mathbb{F}_{2}\left(\theta\right)=\left\{ a+\theta b\ |\ a,b\in\mathbb{F}_{2}\right\} \), כאשר \( \theta \) מקיים את המשוואה האלגברית \( \theta^{2}=\theta+1 \) (זכרו, מעל \( \mathbb{F}_{2} \) מינוס ופלוס הם אותו דבר). מה קורה עכשיו עם הפולינום \( x^{2}-\theta \)? אפשר לכתוב אותו בתור \( \left(x-\sqrt{\theta}\right)^{2} \) כך שהוא לא ספרבילי, אבל הוא גם לא אי-פריק מעל \( \mathbb{F}_{2}\left(\theta\right) \), מהטעם הפשוט שמתקיים

\( \left(\theta+1\right)^{2}=\theta^{2}+1=\theta \)

כלומר, האיבר שאנחנו מסמנים בתור \( \sqrt{\theta} \) הוא בסך הכל \( \theta+1 \), שכבר שייך ממילא ל-\( \mathbb{F}_{2}\left(\theta\right) \). זו סיטואציה שונה מזו שהייתה קודם, שבה \( \sqrt{t} \) לא היה שייך לשדה שמעליו עבדנו.

לב ההבדל בין שני המקרים הוא שבמקרה הנוכחי יצא ש-\( \theta \) היא חזקה שניה של איבר מתוך \( \mathbb{F}_{2}\left(\theta\right) \). אני טוען שמשהו דומה קורה באופן כללי, ומוכיח שפולינומים אי-פריקים הם ספרביליים באופן כללי: אם \( \mathbb{F} \) הוא שדה סופי ממציין \( p \), אז לכל איבר \( a\in\mathbb{F} \) קיים איבר \( b\in\mathbb{F} \) כך ש-\( b^{p}=a \). התכונה הזו לבדה תספיק לנו, אז אפשר לתת לה שם מיוחד: שדה \( \mathbb{F} \) (לאו דווקא סופי) ממציין \( p \) הוא שדה מושלם (Perfect Field) אם כל איבר ב-\( \mathbb{F} \) הוא חזקה \( p \)-ית של איבר אחד ב-\( \mathbb{F} \). כמו כן נכניס שדות ממציין 0 פנימה בחינם ונקרא להם מושלמים תמיד. המסקנה הסופית שאני רוצה להגיע אליה היא שבשדה מושלם, פולינום אי-פריק הוא ספרבילי, מה שראינו כבר עבור מציין 0 ונותר להראות עכשיו לשדות ממציין \( p \). רק לפני כן אני רוצה להסביר למה כל שדה סופי הוא מושלם. בשביל זה אני אכניס לתמונה את אחד מהכוכבים הבלתי מעורערים של התחום: אוטומורפיזם פרובניוס.

אצלנו \( \mathbb{F} \) הוא שדה סופי ממציין \( p \). בהקשר הזה, אוטומורפיזם פרובניוס שלו הוא פונקציה \( \varphi:\mathbb{F}\to\mathbb{F} \) המוגדרת על ידי \( \varphi\left(a\right)=a^{p} \). ראשית כל, הפונקציה הזו היא הומומורפיזם, כי מתקיים:

\( \left(ab\right)^{p}=a^{p}b^{p} \)
\( \left(a+b\right)^{p}=a^{p}+b^{p} \)

השוויון הראשון ברור כי אנחנו מעל שדה ולכן כפל הוא קומוטטיבי; אבל השני לא ברור בכלל במבט ראשון. כדי להבין את זה אנחנו מגייסים לעזרתנו את הבינום של ניוטון, שעובד מעל כל שדה:

\( \left(a+b\right)^{p}={p \choose 0}a^{p}+{p \choose 1}a^{p-1}b+\dots+{p \choose p-1}ab^{p-1}+{p \choose p}b^{p} \)

קיבלנו פה סכום של איברים עם המקדמים הבינומיים. באופן כללי, \( {p \choose k}=\frac{p!}{k!\left(p-k\right)!} \). כלומר, אנחנו מקבלים במונה \( p \) כפול הרבה דברים, ובמכנה מכפלה של כל מני דברים כך שאם \( 1\le k\le p-1 \), אף אחד מהדברים הללו איננו \( p \). מכיוון ש-\( p \) ראשוני, אף אחד מהמספרים במכנה לא יחלק אותו, ולכן נקבל ש-\( {p \choose k} \) מתחלק ב-\( p \) (במקרי הקצה מתקיים \( {p \choose 0}={p \choose p}=1 \)) ולכן מודולו \( p \) (כי אנחנו בשדה ממציין \( p \)) כל איברי הביניים הללו נעלמים ואנחנו נשארים עם התוצאה שציטטתי.

קיבלנו שהפונקציה היא הומומורפיזם, אבל למה היא אוטומורפיזם, כלומר גם חח”ע ועל? ובכן, כל הומומורפיזם של שדות שאיננו הומומורפיזם האפס הוא חח”ע. הנה נימוק פשוט: אם \( f:F\to E \) הומומורפיזם כך שמתקיים \( f\left(a\right)=0 \) עבור \( a\ne0 \) כלשהו, אז לכל \( b\in F \) מתקיים

\( f\left(b\right)=f\left(aa^{-1}b\right)=f\left(a\right)f\left(a^{-1}\right)f\left(b\right)=0\cdot\left(a^{-1}\right)f\left(b\right)=0 \)

ולכן אם \( f \) לא הומומורפיזם האפס, רק 0 יכול לעבור ל-0. כעת, אם \( f\left(a\right)=f\left(b\right) \) אז \( f\left(a-b\right)=f\left(a\right)-f\left(b\right)=0 \) ולכן \( a-b=0 \), כלומר \( a=b \). זו כאמור תוצאה כללית מאוד; במקרה הנוכחי \( 1^{p}=1 \) ולכן פרובניוס אינו הומומורפיזם האפס, ולכן הוא חח”ע; מכיוון ש-\( \mathbb{F} \) סופי, אז חח”ע גורר גם על (באופן כללי זה לא כך, ומעל שדות אינסופיים משתמשים בשם אנדומורפיזם פרובניוס; אנדומורפיזם הוא הומומורפיזם חח”ע ולאו דווקא על ממבנה אלגברי לעצמו).

העובדה שאוטומורפיזם פרובניוס הוא על במקרה של שדה סופי, היא בדיוק מה שמראה לנו שכל איבר הוא חזקה \( p \)-ית; זו בדיוק המשמעות של “כל איבר הוא בתמונה של אוטומורפיזם פרובניוס”. זה מלמד אותנו שכל שדה סופי הוא מושלם, ונשאר רק להבין למה בשדה מושלם ממציין \( p \) כל פולינום אי פריק הוא ספרבילי. התעלול יהיה פשוט: נשתמש באנדורמורפיזם פרובניוס כדי להראות שאם פולינום \( f \) הוא לא ספרבילי, אז הוא בעצמו חזקה \( p \)-ית של פולינום \( g \) אחר.

בואו ניזכר שראינו שאם \( f \) פולינום אי פריק, אז הדרך היחידה שבה הוא לא יהיה ספרבילי היא אם \( D_{x}\left(f\right)=0 \). כדי שהנגזרת תצא אפס, הכרחי שכל מקדם יהיה אפס. אם ל-\( f \) יש מונום \( a_{n}x^{n} \) כך ש-\( p \) לא מחלק את \( a_{n} \) (אחרת המונום הזה הוא אפס ואפשר להתעלם ממנו), אחרי הגזירה הוא יהפוך ח-\( na_{n}x^{n-1} \). כדי שזה יתאפס במציין \( p \) צריך ש-\( p \) יחלק את \( na_{n} \); אבל אם \( p \) לא מחלק את \( a_{n} \) זה גורר ש-\( p \) מחלק את \( n \). כלומר, המונומים היחידים של \( f \) שאינם אפס הם כאלו שבהם החזקה של \( x \) היא \( p \) כפול משהו; אפשר לכתוב

\( f\left(x\right)=a_{n}x^{pn}+a_{n-1}x^{p\left(n-1\right)}+\dots+a_{1}x^{p}+a_{0} \)

עכשיו, אם אנחנו מעל שדה מושלם, אז לכל \( k \) מתקיים \( a_{k}=b_{k}^{p} \) עבור \( b_{k} \) מתאים. אז אפשר לכתוב:

\( f\left(x\right)=b_{n}^{p}\left(x^{p}\right)^{n}+b_{n-1}^{p}\left(x^{p}\right)^{\left(n-1\right)}+\dots+b_{1}^{p}x^{p}+b_{0}^{p} \)

כלומר, בעזרת אנדורמורפיזם פרובניוס:

\( f\left(x\right)=\left(b_{n}x^{n}\right)^{p}+\left(b_{n-1}x^{n-1}\right)^{p}+\dots+\left(b_{1}x\right)^{p}+b_{0}^{p} \)

כלומר:

\( f\left(x\right)=\left(b_{n}x^{n}+b_{n-1}x^{n-1}+\dots+b_{1}x+b_{0}\right)^{p} \)

וקיבלנו ש-\( f \) הוא חזקה של פולינום אחר, בסתירה לכך שהוא אי פריק - סיימנו את ההוכחה!

לאן הולכים עכשיו? היעד הקרוב שלנו הוא להוכיח שהרחבה סופית היא הרחבת גלואה אם ורק אם היא שדה הפיצול של פולינום ספרבילי; על זה נדבר בפוסט הבא.

נהניתם? התעניינתם? אם תרצו, אתם מוזמנים לתת טיפ: