שדות סופיים ומשפט האיבר הפרימיטיבי

עכשיו, כשיש לנו את הבסיס של תורת גלואה, אפשר לחזור לנושאים שהזכרתי בעבר אבל לא התעסקתי בהם עד הסוף. בפוסט הזה אני רוצה לדבר על שני נושאים שקשורים קצת זה לזה: שדות סופיים ומשפט האיבר הפרימיטיבי. משפט האיבר הפרימיטיבי אומר שאם \( E/F \) היא הרחבת שדות סופית וספרבילית, אז קיים \( \theta\in E \) כך ש-\( E=F\left(\theta\right) \). במילים אחרות, כל הרחבה ספרבילית וסופית היא פשוטה. המושג של “ספרבילית”, שהזכרתי בפוסט קודם הוא טריוויאלי מעל מה שקראתי לו שדה מושלם: כל הרחבה סופית של שדה מושלם היא ספרבילית, כך שאפשר לשכוח מהמושג הזה. כל שדה סופי הוא מושלם, ו-\( \mathbb{Q} \) הוא שדה מושלם, ואלו בכל מקרה יהיו השדות שמעניינים אותנו כאן. עדיין, אני אוכיח את המשפט באופן כללי.

משפט האיבר הפרימטיבי, עד כדי כל מני דברים

אני רוצה להתחיל ממה שהוא העיקר: אם \( E/F \) היא הרחבה סופית, איך מוצאים את האיבר \( \theta \) המופלא שיוצר את ההרחבה? ראשית, בואו ניזכר שאנחנו לא כל כך רחוקים מכך - בפוסט קודם כבר הראיתי שאם \( E/F \) הרחבה סופית אז \( E=F\left(\alpha_{1},\dots,\alpha_{n}\right) \) - כלומר, ההרחבה נוצרת על ידי מספר סופי של איברים. זה אומר שמספיק יהיה לנו להוכיח את הטענה הבאה: שאם \( E=F\left(\alpha,\beta\right) \) היא הרחבה סופית של \( F \), אז \( E=F\left(\theta\right) \) עבור \( \theta \) כלשהו. זה יאפשר לנו לטפל במקרה הכללי באמצעות אינדוקציה: אם \( E=F\left(\alpha_{1},\dots,\alpha_{n}\right) \) אז נמצא, על פי הנחת האינדוקציה, איבר פרימיטיבי \( \theta \) כך ש-\( F\left(\alpha_{1},\dots,\alpha_{n-1}\right)=F\left(\theta\right) \) ואז נקבל ש-\( F\left(\alpha_{1},\dots,\alpha_{n}\right)=F\left(\alpha_{1},\dots,\alpha_{n-1}\right)\left(\alpha_{n}\right)=F\left(\theta,\alpha_{n}\right)=F\left(\theta^{\prime}\right) \).

אז האתגר שלנו הוא להראות איך לבצע את המעבר מ-\( F\left(\alpha,\beta\right) \) אל \( F\left(\theta\right) \). ראינו לכך דוגמא בעבר: \( \mathbb{Q}\left(\sqrt{2},\sqrt{3}\right)=\mathbb{Q}\left(\sqrt{2}+\sqrt{3}\right) \). זה נותן רמז מה קורה באופן כללי: אנחנו נקבל ש-\( \theta=\alpha+t\beta \) כאשר \( t\in F \), אבל עדיין צריך להסביר למה איבר כזה יעבוד ואיך בוחרים את \( t \).

ראשית, זה לא הולך לעבוד אם \( F \) הוא שדה סופי; במקרה של שדה סופי הטיעון הוא אחר ואציג אותו אחר כך. שנית, עבור שדה אינסופי עדיין צריך לדרוש משהו נוסף: שבהרחבה \( E/F \) יהיה מספר סופי של תת-שדות של \( E \) שמכילים את \( F \). האם זו דרישה סבירה? ובכן, אם \( E/F \) היא הרחבת גלואה, הדרישה הזו בוודאי מתקיימת: במקרה הזה, חבורת הגלואה \( \text{Gal}\left(E/F\right) \) היא כמובן סופית (לא דיברנו בכלל על חבורות גלואה אינסופיות, והעובדה ש-\( E/F \) סופית גוררת מייד שהחבורה היא מסדר סופי). כל תת-שדה של \( E \) שמכיל את \( F \) מתאים לתת-חבורה של \( \text{Gal}\left(E/F\right) \), ובחבורה סופית יש רק מספר סופי של תתי-חבורות, מה שמסיים את הסיפור. אז כן, זו דרישה סבירה בהקשר שלנו.

אבל שימו לב - משפט האיבר הפרימיטיבי היה עם הנחות צנועות למדי; הוא לא הניח ש-\( E/F \) היא הרחבת גלואה אלא רק שהיא סופית וספרבילית. העניין הוא שהתנאי של “מספר סופי של תת-שדות” לא דורש ש-\( E/F \) תהיה הרחבת גלואה בעצמה, אלא מספיק שתהיה מוכלת בהרחבת גלואה - כלומר, שיהיה \( F\subseteq E\subseteq K \) כך ש-\( K/F \) גלואה. במקרה הזה, תתי-השדות של \( E \) שמכילים את \( F \) יתאימו לחבורות מנה של \( \text{Gal}\left(K/F\right) \) וכאלו יהיה רק מספר סופי.

אם \( E/F \) היא הרחבה ו-\( K \) הוא השדה המינימלי שמרחיב את \( E \) כך ש-\( K/F \) היא גלואה אז קוראים ל-\( K \) בשם סגור גלואה של \( E/F \). מה שאני אוכיח בהמשך (וזה לא טריוויאלי) הוא שלכל הרחבה ספרבילית יש סגור-גלואה שכזה, מה שמסביר למה תנאי משפט האיבר הפרימיטיבי עובדים.

מה שנשאר לי לעשות כרגע הוא להוכיח את הטענה שאם \( F\left(\alpha,\beta\right)/F \) היא הרחבה עם מספר סופי של תתי-שדות ו-\( F \) שדה אינסופי, אז \( F\left(\alpha,\beta\right)=F\left(\theta\right) \) עבור \( \theta \) כלשהו. זו הוכחה מקסימה, לטעמי. הרעיון הוא פשוט להסתכל על כל תתי-השדות מהצורה \( F\left(\alpha+t\beta\right) \), עבור כל \( t\in F \). מכיוון שיש אינסוף ערכים אפשריים של \( t \) אבל רק מספר סופי של תתי-שדות של \( F\left(\alpha,\beta\right) \), בהכרח קיימים \( t\ne s\in F \) כך ש-\( F\left(\alpha+t\beta\right)=F\left(\alpha+s\beta\right) \) (זהו עקרון שובך היונים בפעולה). זה אומר שבשדה \( F\left(\alpha+t\beta\right) \) נמצא גם האיבר \( \alpha+s\beta \). עכשיו, בואו נחסר את האיבר הזה מהיוצר של השדה:

\( \alpha+t\beta-\left(\alpha+s\beta\right)=\left(t-s\right)\beta \)

מכיוון ש-\( t-s\ne0 \) ו-\( t,s\in F \) הרי ש-\( \left(t-s\right) \) הפיך עם הופכי ב-\( F \) שאפשר לכפול בו ולקבל ש-\( \beta\in F\left(\alpha+t\beta\right) \). ואם \( \beta \) שייך לשדה הזה, אז גם \( t\beta \) שייך אליו, ונחסר אותו מ-\( \alpha+t\beta \) ונקבל שגם \( \alpha\in F\left(\alpha+t\beta\right) \), כלומר \( F\left(\alpha,\beta\right)\subseteq F\left(\alpha+t\beta\right)\subseteq F\left(\alpha,\beta\right) \) ולכן הם שווים וזה מסיים את ההוכחה.

אז נשאר לנו:

  1. להוכיח את המשפט לשדות סופיים, כי בזה בכלל לא נגענו.
  2. להראות שלכל הרחבה סופית וספרבילית יש סגור גלואה, כי על זה הסתמכנו פה.

נתחיל מהשדות הסופיים.

שדות סופיים

מה אנחנו כבר יודעים על שדות סופיים? דיברתי עליהם קצת פה, אבל אני אזכיר את מה שנזדקק לו.

ראשית, אם \( F \) שדה סופי, אז בהכרח המציין שלו הוא מספר ראשוני \( p \). “מציין” של שדה, כזכור, הוא המספר החיובי הקטן ביותר של פעמים שיש לחבר את 1 לעצמו כדי לקבל 0.

שנית, לכל ראשוני \( p \), \( \mathbb{Z}_{p}=\left\{ 0,1,2,\dots,p-1\right\} \) הוא שדה ביחס לחיבור וכפל מודולו \( p \). השדות הללו הם ה”בסיס” לכל השדות הסופיים: אם \( F \) שדה סופי ממציין \( p \) אז \( \mathbb{Z}_{p} \) יהיה תת-שדה שלו, ואם \( \left[F:\mathbb{Z}_{p}\right]=n \) המסקנה היא ש-\( \left|F\right|=p^{n} \). זה אומר לנו שהסדר של כל שדה סופי הוא בהכרח חזקה טבעית של ראשוני. אני רוצה לומר יותר מכך - שלכל ראשוני \( p \) וטבעי חיובי \( n \), קיים שדה עם \( p^{n} \) איברים והשדה הזה הוא יחיד (כלומר, כל שני שדות עם \( p^{n} \) איברים הם איזומורפיים). כדי להראות את זה, אני אראה שכל שדה עם \( p^{n} \) איברים הוא שדה הפיצול של הפולינום \( x^{p^{n}}-x \) מעל \( \mathbb{Z}_{p} \) ואשתמש בכך ששדה פיצול הוא יחיד עד כדי איזומורפיזם.

ראשית, כמה שורשים יש לפולינום \( x^{p^{n}}-x \) הזה? אם הוא ספרבילי אז קיימים לו בדיוק \( p^{n} \) שורשים - בהתאם למעלה שלו. בפוסט קודם על פולינומים ספרביליים הראיתי קריטריון פשוט לבדיקה האם פולינום הוא ספרבילי - זה מתקיים אם ורק אם הוא זר לנגזרת הפורמלית שלו. במקרה שלנו, הנגזרת של \( x^{p^{n}}-x \) היא \( p^{n}x^{p^{n}-1}-1=-1 \) כשהשוויון הוא מעל השדה \( \mathbb{Z}_{p} \) (שבו \( p=0 \) ולכן כמובן שגם \( p^{n}=0 \)). זה מבטיח שהנגזרת תהיה זרה לפולינום, ולכן הוא ספרבילי.

זה עדיין לא מבטיח לנו ששדה הפיצול של הפולינום הזה יהיה בעל \( p^{n} \) איברים - ייתכן שהוא ייאלץ להיות גדול יותר כדי לכלול את כל השורשים של הפולינום ועדיין להיות שדה. כדי להראות ששדה הפיצול כולל בדיוק את השורשים של הפולינום ושום דבר מעבר להם עלינו להראות שהם שדה - שיש לנו סגירות לחיבור, כפל ולקיחת הופכי ונגדי. בשביל זה אני אגייס משהו שכבר הזכרתי בפוסט שקישרתי אליו: אוטומורפיזם פרובניוס, שהוא בסך הכל הפונקציה \( \alpha\mapsto\alpha^{p} \).

היופי באוטומורפיזם פרובניוס הוא שמעל שדה ממציין \( p \), מתקיים:

\( \left(\alpha\beta\right)^{p}=\alpha^{p}\beta^{p} \)

\( \left(\alpha+\beta\right)^{p}=\alpha^{p}+\beta^{p} \)

בואו ננצל את זה לטובתנו. נניח ש-\( \alpha,\beta \) הם שני שורשים של \( x^{p^{n}}-x \), כלומר מתקיים \( \alpha^{p^{n}}=\alpha \) ו-\( \beta^{p^{n}}=\beta \). בואו נראה סגירות:

\( \left(\alpha\beta\right)^{p^{n}}=\alpha^{p^{n}}\beta^{p^{n}}=\alpha\beta \)

כך שקיבלנו ש-\( \alpha\beta \) גם הוא שורש של הפולינום \( x^{p^{n}}-x \).

בדומה:

\( \left(\alpha+\beta\right)^{p^{n}}=\left(\alpha^{p}+\beta^{p}\right)^{p^{n-1}}=\dots=\alpha^{p^{n}}+\beta^{p^{n}}=\alpha+\beta \)

וגם:

\( \left(-\alpha\right)^{p^{n}}=\left(-1\right)^{p^{n}}\alpha^{p^{n}}=-\alpha \)

\( \left(\alpha^{-1}\right)^{p^{n}}=\left(\alpha^{p^{n}}\right)^{-1}=\alpha^{-1} \)

מה שמראה לנו שהשורשים של \( x^{p^{n}}-x \) הם לבדם שדה, מה שאומר שהם יהיו שווים לשדה הפיצול של הפולינום הזה. זה מראה לנו קיום של שדה מגודל \( p^{n} \).

כדי לראות יחידות, נניח ש-\( F \) הוא שדה כלשהו עם \( p^{n} \) איברים. אם נסתכל על הקבוצה \( F^{*}=F\backslash\left\{ 0\right\} \) שכוללת את כל אברי השדה מלבד אפס, אז הקבוצה הוא היא חבורה - החבורה הכפלית של השדה. יש בה \( p^{n}-1 \) איברים, ולכן על פי משפט לגראנז' כל איבר שלה מקיים \( a^{p^{n}-1}=1 \), כלומר \( a^{p^{n}}=a \) וזה לכל \( a\in F\backslash\left\{ 0\right\} \). המשוואה השניה מתקיימת באופן טריוויאלי גם עבור \( a=0 \) ולכן קיבלנו שכל אברי \( F \) הם שורשים של \( x^{p^{n}}-x \); מכיוון שזה פולינום עם בדיוק \( p^{n} \) שורשים, אלו בדיוק אברי \( F \) ולכן \( F \) הוא השדה הקטן ביותר שכולל את כל שורשי \( x^{p^{n}}-x \), מה שאומר שהוא שדה הפיצול שלו (עד כדי איזומורפיזם), מה שמסיים את הוכחת היחידות.

מכאן ואילך אני אשתמש בכתיב הסטנדרטי \( \mathbb{F}_{p^{n}} \) כדי לתאר את השדה הסופי בעל \( p^{n} \) איברים. שימו לב שהשדה הזה אינו החוג \( \mathbb{Z}_{p^{n}} \), שהוא בכלל לא שדה (כי למשל \( p \) הוא מחלק אפס), למעט במקרה של \( n=1 \). גם במקרה הזה אני אשתמש מעכשיו בכתיב \( \mathbb{F}_{p} \) במקום \( \mathbb{Z}_{p} \); הסימון \( \mathbb{Z}_{p} \) יישמר להקשר שבו חושבים על \( \mathbb{Z}_{p} \) בתור חבורה חיבורית בלבד.

מכאן ואילך אני ארצה להבין קצת יותר את המבנה של \( \mathbb{F}_{p^{n}} \) הזה, ונתחיל עם הטענה שלשמה הגענו לפה - ש-\( \mathbb{F}_{p^{n}} \) הוא הרחבה פשוטה של \( \mathbb{F}_{p} \).

הטענה הזו נובעת מטענה כללית יותר על שדות: אם \( F \) הוא שדה (לא בהכרח סופי) ו-\( G\subseteq F^{*} \) היא תת-חבורה סופית של החבורה הכפלית שלו, אז \( G \) ציקלית. אפשר לראות דוגמא נחמדה לכך עם שורשי היחידה שדיברנו עליהם בפוסט הקודם; שורשי היחידה חיים בתוך \( \mathbb{C}^{*} \) - החבורה הכפלית של המרוכבים, שאינה ציקלית. אפשר בתוך \( C^{*} \) להסתכל על אוסף כל שורשי היחידה - זו חבורה אינסופית והיא אינה ציקלית. אבל קחו תת-חבורה סופית של שורשי יחידה והופס, היא כן ציקלית - כי כל שורש יחידה הוא שורש פרימיטיבי עבור סדר מסויים, כלומר יוצר את כל השורשים של \( x^{n}=1 \) עבור \( n \) כלשהו.

איך מוכיחים את הטענה באופן כללי? ובכן, אני די מתרגש, כי אני בכלל לא זוכר שראיתי אי פעם את ההוכחה לזה, זה היה אחד מהדברים שפשוט שמעתי ואף פעם לא טרחתי לבדוק. והנה, אני מגלה בשידור חי! וזה…

וזה די פשוט, אם משתמשים במשפט הכבד על המבנה של חבורות אבליות סופיות. למה “אבליות”? כמובן, כי אחת מהאקסיומות של שדה היא שהכפל בו הוא קומוטטיבי, ולכן כל תת-חבורה כפלית של \( F^{*} \) תהיה אבלית, ולכן איזומורפית ל-\( \mathbb{Z}_{n_{1}}\times\mathbb{Z}_{n_{2}}\times\dots\times\mathbb{Z}_{n_{k}} \), כאשר אפשר להוסיף את הדרישה שיתקיים \( n_{k}|n_{k-1}|\dots|n_{2}|n_{1} \) ו-\( 1<n_{k} \), כלומר הסדר של כל אחת מהחבורות הציקליות במכפלה מחלק את הסדר של אלו שבאות אחריה.

ועכשיו מגיע תעלול “ספירתי” די פשוט, שקשור לפולינומים: נסתכל על הפולינום \( x^{n_{k}}-1 \) - כמה שורשים יכולים להיות לו מעל \( F \)? לכל היותר \( n_{k} \) (זה תקף גם כש-\( F \) איננו שדה סופי). כמה שורשים יש בתת-החבורה \( \left\{ 1\right\} \times\dots\times\left\{ 1\right\} \times\mathbb{Z}_{n_{k}} \) לבדה? ובכן, זו חבורה מסדר \( n_{k} \), אז על פי לגראנז’, \( a^{n_{k}}=1 \) לכל איבר בה; קיבלנו כבר \( n_{k} \) שורשים של \( x^{n_{k}}-1 \) ב-\( F \). האם יש עוד?

ובכן, בואו ניזכר במה שאנחנו יודעים על חבורות ציקליות. בחבורה ציקלית יש תת-חבורה מסדר \( t \) לכל \( t \) שמחלק את סדר החבורה כולה. מכיוון ש-\( n_{k} \) מחלק את הסדר של כל שאר החבורות הציקליות במכפלה \( \mathbb{Z}_{n_{1}}\times\mathbb{Z}_{n_{2}}\times\dots\times\mathbb{Z}_{n_{k}} \) אנחנו מקבלים שבוודאי שקיימים איברים נוספים בה שהסדר שלהם מחלק את \( n_{k} \): פשוט ניקח \( 1\ne a_{i}\in\mathbb{Z}_{n_{i}} \) מסדר שמחלק את \( n_{k_{i}} \) לכל \( 1\le i\le k \) והאיבר \( \left(a_{1}\dots,a_{k}\right)\in\mathbb{Z}_{n_{1}}\times\mathbb{Z}_{n_{2}}\times\dots\times\mathbb{Z}_{n_{k}} \) יהיה שורש נוסף של הפולינום \( x^{n_{k}}-1 \), בסתירה לחסם שיש לנו על מספר השורשים שלו. לכן בהכרח המבנה של \( G \) הוא \( \mathbb{Z}_{n_{k}} \) - חבורה ציקלית בודדת ותו לא.

חזרה אל משפט האיבר הפרימטיבי: אם \( \mathbb{F}_{p^{n}}/\mathbb{F}_{p} \) הוא שדה בעל \( p^{n} \) איברים, אז החבורה הכפלית שלו \( \mathbb{F}_{p^{n}}^{*} \) היא סופית ולכן קיים \( \theta\in\mathbb{F}_{p^{n}}^{*} \) שיוצר אותה: כל החזקות של \( \theta \) הן לבדן \( F^{*} \) כולה. לכן ברור ש-\( \mathbb{F}_{p^{n}}=\mathbb{F}_{p}\left(\theta\right) \), מה שמסיים את ההוכחה עבור שדות סופיים.

שימו לב למסקנה מיידית נחמדה מכך: כזכור, בהרחבה פשוטה מתקיים ש-\( \left[F\left(\theta\right):F\right]=\deg m_{\theta,F} \) כאשר \( m_{\theta,F} \) הוא הפולינום המינימלי של \( \theta \) מעל \( F \). מכיוון ש-\( \left[\mathbb{F}_{p^{n}}:\mathbb{F}_{p}\right]=n \), קיבלנו שקיים פולינום אי פריק ממעלה \( n \) מעל \( \mathbb{Z}_{p} \), וזאת עבור כל \( n \) טבעי. זה מצביע על שיטה פשוטה מאוד לבניית שדות סופיים: קחו את \( \mathbb{F}_{p} \) ותגרילו פולינומים ממעלה \( n \) מעל \( \mathbb{F}_{p} \) - פשוט תבחרו מקדמים באקראי. עכשיו תבדוק אם קיבלתם פולינום אי-פריק, מה שדומה לבדיקת ראשוניות ב-\( \mathbb{Z} \) ובהחלט צריך להקדיש לזה פוסט מתישהו, ואם קיבלתם פולינום אי-פריק, אז תבנו את שדה השורש שלו ותקבלו את \( \mathbb{F}_{p^{n}} \). מה שראינו עכשיו הוא שהשיטה הזו תמיד יכולה להצליח באופן עקרוני כי תמיד קיים פולינום אי פריק מתאים; כמובן, צריך לדבר על ההסתברות להצליח, כי סתם “ההסתברות גדולה מאפס” זה לא מרשים בכלל, אבל זה לדיון אחר בפעם אחרת - בינתיים רק אבטיח לכם שההסתברות היא גדולה למדי.

כעת נשאלת השאלה - מהם תתי-השדות של \( \mathbb{F}_{p^{n}} \), פרט ל-\( \mathbb{F}_{p} \)? האינטואיציה שלי הייתה שכל \( \mathbb{F}_{p^{k}} \) עבור \( k<n \) יהיה תת-שדה - כלומר, שכל שדה סופי ממציין \( p \) מכיל כתת-שדה את כל השדות ממציין \( p \) מסדר קטן יותר. האינטואיציה הזו פשוט שגויה, אבל בואו נראה דוגמאות קונקרטיות פשוטות כדי לא לדבר באוויר. אני בסך הכל אראה את שלושת השדות הסופיים “הראשונים” ממציין 2.

את \( \mathbb{F}_{2}=\left\{ 0,1\right\} \) אנחנו מכירים ואין בו משהו חדש. אבל כבר \( \mathbb{F}_{2^{2}} \) הוא לא טריוויאלי לגמרי. אפשר לבנות אותו באמצעות הפולינום \( x^{2}+x+1 \) שהוא אי-פריק מעל \( \mathbb{F}_{2} \) כי זה פולינום ממעלה 2 ללא שורש בשדה (אפשר פשוט להציב ולבדוק). לכן \( \mathbb{F}_{2^{2}}\cong\mathbb{F}_{2}\left[x\right]/\left\langle x^{2}+x+1\right\rangle \); אפשר לחשוב עליו כאילו הוספנו איבר \( \alpha \) ל-\( \mathbb{F}_{2} \) שמקיים את התכונה \( \alpha^{2}=\alpha+1 \) (למי שתוהה לאן המינוסים נעלמו - אנחנו מעל שדה ממציין 2, מינוס ופלוס זה אותו דבר). בשדה הזה יש ארבעה איברים: \( \mathbb{F}_{2^{2}}=\left\{ 0,1,\alpha,\alpha+1\right\} \), והכפל שלהם נעזר במשוואה שהראיתי קודם. למשל, \( \alpha\left(\alpha+1\right)=\alpha^{2}+\alpha=\alpha+\alpha+1=1 \).

כעת, את \( \mathbb{F}_{2^{3}} \) נבנה על ידי הרחבת \( \mathbb{F}_{2} \) על ידי הוספת שורש של הפולינום האי-פריק \( x^{3}+x+1 \) (שוב - זה פולינום ממעלה 3 ולכן הוא אי-פריק אם ורק אם אין לו שורש בשדה). כלומר, זה שדה שמוגדר על ידי איבר שמקיים \( \beta^{3}=\beta+1 \), והאיברים שלו הם

\( \mathbb{F}_{2^{3}}=\left\{ 0,1,\beta,\beta+1,\beta^{2},\beta^{2}+1,\beta^{2}+\beta,\beta^{2}+\beta+1\right\} \)

והנה השאלה שלי: האם \( \mathbb{F}_{2^{3}} \) מכיל את \( \mathbb{F}_{2^{2}} \) כתת-שדה? אם כן, איפה \( \alpha \)? לאן הוא עובר? בואו ננסה! ננחש, למשל, ש-\( \alpha \) עובר אל \( \beta^{2}+1 \) ונראה מה יוצא מזה. אם \( \alpha \) עבור אל \( \beta^{2}+1 \) אז \( \alpha+1 \) אמור לעבור אל \( \left(\beta^{2}+1\right)+1=\beta^{2} \) (כי 1 תמיד יעבור ל-1). הכפל של שניהם אמור להחזיר 1. מה קורה בפועל?

\( \beta^{2}\left(\beta^{2}+1\right)=\beta^{3}\beta+\beta^{2}=\beta\left(\beta+1\right)+\beta^{2}=\beta \)

זה… זה לא עבד! הלם ותדהמה! אני יכול לשלוח אתכם לבדוק עוד מקרים, אבל אולי כבר ברור לכם מה טיעון המחץ הפשוט שמראה שזה לא יכול לעבוד: החבורה הכפלית של \( \mathbb{F}_{2^{2}} \) היא מסדר 3 ובהתאם, כל איבר בשדה הזה ששונה מ-0 ו-1 הוא מסדר 3; לעומת זאת ב-\( \mathbb{F}_{2^{3}} \) החבורה הכפלית היא מסדר 7 ולכן כל איבר בשדה למעט 0 ו-1 יהיה מסדר 7.

מהסיפור הזה נראה שתנאי הכרחי לכך ש-\( \mathbb{F}_{p^{k}} \) יהיה תת-שדה של \( \mathbb{F}_{p^{n}} \) הוא שיתקיים ש-\( p^{k}-1 \) יחלק את \( p^{n}-1 \). אבל מתי זה קורה? והאם זה תנאי מספיק? אלו שאלות טובות ואין סיבה להתברחש איתן יותר מדי כשיש לנו את תורת גלואה לעזור לנו. זוכרים? כל הרעיון בתורת גלואה הוא להמיר שאלות מסובכות על שדות ותתי-שדות לשאלות קלות יותר על חבורות.

למצוא את חבורת גלואה של \( \mathbb{F}_{p^{n}}/\mathbb{F}_{p} \) זה קל להפתיע. מכיוון ש-\( \left[\mathbb{F}_{p^{n}}:\mathbb{F}_{p}\right]=n \) אנחנו יודעים שצריכים להיות בה בדיוק \( n \) איברים. האיברים הללו הם אוטומורפיזמים של \( \mathbb{F}_{p^{n}} \) שהם הזהות על \( \mathbb{F}_{p} \); האם אנחנו מכירים אוטומורפיזם כזה? בהחלט! אוטומורפיזם פרובניוס הוא דוגמא אחת. את זה שהוא אוטומורפיזם של \( \mathbb{F}_{p^{n}} \) ראינו; למה הוא משמר את \( \mathbb{F}_{p} \)? ובכן, הסבר פשוט אחד הוא שכל אוטומורפיזם של \( \mathbb{F}_{p^{n}} \) חייב לשמר את \( \mathbb{F}_{p} \) מהטעם הפשוט שאם \( \sigma \) אוטומורפיזם, אז \( \sigma\left(1\right)=1 \) (כי \( \sigma\left(1\right)=\sigma\left(1\cdot1\right)=\sigma\left(1\right)\sigma\left(1\right) \) ואפשר לצמצם, שהרי אם \( \sigma\left(1\right)=0 \) היינו מקבלים את אוטומורפיזם האפס), ואם \( \sigma\left(1\right)=1 \) אז \( \sigma\left(n\right)=\sigma\left(1+1+\dots+1\right)=\sigma\left(1\right)+\dots+\sigma\left(1\right)=1+\dots+1=n \). אפשר גם לתת הסבר אחר: \( a^{p}=a \) לכל \( a\in\mathbb{F}_{p} \) בגלל שהסדר של \( \mathbb{F}_{p}^{*} \) הוא \( p-1 \); כבר ראינו את הטיעון הזה בפוסט הנוכחי.

אוטומורפיזם פרובניוס יוצר חבורה של אוטומורפיזמים שהם חזקות שלו - כלומר, מספר הפעלות רצופות שלו. נסמן אותו ב-\( \sigma_{p} \), אז \( \sigma_{p}\left(\sigma_{p}\left(a\right)\right)=\sigma_{p}\left(a^{p}\right)=\left(a^{p}\right)^{p}=a^{p^{2}} \); באופן כללי, \( k \) הפעלות נשנות של \( \sigma_{p} \) יתנו לנו את \( \sigma_{p}^{k}\left(a\right)=a^{p^{k}} \). אז הנה לנו המועמדים הפוטנציאליים להיות כל אברי \( \text{Gal}\left(\mathbb{F}_{p^{n}}/\mathbb{F}_{p}\right) \) - \( \sigma_{p}^{0},\sigma_{p}^{1},\sigma_{p}^{2},\dots,\sigma_{p}^{n-1} \). למה כל האוטומורפיזמים הללו שונים אלו מאלו, ולמה אין עוד? כלומר, למה הסדר של \( \sigma_{p} \) הוא בדיוק \( n \)?

ראשית, למה אין עוד: כי \( \sigma_{p}^{n}\left(a\right)=a^{p^{n}}=a \) כפי שכבר ראינו לא אחת. כלומר, \( \sigma_{p}^{n} \) הוא אוטומורפיזם הזהות, וחזרנו אל \( \sigma_{p}^{0} \). שנית, למה אם \( 1\le k<p \) אז לא ייתכן ש-\( \sigma_{p}^{k} \) הוא גם כן אוטומורפיזם הזהות? ובכן, כי זה אומר ש-\( a^{p^{k}}=a \) לכל אחד מ-\( p^{n} \) האיברים של \( \mathbb{F}_{p^{n}} \), אבל לפולינום \( x^{p^{k}}-x \) יש רק \( p^{k}<p^{n} \) שורשים לכל היותר.

אם כן, \( \text{Gal}\left(\mathbb{F}_{p^{n}}/\mathbb{F}_{p}\right)\cong\mathbb{Z}_{n} \), מה שמראה שמנקודת המבט של תורת גלואה, שדות סופיים הם מקרה פשוט במיוחד. זה פותר לנו מייד את תעלומת שדות הביניים: ל-\( \mathbb{Z}_{n} \) יש תת-חבורה יחידה מסדר \( d \) לכל \( d|n \), ולכן יהיה לנו שדה ביניים יחיד לכל \( d|n \). מה יהיה שדה הביניים הזה? ובכן, אם \( n=d\cdot k \) אז תת-החבורה מסדר \( d \) נוצרת בידי האיבר \( k\in\mathbb{Z}_{n} \), שאצלנו מתאים לאוטומורפיזם \( \sigma_{p}^{k}\left(a\right)=a^{p^{k}} \). שדה השבת של האוטומורפיזם הזה (ולכן של תת-החבורה שהוא יוצר) כולל את כל האיברים \( a\in\mathbb{F}_{p^{n}} \) עבורם \( a^{p^{k}}=a \); יש בדיוק \( p^{k} \) כאלו ולכן שדה השבת הזה הוא \( \mathbb{F}_{p^{k}} \). זה מסביר לנו למה \( \mathbb{F}_{2^{2}} \) לא היה שדה ביניים של \( \mathbb{F}_{2^{3}} \); זה בגלל ש-\( 2 \) לא מחלק את 3.

סגור גלואה

באופן כללי במתמטיקה, סגור של אובייקט \( X \) כלשהו ביחס לתכונה \( P \) כלשהי הוא “הדבר הקטן ביותר שמכיל את \( X \) ומקיים את התכונה \( P \)”. בניה של כזה דבר על פי רוב מתבצעת בשני שלבים: ראשית, מוכיחים שיש משהו שמכיל את \( X \) ומקיים את \( P \); שנית, לוקחים את החיתוך של כל הדברים שמכילים את \( X \) ומקיימים את \( P \), ומקווים לטוב. ברור שהחיתוך עדיין יכיל את \( X \), אבל לא ברור אם הוא עדיין יקיים את \( P \); זה משהו שמצריך הוכחה.

במקרה שלנו ההקשר הוא שדות שמרחיבים שדה נתון \( F \). האובייקט \( X \) שלנו הוא שדה \( E \) שמרחיב את \( F \) כך שההרחבה היא סופית וספרבילית, והתכונה \( P \) היא “להיות הרחבת גלואה של \( F \)”. הסגור של \( E \) יהיה שדה \( K \) כך ש-\( E\subseteq K \) ו-\( K/F \) גלואה. בשביל לייצר את הסגור הזה נשתמש בשיטת שני השלבים שתיארתי, ולשם כך אני אצטרך להראות שני דברים:

  • אם \( K_{1}/F \) ו-\( K_{2}/F \) הן הרחבות גלואה אז גם \( K_{1}K_{2}/F \) היא הרחבת גלואה (\( K_{1}K_{2} \) הוא השדה הקטן ביותר שמכיל את \( K_{1} \) ואת \( K_{2} \); לפעמים קוראים לו הקומפוזיטום של השדות הללו).
  • אם \( K_{1}/F \) ו-\( K_{2}/F \) הן הרחבות גלואה אז גם \( K_{1}\cap K_{2}/F \) היא הרחבת גלואה.

אני מדבר כאן על שני שדות, אבל באינדוקציה אפשר להסיק מהתוצאות הללו שזה נכון לקומפוזיטום/חיתוך של מספר סופי של שדות.

למה שני אלו ביחד מסיימים? כי ראשית, \( E=F\left(\alpha_{1},\dots,\alpha_{n}\right) \) ולכן \( E \) בוודאי מוכל בשדה שמתקבל בתור קומפוזיטום של כל שדות הפיצול של הפולינומים המינימליים של \( \alpha_{1},\dots,\alpha_{n} \). שדה הפיצול של כל פולינום מינימלי שכזה הוא גלואה (כי הוא שדה פיצול של פולינום ספרבילי, מה שנובע מכך ש-\( E \) הרחבה ספרבילית). ולכן הקומפוזיטום יהיה גם כן גלואה. שנית, עכשיו משהסכמנו שיש לפחות הרחבת גלואה אחת שמכילה את \( E \), אפשר לקחת חיתוך של כולן. יש כאן לכאורה בעיה - לא מובטח לנו שיש רק מספר סופי של הרחבות כאלו, ולכן לא מובטח שהחיתוך של כולן יהיה עדיין גלואה. מצד שני, לא חייבים לקחת את כולן; באופן כללי, אם \( K,L \) הן שתי הרחבות של \( F \) כך ש-\( \left[K:F\right]=\left[K\cap L:F\right] \) המשמעות היא ש-\( K=K\cap L \) (כי חיתוך של מרחב וקטורי \( V \) עם מרחב אחר שלא מוריד את המימד של \( V \) חייב להיות שווה לכל \( V \)) ולכן אם נסתכל על החיתוך האינסופי, נוכל לקחת ממנו רק מספר סופי של שדות באופן הבא: קחו שדה אחד באופן שרירותי, נניח שהמימד שלו מעל \( F \) הוא \( n \); עכשיו, אם אין שדה נוסף שהחיתוך שלו עם השדה שלנו מוריד את המימד, סיימנו; אחרת, ניקח את החיתוך של שניהם ונקבל מימד שהוא לכל היותר \( n-1 \), ונחזור על התהליך. בכל צעד המימד יורד ב-1 והוא לא יכול לרדת מתחת ל-1 ולכן מספר הצעדים בתהליך יהיה סופי.

נתחיל עם החיתוך שהוא פשוט יותר. ראינו כבר אפיון אחד של הרחבת גלואה \( E/F \) בתור הרחבה ספרבילית ונורמלית. ספרבילית אומר שאם \( a\in E \) אז הפולינום המינימלי של \( a \) מעל \( F \) הוא ספרבילי. זה קל: אם \( a\in K_{1}\cap K_{2} \) אז בפרט \( a\in K_{1} \) וזו הרחבת גלואה, כלומר \( K_{1}/F \) בפרט ספרבילית ולכן הפולינום המינימלי של \( a \) מעל \( F \) ספרבילי.

נורמלית אומר שאם \( p\left(x\right)\in F\left[x\right] \) הוא פולינום אי פריק מעל \( F \) כך שיש ל-\( p\left(x\right) \) שורש ב-\( E \), אז כל השורשים של \( p\left(x\right) \) נמצאים ב-\( E \). ובכן, נניח שיש \( a\in K_{1}\cap K_{2} \) שהוא שורש של \( p\left(x\right) \); מכיוון ש-\( a\in K_{1} \) אז כל שורשי \( p\left(x\right) \) שיייכים ל-\( K_{1} \), ומכיוון ש-\( a\in K_{2} \) אז כולם גם שייכים ל-\( K_{2} \).

בשביל הקומפוזיטום \( K_{1}K_{2} \) אני אגייס עוד אפיון של הרחבת גלואה - \( E/F \) גלואה אם ורק אם היא שדה הפיצול של פולינום ספרבילי מעל \( F \). אם כן, נניח ש-\( K_{1} \) הוא שדה הפיצול של \( p_{1}\left(x\right) \) ו-\( K_{2} \) הוא שדה הפיצול של \( p_{2}\left(x\right) \), אז ניקח את הפולינום \( p_{1}\left(x\right)p_{2}\left(x\right) \). כל שורש שלו נכלל ב-\( K_{1} \) או \( K_{2} \) ולכן שדה הפיצול שלו מוכל ב-\( K_{1}K_{2} \). מצד שני, \( K_{1}K_{2} \) הוא השדה הקטן ביותר שמכיל את \( K_{1},K_{2} \), וברור ששדה הפיצול של \( p_{1}\left(x\right)p_{2}\left(x\right) \) מכיל גם את \( K_{1} \) וגם את \( K_{2} \) כי הוא מכיל את כל האיברים שיוצרים אותם. לכן \( K_{1}K_{2} \) שווה לשדה הפיצול הזה.

רק מה? בכלל לא ברור ש-\( p_{1}\left(x\right)p_{2}\left(x\right) \) הוא פולינום ספרבילי; מה קורה אם יש ל-\( p_{1}\left(x\right),p_{2}\left(x\right) \) שורשים משותפים? ובכן, זה צץ גם בפוסט שכבר הזכרתי, וכאן הפתרון זהה. הרעיון הוא שאם יש שורש משותף \( a \) ל-\( p_{1}\left(x\right),p_{2}\left(x\right) \) אז הפולינום המינימלי \( m_{a,F} \) של \( a \) מחלק את שני הפולינומים הללו ולכן במכפלה שלהם הוא יופיע בתור \( m_{a,F}^{2} \) ואפשר להחליף אותו ב-\( m_{a,F} \) ועדיין לקבל פולינום מעל \( F \) עם כל השורשים של \( p_{1}\left(x\right)p_{2}\left(x\right) \); רק שהפעם זה יהיה פולינום ספרבילי, וזה מסיים את ההוכחה.

אם כן, אפשר לסכם שעד כה קיבלנו תחושה כלשהי לגבי איך תורת גלואה “עובדת”; עכשיו הגיע הזמן לקחת את התחושה הזו וליישם אותה בשטח על מקרה מבחן אמיתי, שהוא הסיבה שבגללה תורת גלואה קיימת מלכתחילה - התעלומה של פתרון משוואות באמצעות רדיקלים. על זה נדבר בפוסט הבא.


נהניתם? התעניינתם? אם תרצו, אתם מוזמנים לתת טיפ:

Buy Me a Coffee at ko-fi.com