הרחבות אלגבריות, פשוטות, סופיות ומי יודע מה עוד

תזכורת

בפוסט הקודם שלי דיברתי על הרחבת שדות. בואו נחזור על עיקרי הדברים כדי שהפוסט הזה יעמוד עד כמה שניתן בזכות עצמו, ונוסיף עוד כמה הגדרות:

אם \( F,E \) הם שני שדות כך ש-\( F\subseteq E \) אז אומרים ש-\( E \) מרחיב את \( F \) ומסמנים את זה ב-\( E/F \). קל לראות ש-\( E \) הוא מרחב וקטורי מעל \( F \) והמימד של המרחב הזה מסומן ב-\( \left[E:F\right] \).

אני מחלק את האיברים ב-\( E \) לשני סוגים: איבר \( \theta\in E \) הוא אלגברי מעל \( F \) אם קיים פולינום \( p\left(x\right)\in F\left[x\right] \) כך ש-\( p\left(\theta\right)=0 \). אם \( \theta\in E \) הוא לא אלגברי, אני אומר שהוא טרנסנדנטי.

אם \( \theta\in E \) הוא איבר כלשהו (אלגברי או טרנסנדנטי), אני מסמן ב-\( F\left(\theta\right) \) את השדה הקטן ביותר שמכיל את \( F \) ואת \( \theta \). הדרך המקובלת להוכיח שקיים שדה כזה היא לקחת את חיתוך כל תתי-השדות של \( E \) שמכילים את \( F,\theta \) (למשל, \( E \)); לא קשה להוכיח שחיתוך כלשהו של שדות הוא שדה ושהתוצאה היא השדה הקטן ביותר המבוקש.

עכשיו, הנה כמה מההגדרות המרכזיות על הרחבת שדות \( E/F \) כלשהי:

  • אני אומר ש-\( E/F \) סופית אם \( \left[E:F\right] \) סופי.
  • אני אומר ש-\( E/F \) אלגברית אם כל איבר של \( E \) הוא אלגברי מעל \( F \).
  • אני אומר ש-\( E/F \) פשוטה אם \( E=F\left(\theta\right) \) עבור \( \theta\in E \) כלשהו; במקרה הזה אני גם אומר ש-\( \theta \) הוא איבר פרימיטיבי עבור ההרחבה \( E/F \).

בואו נתחיל מלנסות להבין את הקשרים שיש בין שלוש התכונות הללו.

הרחבות סופיות, אלגבריות ופשוטות - מי נגד מי?

בפוסט הקודם ראינו שני עניינים שהם צדדים שונים של אותו המטבע:

  • אם \( F \) שדה ו-\( p\left(x\right)\in F\left[x\right] \) פולינום אי-פריק אז קיימת הרחבה \( E/F \) ואיבר \( \theta\in E \) כך ש-\( p\left(\theta\right)=0 \) ו-\( F\left(\theta\right)\cong F\left[x\right]/\left\langle p\left(x\right)\right\rangle \).
  • אם \( E/F \) הרחבת שדות ו-\( \theta\in E \) אלגברי מעל \( F \) אז קיים פולינום מתוקן יחיד מדרגה חיובית מינימלית, \( m_{\theta,F}\left(x\right) \), כך ש-\( m_{\theta,F}\left(\theta\right)=0 \). הפולינום הזה נקרא הפולינום המינימלי של \( \theta \) מעל \( F \), ומתקיים \( F\left(\theta\right)\cong F\left[x\right]/\left\langle m_{F}\left(x\right)\right\rangle \).

ראינו גם שבמקרה שבו \( \theta \) אלגברי מעל \( F \), אפשר לתאר את \( F\left(\theta\right) \) בתור \( F\left(\theta\right)=\left\{ p\left(\theta\right)\ |\ p\left(x\right)\in F\left[x\right]\right\} \), כלומר בתור כל הפולינומים ב-\( \theta \) עם מקדמים ב-\( F \). אם נסמן \( n=\deg m_{\theta,F}\left(x\right) \) אז ניתן להסתפק רק בפולינומים ממעלה \( n-1 \) לכל היותר; במילים אחרות, \( F\left(\theta\right) \) נפרש כמרחב וקטורי מעל \( F \) על ידי הקבוצה \( \left\{ 1,\theta,\dots,\theta^{n-1}\right\} \).

כדי להשתכנע שזה עובד צריך להשתכנע בשני דברים: שאפשר לכתוב את \( \theta^{n} \) בתור צירוף לינארי של הוקטורים הללו (כך שאפשר להקטין את המעריך של כל חזקה חיובית של \( \theta \) עד שנקבל צירוף לינארי של חזקות מ-0 ועד \( n-1 \)), ושאפשר לכתוב את \( \theta^{-1} \) בתור צירוף לינארי שכזה. אם נכתוב במפורש

\( m_{\theta,F}\left(x\right)=a_{n}x^{n}+\dots+a_{1}x+a_{0} \)

אז נקבל את המשוואה

\( a_{n}\theta^{n}+\dots+a_{1}\theta+a_{0}=0 \)

שממנה ניתן לחלץ:

\( \theta^{n}=-\frac{1}{a_{n}}\left(a_{n-1}\theta^{n-1}+\dots+a_{1}\theta+a_{0}\right) \)

\( \theta^{-1}=-\frac{1}{a_{0}}\left(a_{n}\theta^{n-1}+\dots+a_{2}\theta+a_{1}\right) \)

אם \( \theta \) טרנסנדנטי מעל \( F \) אז התיאור הכי טוב שלנו ל-\( F\left(\theta\right) \) הוא בתור המרחב הוקטורי שנפרש על ידי \( \left\{ \dots,\theta^{-2},\theta^{-1},1,\theta,\theta^{2},\dots\right\} \) מעל \( F \).

מסקנה אחת מהדיון הזה היא זו: אם \( \theta \) אלגברי מעל \( F \) עם פולינום מינימלי ממעלה \( n \), אז \( \left[F\left(\theta\right):F\right]=n \). גם הכיוון השני נכון כמעט באותה צורה: נניח ש-\( \left[F\left(\theta\right):F\right]=n \), אז זה אומר שהקבוצה \( \left\{ 1,\theta,\dots,\theta^{n-1},\theta\right\} \) היא תלויה לינארית (יש בה \( n+1 \) איברים של המרחב הוקטורי \( F\left(\theta\right) \) מעל \( F \)) והצירוף הלינארי שלה ששווה 0 יתן לנו פולינום שמאפס את \( \theta \) ויוכיח ש-\( \theta \) אלגברי.

אם כן, משפט ראשון שאפשר לצטט עוסק בקשר בין הרחבות פשוטות והרחבות סופיות:

  • הרחבה פשוטה \( F\left(\theta\right)/F \) היא סופית אם ורק אם \( \theta \) אלגברי מעל \( F \).

או באופן שקול:

  • הרחבה פשוטה \( F\left(\theta\right)/F \) היא אינסופית אם ורק אם \( \theta \) טרנסנדנטי מעל \( F \).

אם כן, ראינו שהרחבה פשוטה היא לפעמים סופית ולפעמים לא, אבל אנחנו יודעים בדיוק מה קורה בכל אחד מהמקרים. מה עם הכיוון השני? האם הרחבה סופית היא בהכרח פשוטה, או שאפשר לייצר הרחבות סופיות אחרות? אינטואיטיבית נראה לי מובן מאליו שאפשר לייצר הרחבות מתוחכמות שאי אפשר ליצור על ידי איבר בודד ועדיין לקבל מימד סופי מעל \( F \), ולכן כל כך מפתיע (אותי) לגלות ש”כמעט תמיד” מתקיים שאם \( E/F \) הרחבה סופית אז היא גם פשוטה. התוצאה הזו נקראת משפט האיבר הפרימיטיבי והיא תצטרך לחכות להמשך כי הניסוח וההוכחה שלה דורשים מושגים שעדיין אין לנו. בכל זאת אצטט אותה:

  • אם \( E/F \) הרחבה סופית וספרבילית, אז \( E/F \) פשוטה.

אני לא יכול להסביר כרגע מה “ספרבילית” אומר, אבל מקרה פרטי של המשפט שלעיל הוא שאם \( E/F \) הרחבה סופית ו-\( F \) שדה ממציין 0 (כמו \( \mathbb{Q} \)) אז \( E/F \) תהיה פשוטה. כלומר, אם אנחנו רוצים למצוא הרחבה סופית שאינה פשוטה אנחנו נדחפים לשדות “מוזרים” עם מציין שונה מאפס, וגם שם המשפט יעבוד לפעמים.

מכך שכל הרחבה פשוטה עם איבר אלגברי היא סופית אפשר לקבל במהירות תוצאה נוספית:

  • אם \( E/F \) הרחבה סופית, אז היא הרחבה אלגברית.

למה זה נכון? בואו ניקח \( \theta\in E \) כלשהו. אנחנו רוצים להראות שהוא אלגברי מעל \( F \), וראינו כבר שזה שקול לכך ש-\( \left[F\left(\theta\right):F\right] \) סופית. כעת, \( F\left(\theta\right) \) הוא תת-מרחב וקטורי של \( E \), כשחושבים על שני השדות הללו כמרחבים וקטוריים מעל \( F \). המימד של תת-מרחב קטן או שווה למימד של המרחב כולו, ולכן אם \( \left[E:F\right] \) סופית, כך גם \( \left[F\left(\theta\right):F\right] \).

מה עם הכיוון השני של המשפט הזה? ובכן:

  • זה לא נכון שאם \( E/F \) הרחבה אלגברית אז היא סופית.

האם אני יכול לתת דוגמא נגדית פשוטה לטענה הזו? לא בדיוק. אילו שדות אנחנו מכירים בשלב הזה? את \( \mathbb{Q},\mathbb{R},\mathbb{C} \) והרחבות פשוטות שלהם. כעת, \( \left[\mathbb{C}:\mathbb{R}\right]=2 \) (כי הפולינום המינימלי של \( i \) הוא \( x^{2}+1 \)) ובהמשך נראה ש-\( \mathbb{C} \) לא ניתן להרחבה אלגברית שתניב משהו חדש, אז זה לא המקום לחפש בו הרחבות אלגבריות אינסופיות. כמו כן, \( \left[\mathbb{R}:\mathbb{Q}\right] \) אינסופית אבל זו לא הרחבה אלגברית (כי למשל \( \pi \) לא אלגברי מעל \( \mathbb{Q} \)). אז מה כן אפשר לתת? בהמשך נראה שקיים יצור שנקרא הסגור האלגברי של \( \mathbb{Q} \); היצור הזה (שהוא ממש לא \( \mathbb{R} \)) הוא הרחבה אלגברית של \( \mathbb{Q} \) אבל הוא יהיה רחוק מלהיות הרחבה סופית.

אפיון קצת יותר מחודד למהי הרחבה סופית אפשר למצוא במשפט הבא:

  • הרחבה \( E/F \) היא סופית אם ורק אם \( E \) מתקבל מ-\( F \) על ידי הוספת מספר סופי של איברים אלגבריים מעל \( F \).

איך מוכיחים את זה? אנחנו עוד לא שם, אבל נהיה עוד מעט.

ראינו את הקשר בין “הרחבה פשוטה” ו”הרחבה סופית” ואת הקשר בין “הרחבה סופית” ו”הרחבה אלגברית”. ומה על הקשר בין הרחבות אלגבריות ופשוטות? ובכן, צד אחד הוא נכון:

  • כל הרחבה פשוטה על ידי איבר אלגברי היא אלגברית.

אינטואיטיבית, זה בגלל שב-\( F\left(\theta\right) \) האיברים הם רק אברי \( F \) שאלגבריים באופן טריוויאלי (אם \( a\in F \) אז \( x-a \) הוא הפולינום המינימלי של \( a \) מעל \( F \)) ו-\( \theta \) אלגברי על פי ההנחה (כמובן שאם \( \theta \) היה טרנסנדנטי אז ההרחבה לא הייתה אלגברית). עדיין, יש פה משהו קצת לא ברור - למה אם \( \theta \) אלגברי זה אומר שגם כל החזקות שלו אלגבריות? וכל הפולינומים ב-\( \theta \) אלגבריים? למשל, למה \( \theta^{7}+3\theta+2 \) אלגברי? השאלה הזו היא מקרה פרטי של שאלה כללית יותר: נניח ש-\( \alpha,\beta \) הם שני איברים אלגבריים מעל \( F \). האם \( \alpha+\beta \) אלגברי? והאם \( \alpha\beta \) אלגברי? במילים אחרות, האם המספרים האלגבריים מעל \( F \) הם חוג? זה מטפל בפולינומים ב-\( \theta \) כי מהסגירות לכפל מקבלים גם ש-\( \theta^{n} \) אלגברי וגם ש-\( a_{n}\theta^{n} \) אלגברי עבור \( a_{n}\in F \) (כל איבר של \( F \) הוא אלגברי מעל \( F \)) ומהסגירות לחיבור מקבלים את הפולינום כולו.

ובכן, בהמשך נראה שהמשפט הזה נכון, ואפילו יותר מכך: אם \( \alpha,\beta \) אלגבריים מעל \( F \) כך גם \( \alpha\pm\beta \) ו-\( \alpha\beta \) ואם \( \beta\ne0 \) אז גם \( \frac{\alpha}{\beta} \); במילים אחרות, אם ניקח הרחבה \( E/F \), אז אוסף כל האיברים ב-\( E \) שהם אלגבריים מעל \( F \) יהיה תת-שדה של \( F \). יכול להיות מפתה לנסות להוכיח את המשפט הזה כבר עכשיו - זה מרגיש שאמורה להיות לו הוכחה קונסטרוקטיבית - ניקח פולינומים שמאפסים את \( \alpha,\beta \) ונבנה מהם איכשהו פולינום שמאפס את \( \alpha+\beta \). אני לא אומר שאי אפשר לעשות את זה, אבל זה יהיה כרוך בקושי טכני; אני עוד מעט הולך להוכיח ממילא משפט שההוכחה שלו אכן תהיה כרוכה בקושי טכני, והטענה שלי תתקבל ממנו כמסקנה פשוטה יחסית, כך שאין סיבה לחזור על הקושי הטכני פעמיים.

נסכם: ראינו שאם \( \theta \) אלגברי מעל \( F \) אז ההרחבה הפשוטה \( F\left(\theta\right) \) היא אלגברית. מה עם הכיוון השני? אם \( E/F \) הרחבה אלגברית, האם היא פשוטה? ובכן, לא. אם זו הרחבה אינסופית (ויש הרחבות אלגבריות אינסופיות) אז בוודאי שאינה פשוטה (ראינו קודם שכל הרחבה אלגברית פשוטה היא סופית). אם לעומת זאת ההרחבה סופית, אז משפט האיבר הפרימיטיבי שהזכרתי קודם נכנס לתמונה ומראה שבחלק מהמקרים (כאשר \( E/F \) הרחבה ספרבילית, מה שזה לא יהיה) אז \( E/F \) פשוטה.

בואו נרחיב על הרחבות

כל הדיון עד כה התייחס לסיטואציה הפשוטה יחסית של הרחבה בודדת \( E/F \). הסיפור נעשה מעניין באמת כשיש לנו יותר מהרחבה אחת במשחק בו זמנית. המקרה המעניין הפשוט ביותר הוא זה שבו יש לנו שלושה שדות שכל אחד מרחיב את קודמו: הרחבות \( E/F \) ו-\( K/E \). מכיוון ש-\( F\subseteq E\subseteq K \) הרי שגם יש לנו פה הרחבה \( K/F \), ו-\( E \) הוא מעין “שדה ביניים” של ההרחבה \( K/F \) הזו. לדבר הזה אני אקרא לרוב מגדל של שדות.

השאלה הראשונה לטפל בה היא זו: אילו דברים מעניינים אפשר לומר על \( K/F \) אם אנחנו כבר יודעים דברים מעניינים על \( E/F \) ועל \( K/E \)? למשל, אם שתיהן סופיות, האם גם \( K/F \) סופית? לא רק שהתשובה היא “כן”, אלא גם אנחנו יודעים בדיוק כמה היא סופית, והכמה הזה יהיה שימושי בצורה בלתי רגילה. הנה המשפט:

  • אם \( F\subseteq E\subseteq K \) שדות אז \( \left[K:F\right]=\left[K:E\right]\left[E:F\right] \)

במילים: המימד של המרחב הוקטורי \( K \) מעל השדה \( F \) הוא מכפלת המימדים של המרחב הוקטורי \( E \) מעל \( F \) והמרחב הוקטורי \( K \) מעל \( E \). שימו לב: יש לנו פה שני מרחבים וקטוריים שונים מעל שדות שונים. זו סיטואציה שונה ממה שקורה בדרך כלל באלגברה לינארית, שם קובעים את השדה מראש וכל הדיון מתנהל מעליו; פה יש לנו מראש אינטראקציה בין מרחבים שהם מעל שדות שונים וקשורים זה לזה.

ההוכחה של המשפט היא טכנית (זה המשפט הטכני שדיברתי עליו קודם) אבל די אינטואיטיבית. בואו ניקח בסיסים לשני המרחבים הוקטוריים שלנו: \( \left\{ \alpha_{1},\dots,\alpha_{n}\right\} \) יהיה בסיס למרחב הוקטורי \( E \) מעל \( F \), ואילו \( \left\{ \beta_{1},\dots,\beta_{m}\right\} \) יהיה בסיס למרחב הוקטורי \( K \) מעל \( E \). נראה מתבקש מאוד שהבסיס ל-\( K \) מעל \( F \) יהיה פשוט מורכב מכל המכפלות האפשריות: \( B=\left\{ \alpha_{i}\beta_{j}\ |\ 1\le i\le n,1\le j\le m\right\} \). זו קבוצה מגודל \( mn=\left[K:E\right]\left[E:F\right] \), אז אם נוכיח שהיא אכן בסיס, סיימנו.

נתחיל מכך שהקבוצה שלנו אכן פורשת את \( K \) מעל \( F \). ניקח \( \theta\in K \) כלשהו. אז מכיוון שה-\( \beta \)-ות הן בסיס ל-\( K \) מעל \( E \), נקבל:

\( \theta=\sum_{j=1}^{m}b_{j}\beta_{j} \)

כך ש-\( b_{1},\dots,b_{m}\in E \) איברים כלשהם. כעת, כל אחד מהאיברים הללו ניתן לכתיבה בעצמו בתור צירוף לינארי של ה-\( \alpha \)-ות שמהוות בסיס ל-\( E \) מעל \( F \), כך שנקבל:

\( b_{j}=\sum_{i=1}^{n}a_{i}^{j}\alpha_{i} \)

עבור \( a_{i}^{j}\in F \)-ים לכל \( 1\le i\le n,1\le j\le m \).

משתי המשוואות הללו ביחד מקבלים:

\( \theta=\sum_{j=1}^{m}\left(\sum_{i=1}^{n}a_{i}^{j}\alpha_{i}\right)\beta_{j}=\sum_{i,j}a_{i}^{j}\left(\alpha_{i}\beta_{j}\right) \)

וזה צירוף לינארי עם מקדמים מ-\( F \) של אברי הקבוצה \( B \) שלנו. מכאן שהיא אכן קבוצה פורשת.

נשאר עדיין להראות ש-\( B \) היא קבוצה בלתי תלויה לינארית; הדרך הפשוטה לעשות זאת היא לקחת צירוף לינארי של אבריה ששווה אפס ולהראות שכל מקדם בצירוף הוא אפס. אם כן, נניח ש-

\( \sum_{i,j}a_{i}^{j}\left(\alpha_{i}\beta_{j}\right)=0 \)

אז בואו “נהפוך” את המשוואה הזו; נקבץ מקדמים של כל \( \beta_{j} \) ונקבל

\( \sum_{j=1}^{m}\left(\sum_{i=1}^{n}a_{i}^{j}\alpha_{i}\right)\beta_{j}=0 \)

קיבלנו כאן צירוף לינארי של אברי בסיס של \( K \) מעל \( E \) ששווה אפס, לכן נקבל לכל \( 1\le j\le m \) את המשוואה

\( \sum_{i=1}^{n}a_{i}^{j}\alpha_{i}=0 \)

וזה צירוף לינארי של אברי בסיס של \( E \) מעל \( F \) ולכן \( a_{i}^{j}=0 \) לכל \( 1\le i\le n \) וכל \( 1\le j\le m \), וקיבלנו את מה שרצינו - הקבוצה \( B \) היא אכן בסיס ל-\( K \) מעל \( F \). אין בהוכחה הזו שום דבר מתוחכם; סתם כתיבה טכנית בסגנון אלגברה לינארית.

לא סיימתי את ההוכחה עד הסוף, כי לא התייחסתי לאפשרות שאחת מההרחבות \( E/F \) או \( K/E \) היא אינסופית; במקרה זה גם \( K/F \) תהיה אינסופית (מה שמתאים לתיאור המשפט בתור מכפלה, אם מקבלים את המוסכמה \( \infty\cdot a=\infty \) וכדומה). אין כאן יותר מדי מה לומר: אם \( K/E \) היא אינסופית אז יש לנו קבוצה אינסופית של אברי \( K \) שהיא בלתי תלויה לינארית מעל \( E \); מכאן שבוודאי שהיא תהיה בלתי תלויה לינארית גם מעל \( F \) (כי מעל \( F \) יש פחות צירופים לינאריים אפשריים שיכולים לקלקל את תכונת ה”בלתי תלויה לינארית” שלה) ולכן \( K/F \) אינסופית. אם לעומת זאת \( E/F \) אינסופית, אז קיימת קבוצה אינסופית של אברי \( E \) שהיא בלתי תלויה מעל \( F \); אותה קבוצה בדיוק היא כמובן גם קבוצה של אברי \( K \) שהיא בלתי תלויה מעל \( F \), ולכן שוב \( K/F \) אינסופית.

מכאן ואילך כל מה שיקרה בפוסט הזה יהיה תוצאה של המשפט שזה עתה הראיתי.

לפני שנטבע בים של משפטים כלליים, הנה דוגמא קטנה וחביבה שמראה כמה המשפט הזה יעיל.

בואו נסתכל על הפולינום \( p\left(x\right)=x^{3}-3x-1 \) מעל \( \mathbb{Q} \). אפשר לראות בעזרת “משפט הניחוש האינטליגנטי” שאין לפולינום הזה שורשים מעל \( \mathbb{Q} \) (פשוט בודקים את כל האפשרויות; המשפט מצביע על כולן, ויש מספר סופי מהן) ולכן, מכיוון שהוא ממעלה 3, הוא אי-פריק. יהא \( \alpha \) שורש שלו (בפוסט הקודם ראינו שקיים כזה) ונסתכל על השדה \( \mathbb{Q}\left(\alpha\right) \). השאלה: האם \( \sqrt{2}\in\mathbb{Q}\left(\alpha\right) \)?

נסו רגע לחשוב איך אפשר להוכיח טענה כזו בלי כל מה שראינו בפוסט הזה. התשובה שלי: אין לי מושג. אני מניח שהייתי מנסה למצוא הצגה מפורשת ל-\( \alpha \) בעזרת נוסחת השורשים לפולינום ממעלה שלישית (אוי ווי לי) ואז… אה… אולי הייתי כופל… אה… אולי הייתי מסתכל על פולינום בזה… אה… בחיי שאין לי מושג, וכל מה שאני מנסה לחשוב עליו רק מפיל אותי לים טכני מזעזע.

ועם מה שראינו?

ובכן, אם \( \sqrt{2}\in\mathbb{Q}\left(\alpha\right) \) אז קיבלנו מגדל של שדות: \( \mathbb{Q}\subseteq\mathbb{Q}\left(\sqrt{2}\right)\subseteq\mathbb{Q}\left(\alpha\right) \). בפרט אנחנו צריכים לקבל ש-\( \left[\mathbb{Q}\left(\sqrt{2}\right):\mathbb{Q}\right] \) צריך לחלק את \( \left[\mathbb{Q}\left(\alpha\right):\mathbb{Q}\right] \). אלא מה? הפולינום המינימלי של \( \sqrt{2} \) מעל \( \mathbb{Q} \) הוא \( x^{2}-2 \) ולכן \( \left[\mathbb{Q}\left(\sqrt{2}\right):\mathbb{Q}\right]=2 \), ואילו הפולינום המינימלי של \( \alpha \) מעל \( \mathbb{Q} \) הוא \( x^{3}-3x-1 \) ולכן \( \left[\mathbb{Q}\left(\alpha\right):\mathbb{Q}\right]=3 \) אבל 2 לא מחלק את 3 - והופס, הסיפור נגמר. איכשהו הפכנו את השאלה המורכבת “האם ניתן להציג איבר באמצעות פעולות החיבור, החיסור, הכפל והחילוק של איברים אחרים” לשאלה הפשוטה “האם מספר טבעי אחד מחלק מספר טבעי אחר”. לדבר הזה יש לי שם אחד ויחיד - קסם.

פשוט על פשוט, אלגברי על אלגברי

בואו ניקח הרחבה \( E/F \) ושני איברים \( \alpha,\beta\in E \). קודם דיברנו על “הרחבה פשוטה” של \( F \) - השדה \( F\left(\alpha\right) \) שמתקבל מ”הוספת” \( \alpha \) ו”סגירה” ביחס לכך. פורמלית ההגדרה שלנו הייתה קצת שונה: הגדרנו את \( F\left(\alpha\right) \) בתור השדה הקטן ביותר שמכיל גם את \( F \) וגם את \( \alpha \); הוכחנו ששדה כזה קיים כי הוא שווה לחיתוך כל השדות שמכילים את \( F \) ואת \( \alpha \) - חיתוך שלכל הפחות \( E \) עצמו משתתף בו ולכן הוא מוגדר היטב.

את אותו דבר בדיוק אפשר לעשות גם עבור שני איברים: להגדיר את \( F\left(\alpha,\beta\right) \) בתור השדה הקטן ביותר שמכיל את \( \alpha,\beta \) ואת \( F \). השאלה שמייד קופצת באופן טבעי היא האם מתקיים \( F\left(\alpha,\beta\right)=F\left(\alpha\right)\left(\beta\right) \). כלומר, האם השדה \( F\left(\alpha,\beta\right) \) שווה ממש לשדה שמתקבל על ידי כך שקודם מרחיבים את \( F \) בצורה פשוטה עם \( \alpha \) ואז את השדה שהתקבל מרחיבים בצורה פשוטה עם \( \beta \).

התשובה חיובית. מצד אחד \( F\left(\alpha\right)\left(\beta\right) \) הוא שדה שמכיל גם את \( F \), גם את \( \alpha \) וגם את \( \beta \) ולכן על פי ההגדרה \( F\left(\alpha,\beta\right) \) מוכל בו. מצד שני, \( F\left(\alpha,\beta\right) \) הוא שדה שמכיל את \( F \) ואת \( \alpha \) ולכן בפרט מכיל את כל \( F\left(\alpha\right) \); על כן, הוא שדה שמכיל את כל \( F\left(\alpha\right) \) וגם את \( \beta \) ולכן מכיל גם את \( F\left(\alpha\right)\left(\beta\right) \). קיבלנו ששני השדות אכן שווים; לא היה פה משהו מפתיע במיוחד.

אם זה עובד עם שני איברים, אין סיבה שלא יעבוד עם מספר סופי כלשהו של איברים (בואו לא נדבר על אינסוף איברים כרגע…). אם \( \alpha_{1},\dots,\alpha_{n}\in E \) אז \( F\left(\alpha_{1},\dots,\alpha_{n}\right) \) מוגדר בתור השדה הקטן ביותר שמכיל את \( F \) ואת האיברים \( \alpha_{1},\dots,\alpha_{n} \), ויוצא שהוא שווה לסדרת ההרחבות הפשוטות \( F\left(\alpha_{1}\right)\left(\alpha_{2}\right)\cdots\left(\alpha_{n}\right) \). פורמלית, אפשר לסמן \( F_{0}=F \) ו-\( F_{k+1}=F_{k}\left(\alpha_{k+1}\right) \), ולקבל מגדל של שדות

\( F=F_{0}\subseteq F_{1}\subseteq\dots\subseteq F_{n}=F\left(\alpha_{1},\dots,\alpha_{n}\right) \)

האם אפשר לומר משהו מעניין על \( \left[F\left(\alpha_{1},\dots,\alpha_{n}\right):F\right] \)? כן ולא. לא, במובן זה שאי אפשר לדעת במדויק מה המימד הזה יהיה, כי זה תלוי ביחסים בין האיברים שאיתם מרחיבים את \( F \) ולא רק בקשר שלהם ל-\( F \) עצמו, אבל עדיין אפשר לומר משהו. בואו נסמן \( \left[F\left(\alpha_{k}\right):F\right]=m_{k} \) - זו מעלת הפולינום המינימלי של \( \alpha_{k} \) מעל \( F \). כעת, \( F_{k}=F_{k-1}\left(\alpha_{k}\right)/F_{k-1} \), ולכן המימד של ההרחבה הזו שווה למעלת הפולינום המינימלי של \( \alpha_{k} \) מעל \( F_{k-1} \). מכיוון ש-\( F\subseteq F_{k-1} \), הפולינום המינימלי של \( \alpha_{k} \) יכול להיות רק קטן יותר מעל \( F_{k-1} \), כי הוא יהיה חייב לחלק את מי שהיה הפולינום המינימלי של \( \alpha_{k} \) מעל \( F \). לכן \( \left[F_{k-1}\left(\alpha_{k}\right):F_{k-1}\right]\le m_{k} \) ולכן נקבל:

\( \left[F\left(\alpha_{1},\dots,\alpha_{n}\right):F\right]=\left[F_{n}:F_{n-1}\right]\cdots\left[F_{1}:F_{0}\right]\le m_{n}\cdots m_{1} \)

כלומר, יש לנו חסם עליון על מה מימד ההרחבה הזה יכול להיות; לא ערך מדויק כמו קודם. למשל, אפשר להראות ש-\( \left[\mathbb{Q}\left(\sqrt{2},\sqrt{3}\right):\mathbb{Q}\right]=4 \) אבל \( \left[\mathbb{Q}\left(\sqrt{2},-\sqrt{2}\right):\mathbb{Q}\right]=2 \); זה נובע מכך ש-\( \sqrt{2},\sqrt{3} \) הם איברים ש”לא קשורים אלגברית” אחד לשני, בעוד ש-\( -\sqrt{2} \) מתקבל מ-\( \sqrt{2} \) פשוט על ידי כפל באיבר מ-\( \mathbb{Q} \).

נסכם: ראינו קודם שהרחבה פשוטה עם איבר אלגברי היא סופית; עכשיו אנחנו רואים משהו קצת יותר כללי:

  • הרחבה \( F\left(\alpha_{1},\dots,\alpha_{n}\right)/F \) הנוצרת על ידי מספר סופי של איברים אלגבריים היא סופית.

הטענה הפשוטה הזו גם נותנת לנו את מה שנראה מסובך למדי קודם: המשפט שאם \( E/F \) היא הרחבה ו-\( \alpha,\beta\in E \) הם אלגבריים מעל \( F \), אז גם האיברים \( \alpha\pm\beta \), \( \alpha\beta \) ועבור \( \beta\ne0 \) גם \( \frac{\alpha}{\beta} \) הם כולם אלגבריים מעל \( F \). זה נובע מכך שכל האיברים הללו הם בעצמם איברים של ההרחבה \( F\left(\alpha,\beta\right) \) שהיא סופית ולכן אלגברית.

ראינו את ההכללה של המשפט “כל הרחבה פשוטה היא סופית”. כעת, ההיפוך של המשפט הזה - “כל הרחבה סופית היא פשוטה” - לא היה נכון, אם כי משפט האיבר הפרימיטיבי מראה שהוא כן נכון במקרים רבים; אבל עבור המשפט המורחב שכרגע הצגתי ההפך כן נכון:

  • אם הרחבה \( E/F \) היא סופית אז \( E=F\left(\alpha_{1},\dots,\alpha_{n}\right) \) עבור איברים \( \alpha_{1},\dots,\alpha_{n} \) אלגבריים מעל \( F \).

כלומר, כל הרחבה סופית נוצרת על ידי מספר סופי של איברים אלגבריים. ההוכחה לכך היא פשוטה למדי: אם \( E/F \) היא סופית, זה אומר שקיים ל-\( E \) בסיס מעל \( F \), נסמן את איבריו \( \alpha_{1},\dots,\alpha_{n} \). מכיוון שכל איבר ב-\( E \) ניתן לכתיבה בתור צירוף לינארי של האיברים הללו עם מקדמים מתוך \( F \) ברור ש-\( E\subseteq F\left(\alpha_{1},\dots,\alpha_{n}\right) \), אבל מצד שני מכיוון ש-\( E \) הוא מלכתחילה שדה שמכיל את \( F \) ואת האיברים \( \alpha_{1},\dots,\alpha_{n} \) אז \( F\left(\alpha_{1},\dots,\alpha_{n}\right)\subseteq E \) ובסך הכל קיבלנו \( E=F\left(\alpha_{1},\dots,\alpha_{n}\right) \). רק נשאר להסביר למה כל \( \alpha_{i} \) שכזה הוא אלגברי, וזה נובע מיידית מכך שההרחבה סופית: אם נסתכל על המגדל \( F\subseteq F\left(\alpha_{i}\right)\subseteq E \) נקבל ש-\( \left[F\left(\alpha_{i}\right):F\right] \) מחלק את \( \left[E:F\right] \) ולכן \( \left[F\left(\alpha_{i}\right):F\right] \) סופי בעצמו, אבל ראינו כבר בתחילת הפוסט שהרחבה פשוטה היא סופית אם ורק אם \( \alpha_{i} \) אלגברי.

לסיום סדרת המשפטים הארוכה הזו נדבר על החור היחיד שנשאר פה: הרחבה אלגברית של הרחבה אלגברית. אני אוכיח שאם \( E/F \) אלגברית ו-\( K/E \) אלגברית אז גם \( K/F \) אלגברית. כשלמדתי את הנושא הזה, המשפט הזה הפיל אותי בכל פעם מחדש; פשוט לא הצלחתי לזכור איך מוכיחים אותו. גם עכשיו אני לא זוכר. אני אומר לעצמי - המממ, ניקח \( \alpha\in K \). אני צריך למצוא פולינום מעל \( F \) שמאפס אותו, אבל אין לי שום דבר כזה כרגע; מה שאני כן יודע הוא ש-\( K/E \) אלגברית, אז קיים פולינום \( p\left(x\right)=a_{n}x^{n}+\dots+a_{1}x+a_{0} \) כך ש-\( p\left(\alpha\right)=0 \), ו-\( a_{0},\dots,a_{n}\in E \). עכשיו… אה… אני אמיר את המקדמים במשהו מעל \( F \)… אה… כי הם אלגבריים… קיימים להם פולינומים… משהו משהו…. אה…

הבנתם את הרעיון. אין לי מושג. ושוב, זה לא במקרה. תורת השדות עושה קסמים, ומי שלא מכיר את הקסמים מנסה ללכת בדרך הישירה ונתקע עם הראש בקיר. צריך לאמץ חשיבה קצת שונה כדי להתמודד עם הבעיות שתורת השדות מציבה, וזה בדיוק סוד הכוח שלה והסיבה שהיא פתרה בעיות שהיו פתוחות מאות ואלפי שנים.

אז מה עושים? פשוט מאוד. האובייקט המרכזי בתורת השדות הוא הרחבות, אז בואו נייצר לעצמנו את ההרחבה הרלוונטית: נתבונן על \( F\left(\alpha,a_{0},\dots,a_{n}\right) \) - ההרחבה של \( F \) שמתקבלת מכך שמוסיפים ל-\( F \) את האיבר \( \alpha \) שאנחנו רוצים להוכיח שהוא אלגברי מעל \( F \), ובנוסף את המקדמים של הפולינום שמאפס אותו מעל \( K \). עכשיו יש לנו מגדל של הרחבות:

\( F\subseteq F\left(a_{0},\dots,a_{n}\right)\subseteq F\left(\alpha,a_{0},\dots,a_{n}\right) \)

ההרחבה \( F\left(a_{0},\dots,a_{n}\right)/F \) נוצרת על ידי מספר סופי של איברים אלגבריים מעל \( F \), ולכן כפי שראינו קודם, היא סופית.

ההרחבה \( F\left(\alpha,a_{0},\dots,a_{n}\right)/F\left(a_{0},\dots,a_{n}\right) \) היא הרחבה פשוטה שנוצרת על ידי הוספת \( \alpha \) לשדה \( F\left(a_{0},\dots,a_{n}\right) \). הנקודה היא ש-\( \alpha \) הוא אלגברי מעל השדה הזה, כי כך בדיוק בנינו את השדה הזה! השדה \( F\left(a_{0},\dots,a_{n}\right) \) הוא בדיוק “\( F \) ובנוסף לכך האיברים הספציפיים מתוך \( E \) שנדרשים לנו כדי לקבל ש-\( \alpha \) אלגברי”. אם כן, גם ההרחבה הזו סופית, ולכן מהמשפט על המימד של מגדל הרחבות, אנחנו מקבלים שגם ההרחבה \( F\left(\alpha,a_{0},\dots,a_{n}\right)/F \) סופית, והרחבה סופית היא אלגברית, ומכאן שבפרט \( \alpha \) אלגברי מעל \( F \). שימו לב: בשום שלב לא הראיתי “בבת אחת” ש-\( K/F \) אלגברית; לקחתי איבר בודד של \( K \) והראיתי, בעזרת הרחבות שהיו תפורות סביב האיבר הזה, שהאיבר הוא אלגברי; זה מספיק.

זה מסיים את משפטי הבסיס שרציתי להראות, ואנחנו יכולים לעצור ולנשום אוויר וליהנות קצת עם האופן שבו המשפט \( \left[K:F\right]=\left[K:E\right]\left[E:F\right] \) פותר כמעט לבדו את תעלומת הבניות בסרגל ומחוגה של היוונים; מכיוון שזה נושא שעומד לא רע בפני עצמו, אני אשמור את כולו לפוסט הבא.


נהניתם? התעניינתם? אם תרצו, אתם מוזמנים לתת טיפ:

Buy Me a Coffee at ko-fi.com