מבוא להרחבת שדות

סדרת הפוסטים שלי על אלגברה מופשטת הגיעה אל תורת השדות, וזו סיבה לחגיגה, כי כאן נמצאות כמה מהתוצאות המופלאות ביותר במתמטיקה אלמנטרית מהסוג שרואים בתואר הראשון. אנחנו לא הולכים להתקדם יותר מדי לפני שנתנגש בפתרון של בעיות הבניה בסרגל ומחוגה המפורסמות של היוונים - ההוכחה שאי אפשר לרבע את המעגל, לחלק זווית לשלוש או להכפיל נפח של קוביה בעזרת סרגל ומחוגה בלבד (וכן, היה לי על זה כבר פוסט) ואחרי שנלך עוד קצת נגיע אל ההוכחה שאין פתרון כללי באמצעות פעולות החשבון והוצאות שורש למשוואה ממעלה חמישית ומעלה, ויהיו עוד כל מני דברים. זה בפני עצמו מאוד נחמד, אבל מה שבאמת יהיה נחמד פה הוא שהפתרונות הללו לא יגיעו באמצעות טכניקות אד-הוקיות שמיועדות לפתור אותן; אנחנו הולכים לבנות תורה מסודרת, קוהרנטית ויפהפיה שממנה הפתרונות יצוצו כמעט מאליהם.

על מה אנחנו הולכים לדבר, בעצם? המושג של שדה נראה כמעט משעמם אחרי מה שראינו על חוגים; הוא נראה כמו חוג שחלק מהמושגים המעניינים (למשל, אידיאלים) הפכו בו למנוונים לגמרי. ובאמת, על פי רוב לא נדבר על שדה לבדו כמו שעשינו במקרה של חוגים, אלא על הרחבת שדות - על סיטואציה שמעורבים בה שני שדות או יותר שמקיימים ביניהם יחסי הכלה כלשהם. האובייקט המעניין שאנחנו מתעסקים בו יהיה ההרחבה הזו. כך למשל הפתרון לבעיות הגאומטריות של היוונים ניתן לניסוח מקוצר בתור “הדרגה של כל הרחבה סופית של \( \mathbb{Q} \) עם מספרים ניתנים לבניה היא חזקה של 2”. בשלב מסויים נכניס לדיון את המושג של חבורת גלואה; זו חבורה שמותאמת לא לשדה בודד אלא להרחבת שדות, ויש דואליות מופלאה בין המבנה שלה ובין המבנה של ההרחבה. לכל השימושים הנפלאים הללו נגיע בהמשך; הפוסט הזה יעסוק בבסיס של הבסיס.

מבוא והגדרות בסיסיות

נתחיל מן הסתם עם ההגדרה של שדה. יש שלוש דרכים שונות ושקולות להגדיר אותו: אפשר לתת הגדרה מפורשת, עם רשימת התכונות המלאה שמגדירה שדה, כמו שעושים באלגברה לינארית; ואפשר להגיד ששדה הוא חוג קומוטטיבי (עם יחידה, אבל אני תמיד מניח שהחוגים שלי הם עם יחידה אלא אם נאמר אחרת) שבו כל איבר שונה מאפס הוא הפיך; ואפשר להגיד ששדה \( \left(\mathbb{F},+,\times\right) \) מורכב מקבוצה \( \mathbb{F} \) עם שתי פעולות בינאריות עליה כך ש-\( \left(\mathbb{F},+\right) \) היא חבורה אבלית עם איבר יחידה \( 0\in\mathbb{F} \) ו-\( \left(\mathbb{F}/\left\{ 0\right\} ,\times\right) \) היא חבורה אבלית עם איבר יחידה \( 1\in\mathbb{F} \), וכמו כן מתקיימת דיסטריביוטיביות של הכפל מעל החיבור, כלומר \( \left(a+b\right)\times c=\left(a\times c\right)+\left(b\times c\right) \). כרגיל, במקום לכתוב \( \times \) נהוג לכתוב פשוט נקודה, \( \cdot \), או אפילו לא לכתוב כלום כשברור מה קורה.

אני הכי מחבב את ההגדרה השלישית דווקא; ההגדרה הראשונה עמוסה בפרטים וההגדרה השניה קצת מפחידה כי מי זוכר בדיוק את כל הדקויות של חוגים. אבל עם ההגדרה השלישית יש לנו מושג ברור של איך נראה ומתנהג שדה - כמו שתי חבורות שמשחקות יפה. שימו לב שמההגדרה הזו נובע ש-\( 0\ne1 \); אנחנו פוסלים את הקבוצה \( \mathbb{F}=\left\{ 0\right\} \) מלהיות שדה בצורה שרירותית ומרושעת ביותר.

אם כן, הנה לנו שאלה להתחיל איתה - מהם השדות הפשוטים ביותר? עוד אין לי הגדרה ברורה ל”פשוט”, אז הנה: אני מחפש קבוצה של שדות שכל שדה מכיל לפחות אחד מהם אבל בינם לבין עצמם אין יחסי הכלה - קבוצת כל השדות המינימליים מבחינת יחס ההכלה של שדות. למרבה השמחה זו שאלה פשוטה מאוד עם תשובה מאוד קונקרטית.

מה אנחנו יודעים על כל שדה שהוא? שחייבים להיות בו 0 ו-1. עם 0 לבדו אין שום דבר מעניין לעשות - אם מחברים אותו לעצמו מקבלים 0, וגם אם כופלים אותו בעצמו מקבלים 0 (זו תכונה כללית של חוגים שאפס כפול משהו יוצא בהכרח אפס). לעומת זאת 1 זה כבר סיפור שונה בתכלית. אם כופלים 1 ב-1 מקבלים 1, אבל אם מחברים את 1 לעצמו בהחלט ייתכן שנתחיל לקבל איברים חדשים. יש שתי אפשרויות: או שכל האיברים שמתקבלים בצורה הזו הם שונים זה מזה, או שיש לפחות שניים שהם שווים. נניח ש-\( \underset{n}{\underbrace{1+1+\dots+1}}=\underset{k}{\underbrace{1+1+\dots+1}} \) עבור \( k<n \) טבעיים חיוביים כלשהם, אז אפשר להסיר \( k \) 1-ים מאגף שמאל כדי לקבל \( \underset{n-k}{\underbrace{1+1+\dots+1}}=0 \). במילים אחרות, או שכל האיברים שמתקבלים על ידי חיבור 1 לעצמו הם שונים, או שקיים מספר טבעי חיובי כלשהו \( n \) כך שאם מחברים את 1 לעצמו \( n \) פעמים מקבלים 0. למספר הטבעי החיובי המינימלי שמקיים את זה קוראים המציין (או המאפיין) של השדה; אם מספר כזה לא קיים, אז אומרים שהמציין הוא 0 (אולי היה יותר סביר להגיד שהמציין הוא אינסוף, אבל לא נתווכח עם זה).

אפשר עכשיו להשתמש בסימון המקוצר \( n\triangleq\underset{n}{\underbrace{1+1+\dots+1}} \) כדי לתאר איברים בשדה; רק צריך לזכור שאם השדה איננו ממציין אפס אז בהחלט נקבל דברים כמו \( n=k \) למרות שכמספרים טבעיים, \( n\ne k \). בגלל הסכנה לבלבול אפשר לומר שיש כאן מה שנקרא Abuse of Notation ואולי עדיף לכתוב \( \overline{n} \) או משהו, אבל אני לא אטרח.

אם \( \mathbb{F} \) הוא שדה ממציין אפס, אז מתכונות השדה עולה שלכל איבר \( n \) קיים גם נגדי \( -n \) וגם הופכי \( n^{-1} \) אלא אם \( n=0 \). שדה הוא סגור לכפל, ולכן אם \( a,b^{-1} \) הם איברים שלו כך גם \( ab^{-1} \). כעת קל מאוד לבדוק שהפונקציה \( f:\mathbb{Q}\to\mathbb{F} \) המוגדרת על ידי \( f\left(\frac{a}{b}\right)=ab^{-1} \) היא הומומורפיזם (של חוגים) חח”ע; הומומורפיזם כזה מכונה שיכון. מה שאנחנו רואים הוא שכל שדה \( \mathbb{F} \) ממציין 0 חייב להכיל את \( \mathbb{Q} \) בתור תת-שדה; הוא “נבנה מעל \( \mathbb{Q} \)”. זו תוצאה מרתקת בפני עצמה כי היא מבהירה לנו היטב את החשיבות האדירה של \( \mathbb{Q} \) בתור שדה העומד בפני עצמו (ולא סתם בתור איזו אבן בניה בדרך לממשיים): הוא השדה ממציין אפס הפשוט ביותר שקיים.

ומה קורה בשדה שאיננו ממציין אפס? נניח שהמציין של \( \mathbb{F} \) הוא \( n \), כלומר \( n=0 \) בשדה הזה. אני ארצה להוכיח ש-\( n \) הוא בהכרח ראשוני. נניח שלא, כלומר \( n=ab \) כך ש-\( 1<a<n \) ו-\( 1<b<n \). אז קיבלנו ש-\( a,b \) הם מחלקי אפס: הם איברים שונים מאפס שמכפלתם היא אפס, וזה לא יכול להתקיים בשדה, כי מחלק אפס איננו הפיך. שימו לב שבהוכחה הזו נכנסת לתמונה המינימליות של \( n \) בתור המספר הטבעי החיובי הקטן ביותר ששווה לאפס בשדה \( \mathbb{F} \); אלמלא המינימליות העובדה ש-\( 1<a<n \) לא הייתה מונעת מ-\( a \) להיות אפס בעצמו.

אם \( \mathbb{F} \) שדה ממציין ראשוני \( p \) אז הפונקציה \( f:\mathbb{Z}_{p}\to\mathbb{F} \) המוגדרת על ידי \( f\left(a\right)=a \) היא הומומורפיזם חח”ע; קיבלנו ש-\( \mathbb{Z}_{p} \) משוכן בכל שדה ממציין \( p \). המסקנה: השדות הפשוטים ביותר הקיימים הם \( \mathbb{Q} \) והשדות \( \mathbb{Z}_{p} \) עבור \( p \) ראשוני. שימו לב גם לכך שאם שדה הוא סופי אז הוא חייב להיות ממציין \( p \) סופי כלשהו, אבל ההפך איננו נכון - בהחלט יש גם שדות אינסופיים ממציין \( p \).

הרחבת שדות

מה שראינו עד כה ממחיש את הרעיון שלכל שדה שהוא קיים “שדה בסיס” - שדה פשוט במיוחד שנמצא בתוכו והוא נבנה מעליו. לא תמיד אנחנו רוצים להסתכל דווקא על הבסיס המינימלי; לפעמים יותר מעניין להסתכל על רמת ביניים אחרת. לכן הסיטואציה הכללית שמעניינת אותנו היא זו: נתונים שני שדות \( E,F \) כך ש-\( F\subseteq E \). אילו דברים מעניינים אפשר לומר על הסיטואציה הזו? קודם כל, נותנים לה סימון: הסימון \( E/F \) אומר “ההרחבה \( E \) של השדה \( F \)”. הסימון הזה הוא בעל פוטנציאל נפיץ כי הוא זהה לחלוטין לסימון שיש לנו עבור חוגי מנה; אבל מאוד נדיר שנתעניין בחוג המנה של זוג חוגים בצורה הזו, כך שהסכנה לבלבול היא לא מציאותית, כל עוד משתמשים באותיות ברורות לסימון האובייקטים (שדות מסומנים ב-\( E,F,L,K \) וכדומה; חוגים ב-\( R,S \) וכדומה; אידאלים ב-\( I,J \) וכדומה).

נקודת המוצא לכל התורה של הרחבת שדות היא שאפשר לחשוב על \( E \) בתור מרחב וקטורי מעל \( F \). על פי רוב מי שמגיעים ללימודי תורת השדות כבר ראו קודם אלגברה לינארית וגם ראו את החשיבות של שדות בה. באלגברה לינארית, האובייקט המרכזי הוא מרחב וקטורי \( V \) שהוא בבסיסו חבורה אבלית חיבורית, אבל בנוסף לכך יש ברקע שדה \( \mathbb{F} \) של “סקלרים”, ומוגדרת על \( V \) פעולה של כפל בסקלר: פונקציה \( \mathbb{F}\times V\to V \) כך ש-\( \left(\lambda,v\right)\mapsto\lambda v \) בצורה שמתקיימים הכללים שסביר שיתקיימו, כלומר \( 1\cdot v=v \) ו-\( 0\cdot v=\overline{0} \) (סימנתי את איבר האפס של \( V \) ב-\( \overline{0} \) כדי למנוע בלבול) ו-\( \left(\lambda+\rho\right)v=\lambda v+\rho v \) (חיבור ב-\( \mathbb{F} \) מתורגם פה לחיבור ב-\( V \)) ו-\( \lambda\left(v+u\right)=\lambda v+\lambda u \) ועוד דברים שאין לי כוח לכתוב. קל לראות שכאשר \( V=E \) ו-\( \mathbb{F}=F \) אז פעולת ה”כפל בסקלר” שהיא בסך הכל הכפל הרגיל ב-\( E \) (הרי כל איבר של \( F \) הוא גם איבר של \( E \) ולכן מראש מוגדר כפל בין איבר כללי של \( F \) ואיבר כללי של \( E \)) מקיימת את כל התכונות הנדרשות ממרחב וקטורי.

אני אניח מכאן ואילך שאתם מכירים אלגברה לינארית בסיסית (לא צריך מעבר לכך). הנה מבחן קטן לראות אם אתם מכירים. זוכרים שיש דבר כזה שנקרא מימד של מרחב וקטורי? אנחנו מסמנים ב-\( \dim_{\mathbb{F}}V \) את הגודל של קבוצה פורשת בלתי תלויה לינארית של איברים ב-\( V \) (תמיד קיימת כזו ותמיד כל שתי קבוצות כאלו הן מאותה עוצמה). ובכן, במקרה של הרחבת שדות המימד הזה כל כך חשוב שיש לו סימון מיוחד: \( \left[E:F\right]\triangleq\dim_{F}E \), וזה נקרא דרגת ההרחבה \( E/F \) (עוד שימוש נלוז בסימון קיים! הפעם של אינדקס של תת-חבורה. אני מניח שלא תתבלבלו, מה גם שיש סיבה לדמיון בין הסימונים). הדרגה הזו בהחלט עשויה לצאת אינסופית; בואו נראה דוגמאות.

ראשית, \( \left[\mathbb{Q}:\mathbb{Q}\right]=1 \); זה די מובן מאליו והקבוצה הפורשת היא פשוט \( \left\{ 1\right\} \) (או כל קבוצה אחרת עם איבר שונה מאפס). זה נכון לכל שדה; הדרגה של “ההרחבה” שלו את עצמו היא 1.

שנית, הנה הרחבה קטנה ונחמדה לדוגמא: \( \mathbb{Q}\left(\sqrt{2}\right)\triangleq\left\{ a+b\sqrt{2}\ |\ a,b\in\mathbb{Q}\right\} \). אפשר לחשוב על ההרחבה הזו בתור מה שמקבלים כשמוסיפים את \( \sqrt{2} \) (האי-רציונלי) ל-\( \mathbb{Q} \) ו”סוגרים” את השדה שמתקבל בהתאם (במילים אחרות - השדה שנוצר על ידי \( \mathbb{Q},\sqrt{2} \)). קבוצה פורשת לשדה הזה מעל \( \mathbb{Q} \) היא \( \left\{ 1,\sqrt{2}\right\} \) ולכן \( \left[\mathbb{Q}\left(\sqrt{2}\right):\mathbb{Q}\right]=2 \).

הנה משהו מתוחכם קצת יותר: נסמן ב-\( \alpha \) את השורש החיובי ה-\( n \)-י של \( 2 \), כלומר \( \alpha^{n}=2 \) ו-\( \alpha\in\mathbb{R}^{+} \). לא קשה לראות עם הוכחה דומה לכך ש-\( \sqrt{2} \) אי רציונלי שגם-\( \alpha^{1},\alpha^{2},\dots,\alpha^{n-1}\notin\mathbb{Q} \) ולכן \( \left[\mathbb{Q}\left(\alpha\right):\mathbb{Q}\right]=n \) (עם הבסיס \( \left\{ 1,\alpha,\dots,\alpha^{n-1}\right\} \)) . הנה כבר ראינו שיש ל-\( \mathbb{Q} \) הרחבה מכל סדר טבעי שהוא.

עכשיו בואו ניקח \( \alpha \) כך ש-\( \alpha^{4}=1 \). מה הדרגה של \( \left[\mathbb{Q}\left(\alpha\right):\mathbb{Q}\right] \)? על פניו 4, אבל בפועל \( \alpha^{2}=-1\in\mathbb{Q} \) כך שנקבל ש-\( \left\{ 1,\alpha\right\} \) הוא כבר בסיס להרחבה הזו ו-\( \left[\mathbb{Q}\left(\alpha\right):\mathbb{Q}\right]=2 \) במקרה הזה. מכאן שכדאי קצת להיזהר לפני שקובעים מהי הדרגה של הרחבה.

בואו כבר נרוץ לקטוף את הפרי הראשון של האבחנה העמוקה “אם \( E \) מרחיב את \( F \) אז הוא מרחב וקטורי מעליו”. בואו ניקח שדה סופי כלשהו \( \mathbb{F} \). כבר ראינו שהוא חייב להיות ממציין \( p \) עבור \( p \) ראשוני כלשהו ושיתקיים ש-\( \mathbb{Z}_{p} \) הוא שדה בסיס שלו (פורמלית זה אומר שב-\( \mathbb{F} \) יש עותק איזומורפי של \( \mathbb{Z}_{p} \) אבל לי לא יהיה אכפת מהדקויות הללו ואני אתנהג כאילו \( \mathbb{Z}_{p} \) עצמו הוא תת-שדה של \( \mathbb{F} \); חוץ מסימונים שונים ופחות הסתייגויות זה לא משנה כלום). מכיוון ש-\( \mathbb{F} \) שדה סופי, יש רק מספר סופי של איברים של \( \mathbb{F} \) שיכולים לשמש כאברי בסיס להרחבה \( \mathbb{F}/\mathbb{Z}_{p} \). לכן \( \left[\mathbb{F}/\mathbb{Z}_{p}\right]=n \) עם \( n\ge1 \) טבעי. עכשיו, בואו נזכור מה המשמעות של בסיס: בסיס היא קבוצה \( \left\{ v_{1},\dots,v_{n}\right\} \) של אברי \( V \) כך שכל איבר של \( V \) ניתן לכתיבה בצורה יחידה כצירוף לינארי \( \lambda_{1}v_{1}+\dots+\lambda_{n}v_{n} \). במקרה שלנו המסקנה היא שיש \( n \) איברים של \( \mathbb{F} \) כך שכל איבר ב-\( \mathbb{F} \) נכתב בצורה יחידה על ידי צירוף לינארי שלהם עם מקדמים מ-\( \mathbb{Z}_{p} \). כמה צירופים לינאריים כאלו יש? כמספר הבחירות האפשריות של מקדמים; יש לנו \( n \) בחירות שכל אחת מהן היא של אחד מתוך \( p \) איברים, ולכן בסך הכל \( p^{n} \) בחירות; קיבלנו ש-\( \left|\mathbb{F}\right|=p^{n} \). במילים: הגודל של כל שדה סופי הוא חזקה של ראשוני. בהמשך נראה משהו עוד יותר חזק - שלכל ראשוני \( p \) ולכל טבעי חיובי \( n \) קיים שדה סופי עם \( p^{n} \) איברים, ושהוא יחיד עד כדי איזומורפיזם; זה משפט המיון שיש לנו עבור שדות סופיים, ואני חושב שהוא נפלא.

עד עכשיו ההרחבות שראינו היו כולן מדרגה סופית. האם יש הרחבות אחרות בעולם? בוודאי. למשל, \( \left[\mathbb{R}:\mathbb{Q}\right]=\aleph \) משיקולי עוצמה נטו - קבוצה בת מניה של ממשיים לא יכולה לייצר את כל הממשיים על ידי צירופים לינאריים סופיים עם מקדמים רציונליים. אבל אפשר להציג הרחבה אינסופית פשוטה בהרבה: \( \mathbb{Q}\left(\pi\right)/\mathbb{Q} \). איך אני יודע שההרחבה הזו אינסופית?

ובכן, אם ההרחבה הייתה סופית, נאמר מדרגה \( n \), אז כל קבוצה של \( n+1 \) איברים של \( \mathbb{Q}\left(\pi\right) \) הייתה תלויה לינארית מעל \( \mathbb{Q} \), ובפרט הקבוצה \( \left\{ 1,\pi,\pi^{2},\dots,\pi^{n}\right\} \). מכאן שהיה קיים צירוף לינארי לא טריוויאלי של אברי הקבוצה הזו ששווה אפס: \( a_{n}\pi^{n}+\dots+a_{1}\pi+a_{0}=0 \) עבור \( a_{0},\dots,a_{n}\in\mathbb{Q} \). זה אומר ש-\( \pi \) היה שורש של הפולינום \( a_{n}x^{n}+\dots+a_{1}x+a_{0}\in\mathbb{Q}\left[x\right] \), אבל אנחנו יודעים ש-\( \pi \) הוא מספר טרנסנדנטי, כזה שאינו שורש של אף פולינום במקדמים רציונליים, והגענו לסתירה. כמובן, לומר ש”אנחנו יודעים ש-\( \pi \) טרנסנדנטי” זו חוכמה קטנה מאוד; אני צריך לכתוב פוסט שבו אני מוכיח את זה, אבל נעזוב את זה לבינתיים.

מספר ממשי נקרא אלגברי אם הוא שורש של פולינום במקדמים רציונליים, וטרנסנדנטי אם הוא לא; אין ייחוד ל-\( \pi \) מהבחינה הזו. מה שראינו הוא שאם אנחנו מרחיבים את \( \mathbb{Q} \) על ידי הוספה של מספר טרנסנדנטי - אפילו אחד ויחיד! - אז נקבל הרחבה מדרגה אינסופית. זה גורם לכך שלפחות בהתחלה, נצמצם את עצמנו רק להרחבות שבהן מוסיפים ל-\( \mathbb{Q} \) איברים אלגבריים; ובאופן כללי, לכאלו שבהן לוקחים שדה קיים ומוסיפים לו איברים שהם אלגבריים מעליו (כלומר, מאפסים פולינומים עם מקדמים מתוכו, לאו דווקא עם מקדמים רציונליים).

איך בונים שדה שורש, או - למה המרוכבים קיימים וממש לא אכפת להם אם אתם לא מאמינים בזה

עכשיו הגענו אל מה שאני מחשיב לאחד מהמשפטים החשובים במתמטיקה למרות שהוא כמעט טריוויאלי בשלב הזה. לפני שאני אצטט את המשפט הכללי אני אראה מקרה פרטי פשוט במיוחד שלו - הבניה של המספרים המרוכבים שהיא לטעמי הדרך הנכונה ביותר לחשוב עליהם.

השדה שלנו יהיה הפעם \( \mathbb{R} \), המספרים הממשיים. נסתכל על הפולינום \( p\left(x\right)=x^{2}+1\in\mathbb{R}\left[x\right] \). אין לפולינום הזה שורש מעל הממשיים; אין מספר ממשי שכשמעלים אותו בריבוע מקבלים מינוס 1. כפי שראינו בפוסט הקודם על פולינומים, לפולינום ממעלה 2 או 3 שהוא פריק בהכרח יש שורש, כך ש-\( p\left(x\right) \) הוא אי-פריק מעל הממשיים. כעת, ראינו כבר בפוסט על אידאלים שאם איבר הוא אי-פריק בתחום שלמות, אז האידאל שהוא יוצר הוא מקסימלי. דהיינו, האידאל \( \left\langle p\left(x\right)\right\rangle \) הוא אידאל מקסימלי בחוג \( \mathbb{R}\left[x\right] \), וזה אומר שחוג המנה \( \mathbb{R}\left[x\right]/\left\langle p\left(x\right)\right\rangle \) הוא שדה (חוג מנה כשמחלקים באידאל מקסימלי הוא שדה; גם את זה ראינו בפוסט ההוא).

איך חוג המנה הזה נראה? אם אסמן \( I=\left\langle p\left(x\right)\right\rangle \) אז אפשר לסמן איבר כללי של חוג המנה בתור \( q\left(x\right)+I \), אבל אני אשמיט את ה-\( +I \) הזה ואבקש מכולנו לזכור ששוויון בחוג הזה הוא מודולו \( I \), כלומר שני איברים \( q\left(x\right),t\left(x\right) \) הם שווים אם ורק אם \( q\left(x\right)-t\left(x\right)\in I \). בפרט, בחוג המנה הזה מתקיים \( x^{2}+1=0 \) ולכן \( x^{2}=-1 \). זה מראה לנו שכל פולינום ממעלה 2 או יותר שקול לפולינום ממעלה 1 לכל היותר: כל איבר מהצורה \( a_{n}x^{n} \) בפולינום כללי עם \( n\ge2 \) ניתן להחליף ב-\( -a_{n}x^{n-2} \) באמצעות השוויון \( x^{2}=-1 \) ופשוט לחזור על זה עד שלא יוותרו איברים עם חזקות גבוהות מ-1. לכן איבר כללי של השדה הזה הוא מהצורה \( a+bx \) כאשר \( a,b\in\mathbb{R} \).

איך עובדות פעולות החיבור והכפל בחוג הזה? בשני המקרים מדובר על חיבור וכפל רגילים של פולינומים, אבל אחרי הביצוע שלהן נרצה לחזור לפולינום ממעלה 1 לכל היותר ולכן נבצע את ההחלפה שתיארתי למעלה אם יש צורך. במקרה של חיבור פולינומים לא יהיה צורך, כי חיבור פולינומים לא מגדיל את הדרגה:

\( \left(a+bx\right)+\left(c+dx\right)=\left(a+c\right)+\left(b+d\right)x \)

אבל במקרה של כפל אכן נקבל משהו ממעלה 2:

\( \left(a+bx\right)\left(c+dx\right)=ac+\left(ad+bc\right)x+bdx^{2} \)

נחליף את \( bdx^{2} \) ב-\( -bd \) ונקבל:

\( \left(a+bx\right)\left(c+dx\right)=\left(ac-bd\right)+\left(ad+bc\right)x \)

שימו לב שאם \( b=d=0 \), כלומר שני הפולינומים שלנו ממעלה 0, אז פעולות החיבור והכפל יוצאות פעולות החיבור והכפל הרגילות של מספרים ממשיים; זה מראה ש-\( \mathbb{R} \) ניתן לשיכון בחוג החדש שלנו בצורה פשוטה (המספר הממשי \( r \) עובר לפולינום \( r \) שהוא פולינום ממעלה 0 שהמקדם החופשי שלו הוא \( r \)), ולכן - שמה שעשיתי פה היה לבנות שדה הרחבה של \( \mathbb{R} \).

אנחנו כבר מכירים טוב את שדה ההרחבה הזה, אבל בדרך כלל מסמנים אותו בצורה טיפ-טיפה שונה. ההבדל היחיד הוא שבמקום לכתוב \( x \) בתור המשתנה של הפולינום, אנחנו כותבים \( i \). כלומר, השדה שבנינו מורכב מכל האיברים מהצורה \( a+bi \) עם כללי החיבור והכפל

  • \( \left(a+bi\right)+\left(c+di\right)=\left(a+c\right)+\left(b+d\right)i \)
  • \( \left(a+bi\right)\left(c+di\right)=\left(ac-bd\right)+\left(ad+bc\right)i \)

השדה הזה נקרא שדה המספרים המרוכבים וכרגע הראיתי לכם את הדרך שבה לדעתי הכי נכון לבנות אותו. כמה היא טובה, לדעתי? שאם מישהו בא ואומר לי שהמרוכבים הם “המצאה” או “שלא צריך אותם” אני שותק לי ובלב חושב שהמרוכבים מוסרים לו תודה רבה אבל הם קיימים בין אם הוא יכיר בהם ובין אם לאו והם מסתדרים טוב מאוד גם בלי שהוא יצטרך אותם. יש בניות מתמטיות שהן כל כך אלמנטריות שמי שבוחר להתעלם מהן, פשוט בוחר להתעלם מהמציאות.

ייתכן שתגידו - מה. מה זו הדרך הגרועה הזו לבנות את המרוכבים. הדרך שלנו הרבה יותר טובה! ואז תציגו דרך. זה בסדר גמור, אין לי שום התנגדות לכך; הדבר היחיד שחשוב מבחינתי הוא שבסוף תהליך הבניה שלכם אפשר יהיה להראות שהשדה שאתם בניתם איזומורפי לשדה שאני בניתי, כך ששנינו מדברים על אותו אובייקט ורק נותנים “מימוש” שונה שלו. עוד מימושים זה טוב יותר, לא רע יותר; זה מראה איך אפשר להגיע אל אותו האובייקט מכמה כיוונים שונים ומשונים.

אבל למה אני כל כך אוהב את הבניה הזו? כי בעצם לא עשינו כאן שום דבר שרלוונטי רק לממשיים, המרוכבים או כל דבר אחר; עשינו כאן תהליך שאפשר לבצע בכל שדה. הנה התהליך: נתון שדה \( F \) ונתון פולינום \( p\left(x\right) \) לא קבוע כלשהו מעל \( F \) כך שאין ל-\( p\left(x\right) \) שורש מעל \( F \) (במרוכבים, למשל, סיטואציה כזו לא תיתכן בכלל כי לכל פולינום ממעלה גדולה מאפס יש שורש). אני טוען שקיימת ל-\( F \) הרחבה, \( E/F \), כך שב-\( E \) יש שורש לפולינום \( p\left(x\right) \).

איך מראים את זה? ראשית, אם \( p\left(x\right) \) איננו אי פריק, אז מספיק לקחת גורם אי פריק כלשהו שלו ולהראות שדה \( E \) שבו לאותו גורם אי פריק יש שורש; השורש של גורם של \( p\left(x\right) \) הוא גם שורש של \( p\left(x\right) \) עצמו (כי אם \( p\left(x\right)=s\left(x\right)t\left(x\right) \) ו-\( s\left(\alpha\right)=0 \) אז \( p\left(\alpha\right)=s\left(\alpha\right)t\left(\alpha\right)=0\cdot t\left(\alpha\right)=0 \)). לכן אפשר להניח ש-\( p\left(x\right) \) אי פריק. עכשיו מבצעים בדיוק את התהליך שביצעתי קודם: מגדירים \( E=F\left[x\right]/\left\langle p\left(x\right)\right\rangle \). אוטומטית קיבלנו ש-\( E \) הוא שדה כי הוא חוג מנה שמתקבל על ידי חלוקה באידאל מקסימלי. אפשר לשכן את \( F \) ב-\( E \) על ידי ההומומורפיזם \( f\left(a\right)=a \) (האיבר \( a\in F \) עובר לפולינום עם מקדם חופשי \( a \)), ומכיוון שב-\( E \) מתקיים \( p\left(x\right)=0 \), קיבלנו ש-\( x \) עצמו - פולינום ממעלה 1 עם מקדם חופשי 0 ומקדם מוביל 1 - הוא שורש של הפולינום \( p\left(x\right) \).

זה נשמע קצת מגוחך כשרואים את זה בפעם הראשונה. עד לפני רגע \( x \) היה “משתנה” שמשתמשים בו כדי לסמן דברים בתוך הפולינום, ופתאום הוא הפך להיות “שורש” של הפולינום. אבל זה הרי לא המצב - הטענה היא לא שהמשתנה \( x \) הוא שורש של \( p\left(x\right) \), אלא שקיים פולינום \( q\left(x\right) \) שבחוג המנה \( F\left[x\right]/\left\langle p\left(x\right)\right\rangle \), חוג שהאיברים שלו הם פולינומים בעצמם, כשמציבים את \( q\left(x\right) \) בתוך \( p\left(x\right) \) מקבלים את האפס של חוג המנה הזה. כלומר, פורמלית, \( p\left(q\left(x\right)\right)+I=I \) כש-\( I=\left\langle p\left(x\right)\right\rangle \). ומי הפולינום הקסום הזה, \( q\left(x\right) \)? ובכן, כן, \( q\left(x\right)=x \). אפשר גם לכתוב \( q\left(x\right)=1\cdot x^{1}+0\cdot x^{0} \) אם זה יעזור להרגשה ש-\( q\left(x\right) \) הוא לא המשתנה \( x \) אלא פולינום שנכתב בעזרת המשתנה הזה, כמו כל פולינום אחר שעליו אנחנו מדברים פה.

הרחבות אלגבריות פשוטות

הנה דרך נוספת להתבונן על הסיפור הזה. בואו נניח לרגע שכבר ידוע לנו שקיים שדה \( E \) שמרחיב את \( F \) ושיש איבר \( \theta\in E \) כך ש-\( p\left(\theta\right)=0 \) בחוג \( E \) הזה. למשל: הפולינום \( p\left(x\right)=x^{2}-2 \) מעל \( F=\mathbb{Q} \), השדה \( E=\mathbb{R} \) והאיבר \( \theta=\sqrt{2} \). אם נסתכל על השדה \( F\left(\theta\right) \) שמתקבל מ-\( F \) על ידי הוספה של \( \theta \), מה נקבל?

ובכן, בגלל שהשדה סגור לכפל אנחנו מקבלים את כל המכפלות של \( \theta \) בעצמו, כלומר את כל האיברים \( \theta,\theta^{2},\theta^{3},\dots \). כמו כן, אנחנו מקבלים את כל המכפלות של איברים כאלו באיברים של \( F \) וסכומים שלהם - בסך הכל אנחנו מקבלים ש-

\( F\left(\theta\right)=\left\{ a_{n}\theta^{n}+\dots+a_{1}\theta+a_{0}\ |\ n\in\mathbb{N},\ a_{0},\dots,a_{n}\in F\right\} \)

כאשר כאן אין חסם על \( n \); יש ב-\( F\left(\theta\right) \) איברים שמתקבלים מסכומים סופיים עם מספר גדול כרצוננו של מחוברים וחזקות גדולות כרצוננו של \( \theta \). במילים אחרות, \( F\left(\theta\right) \) הוא מרחב וקטורי מעל \( F \) עם הקבוצה הפורשת \( \left\{ \theta^{k}\ |\ k\in\mathbb{N}\right\} \). עם זאת, זה לא אומר שכל האיברים שמתקבלים כך יהיו שונים מזה מזה; העובדה ש-\( p\left(\theta\right)=0 \) מראה שאפשר להחליף חזקות גבוהות של \( \theta \) בחזקות נמוכות יותר. ספציפית, אם \( p\left(x\right)=a_{n}x_{n}+\dots+a_{1}x+a_{0} \) אז נקבל את המשוואה \( a_{n}\theta^{n}+\dots+a_{1}\theta+a_{0}=0 \); זו הפעם לא משוואה מודולו שום דבר אלא פשוט משוואה שמתקיימת בשדה \( E \), ולכן גם ב-\( F\left(\theta\right) \). המקדם \( a_{n} \) שייך לשדה ושונה מאפס, ולכן אפשר לקבל

\( \theta^{n}=-\frac{1}{a_{n}}\left(a_{n-1}\theta^{n-1}+\dots+a_{1}\theta+a_{0}\right) \)

המשוואה הזו מראה איך אפשר להחליף כל חזקה של \( \theta \) החל מה-\( n \)-ית ומעלה בצירוף לינארי כלשהו של חזקות נמוכות יותר; זה מוביל לכך שאפשר לכתוב

\( F\left(\theta\right)=\left\{ a_{n-1}\theta^{n-1}+\dots+a_{1}\theta+a_{0}\ |a_{0},\dots,a_{n}\in F\right\} \)

האם הכתיב הזה הוא יחיד, כלומר האם כל איבר של \( F\left(\theta\right) \) נכתב כך בדיוק פעם אחת? זה תלוי בשאלה אם \( p\left(x\right) \) פריק או אי-פריק. התעלול הולך כך: מה שאני בעצם רוצה להראות הוא שהמרחב הוקטורי \( F\left(\theta\right) \) הוא בעל בסיס \( \left\{ 1,\theta,\theta^{2},\dots,\theta^{n-1}\right\} \). אם הקבוצה הזו אינה בסיס, אז מכיוון שכבר ראינו שהיא פורשת, היא בהכרח חייבת להיות תלויה לינארית - כלומר, קיים צירוף \( a_{n-1}\theta^{n-1}+\dots+a_{1}\theta+a_{0}=0 \) שלא כל מקדמיו אפס, מה שאומר שמצאנו פולינום ממעלה קטנה מ-\( n \) ש-\( \theta \) היא שורש שלו. אני טוען שדבר כזה לא יכול לקרות. למה?

בואו נחזור רגע לחומר שאולי ראיתם באלגברה לינארית - פולינום מינימלי. בלינארית רואים את זה בהקשר של מטריצות אבל פה אפשר לדבר באופן כללי יותר. אם יש לנו הרחבה \( E/F \) ואיבר \( \theta\in E \) אז אפשר להסתכל על קבוצת כל הפולינומים ב-\( F\left[x\right] \) ש-\( \theta \) הוא שורש שלהם. קל לראות שהקבוצה הזו היא אידאל: אם \( p\left(\theta\right)=0 \) וגם \( q\left(\theta\right)=0 \) אז \( \left(p+q\right)\left(\theta\right)=p\left(\theta\right)+q\left(\theta\right)=0+0=0 \) וכמו כן אם \( t\left(x\right) \) הוא פולינום כלשהו אז \( \left(pt\right)\left(\theta\right)=p\left(\theta\right)t\left(\theta\right)=0\cdot t\left(\theta\right)=0 \), כך שמתקיימות שתי התכונות המגדירות של אידאל. כעת, חוג הפולינומים \( F\left[x\right] \) הוא תחום אוקלידי ולכן הוא בפרט תחום ראשי: כל אידאל נוצר על ידי איבר בודד. כמובן, ייתכן שיש כמה יוצרים שונים לאותו אידאל (כל אחד מהם יוצר את אותו אידאל לבד); למעשה, אם ניקח יוצר כלשהו של האידאל ונכפול אותו באיבר שונה מאפס מתוך \( F \) נקבל יוצר אחר של האידאל. לכן אפשר לבחור יוצר שהוא פולינום מתוקן: \( p\left(x\right)=x^{n}+a_{n-1}x^{n-1}+\dots+a_{1}x+a_{0} \). היוצר הזה נקרא הפולינום המינימלי של \( \theta \) מעל \( F \). השדה שמעליו נלקח הפולינום הוא קריטי כאן; ל-\( \sqrt{2} \) יש מעל \( \mathbb{Q} \) את הפולינום המינימלי \( x^{2}-2 \) אבל מעל \( \mathbb{R} \) יש לו את הפולינום המינימלי \( x-\sqrt{2} \).

עכשיו, מה זה אומר שפולינום יוצר אידאל כלשהו? זה אומר, בפרט, שהוא מחלק את כל האיברים באידאל ללא שארית. מכאן שהפולינום המינימלי של \( \theta \) הוא בעל המעלה המינימלית מבין כל הפולינומים מעל \( F \) שמאפסים את \( \theta \). כמו כן זה אומר שהוא חייב להיות אי פריק (כי אם היה פריק, היה פולינום ממעלה קטנה יותר ש-\( \theta \) עדיין שורש שלו) ושכל פולינום אחר שמאפס את \( \theta \) וממעלה גדולה משלו חייב להיות פריק (כי הוא מחלק אותו והגורם השני הוא לא פולינום ממעלה 0).

זה מחזיר אותנו לטענה שבה עצרתי - ראינו שאם \( \left\{ 1,\theta,\theta^{2},\dots,\theta^{n-1}\right\} \) אינה בסיס של \( F\left(\theta\right) \) אז בהכרח קיים פולינום ממעלה קטנה מ-\( n \) שמאפס את \( \theta \), וזה בלתי אפשרי אם \( p\left(x\right) \) - הפולינום מעל \( F \) שמאפס את \( \theta \) וממנו התחלנו את כל הסיפור - הוא אי פריק.

במקרה ש-\( p\left(x\right) \) אי פריק, כל הדיון שניהלנו עד עכשיו מראה די בקלות שיש איזומורפיזם \( F\left(\theta\right)\cong F\left[x\right]/\left\langle p\left(x\right)\right\rangle \), כלומר שהשדה שמתקבל בדרך “טבעית”, על ידי לקיחת שורש של \( p\left(x\right) \) שאנחנו “באמת יודעים שקיים” ומרחיבים את \( F \) באמצעותו - השדה הזה הוא בדיוק, אבל בדיוק, אותו שדה כמו זה שמתקבל באופן “מלאכותי” על ידי לקיחת חוג הפולינומים \( F\left[x\right] \) וחלוקתו באידאל שנוצר על ידי \( \left\langle p\left(x\right)\right\rangle \). אם הבניה ה”מלאכותית” הזו נותנת בדיוק את אותו שדה, אני חושב שאין סיבה להזדקק בכלל לנסיבות הקסומות של “או היי הלכתי ברחוב ופתאום נפל עלי שדה \( E \) שמרחיב את \( F \) ויש בו איבר \( \theta \) שמתאים בול - בול! - לפולינום \( p\left(x\right) \) הזה שלך שחיפשת לו שורש”. די לי בבניה \( F\left[x\right]/\left\langle p\left(x\right)\right\rangle \) כדי לטעון את הטענה הרת הגורל “לכל שדה \( F \) וכל פולינום \( p\left(x\right) \) מעל \( F \) קיימת הרחבה של \( F \) שבה יש ל-\( p\left(x\right) \) שורש”.

אבל בעצם, ראינו הרבה יותר מזה. לא סתם שקיימת הרחבה, אלא שבמקרה שבו \( p\left(x\right) \) אי פריק, כל הרחבה אפשרית של \( F \) על ידי הוספת שורש של \( p\left(x\right) \) נותנת לנו שדות שהם איזומורפיים. בניסוח מפוצץ, אין ל-\( F \) דרך אלגברית להבדיל בין שורשים שונים של אותו פולינום אי פריק מעליה. דוגמא פשוטה לכך היא המרוכבים עצמם. מה ההבדל בין השדה שמתקבל מ-\( \mathbb{R} \) על ידי כך שאנחנו מרחיבים אותו עם \( i \), והשדה שמתקבל אם מרחיבים אותו עם \( -i \)? זה בדיוק אותו שדה. ומה בעצם ההבדלים בין \( i \) ובין \( -i \), פרט לכך שלאחד טרחנו לתת שם יפה ואילו לשני דחפנו סימן מינוס? כשמעלים כל אחד מהם בריבוע, מקבלים \( -1 \); האם יש לנו דרך כלשהי להציע משוואה פולינומית מעל \( \mathbb{Q} \) שאחד מהם יקיים והשני לא? התשובה שלילית.

הנה דוגמא אחרת, מעניינת יותר - הפולינום \( p\left(x\right)=x^{3}-2 \). כדי להבין מה השורשים שלו, בואו קודם כל נסתכל על המשוואה \( x^{3}=1 \) - מה הפתרונות שלה? 1 הוא פתרון, אבל יש עוד שני פתרונות נוספים אם מרשים מספרים מרוכבים: \( e^{\frac{2\pi i}{3}} \) ו-\( e^{\frac{4\pi i}{3}} \). אני אסמן \( \omega\triangleq e^{\frac{2\pi i}{3}} \); קיבלנו מספר מרוכב כך ש-\( \omega^{0},\omega^{1},\omega^{2} \) הם בדיוק השורשים של \( x^{3}-1 \). ה-\( \omega \) הזה נקרא שורש יחידה פרימיטיבי מסדר 3; אנחנו עוד נפגוש אותו בהמשך (והוא כבר הופיע בעבר בבלוג באותו הקשר שעליו אכתוב פוסט חדש). עכשיו קל לראות שהשורשים של \( p\left(x\right)=x^{3}-2 \) הם בדיוק \( \omega^{k}\sqrt[3]{2} \) עבור \( k=0,1,2 \) - פשוט תעלו את השורשים הללו ב-3 ותראו מה קורה. קיבלנו, אם כן, שלוש הרחבות שונות של \( \mathbb{Q} \) שהן כולן איזומורפיות: \( \mathbb{Q}\left(\sqrt[3]{2}\right),\mathbb{Q}\left(\omega\sqrt[3]{2}\right),\mathbb{Q}\left(\omega^{2}\sqrt[3]{2}\right) \); עם זאת, הן בבירור שונות זו מזו - למשל, \( \mathbb{Q}\left(\sqrt[3]{2}\right)\subseteq\mathbb{R} \) אבל ב-\( \mathbb{Q}\left(\omega\sqrt[3]{2}\right) \) קיימים מספרים מרוכבים שאינם ממשיים. במילים אחרות, אין לי איך לבטא מעל \( \mathbb{Q} \) בדרך אלגברית את התכונה “אני מספר מרוכב שאינו ממשי”. מה שאולי מרגיש מגוחך כי אפשר לתאר את התכונה הזו על ידי משוואה פשוטה: \( \overline{z}\ne z \). אבל איך מנסחים את זה באמצעות אברי \( \mathbb{Q} \) ופעולות החיבור והכפל? (למי שהדיון הזה מעניין אותו, בתורת המודלים בלוגיקה אפשר לפרמל את נפנוף הידיים שביצעתי כאן).

אני חושב שהגעתי לנקודה טובה לעצור בה את הפוסט - המטרה בפוסט הנוכחי הייתה להראות את הבניה הבסיסית של הרחבת השדות שהצגתי בה; בפוסט הבא נדבר קצת יותר על מה אנחנו יודעים על הרחבות שכאלו.


נהניתם? התעניינתם? אם תרצו, אתם מוזמנים לתת טיפ:

Buy Me a Coffee at ko-fi.com