שדות פיצול וסגורים אלגבריים

סדרת הפוסטים שלי על תורת השדות התחילה עם הסיטואציה הבאה: נניח שיש לנו שדה \( F \) ופולינום \( p\left(x\right)\in F\left[x\right] \). אז אנחנו יודעים לבצע להטוט שמייצר יש מאין שורש של הפולינום \( p\left(x\right) \) הזה אפילו אם ב-\( F \) אין לו שורשים בכלל; אנחנו בונים הרחבת שדות \( E/F \) שבה לפולינום \( p\left(x\right) \) יש שורש.

בגלל הדחף הבלתי נשלט של המתמטיקאים להכליל הכל ומייד, מייד מתעוררות שתי שאלות טבעיות:

האם אפשר לבנות הרחבה \( E/F \) שבה לפולינום \( p\left(x\right) \) יש את כל השורשים שלו?
האם אפשר לבנות הרחבה \( E/F \) שבה לכל פולינום יהיו כל השורשים שלו?

התשובה לשני אלו חיובית. עבור השאלה הראשונה, השדה \( E \) הקטן ביותר שיקיים את התכונה המבוקשת נקרא שדה הפיצול של \( p\left(x\right) \), ואילו עבור השאלה השניה השדה \( E \) הקטן ביותר שיקיים את התכונה המבוקשת נקרא הסגור האלגברי של \( F \). הבניה של היצורים הללו תהיה דומה באופיה לבניה של שדה השורש של \( p\left(x\right) \) מעל \( F \) שכבר ראינו - אבל עם עוד קצת סיבוכים מתמטיים, בפרט במקרה של הסגור האלגברי, שרק מחדדים את האלגנטיות של הפתרון.

שדות פיצול

נתחיל עם שדות פיצול, שהם הסיפור הפשוט יותר כאן. אם \( p\left(x\right) \) פולינום מעל \( F \) כך שכל השורשים של \( p\left(x\right) \) שייכים ל-\( F \), אז אפשר לכתוב \( p\left(x\right)=\left(x-a_{1}\right)\cdots\left(x-a_{n}\right) \) כאשר \( a_{1},\dots,a_{n} \) הם השורשים (הלאו דווקא שונים זה מזה) של \( p\left(x\right) \). במילים אחרות, בחוג \( F\left[x\right] \) הפולינום \( p\left(x\right) \) מתפרק לגורמים לינאריים. כשפולינום מתפרק לגורמים לינאריים אומרים שהוא מתפצל (או אפילו “מתפצל לחלוטין” אם לא רוצים להשאיר מקום לספק, הרי “פיצול” נשמע כמו סתם פירוק למכפלה של שני פולינומים).

בואו נסתכל לרגע על הפולינום \( p\left(x\right)=x^{2}+1 \) מעל \( \mathbb{Q} \). השורשים שלו הם המספרים המרוכבים \( i,-i \), ולכן ברור שמעל הרציונליים הוא אי-פריק, כלומר לא מתפצל. עם זאת, מעל המרוכבים \( \mathbb{C} \) מתקיים \( p\left(x\right)=\left(x-i\right)\left(x+i\right) \) - הפולינום התפצל. העניין הוא שהמרוכבים הם שדה ענקי; המימד של ההרחבה \( \mathbb{C}/\mathbb{Q} \) הוא אינסופי. לא צריך כל כך הרבה הרחבה רק כדי לפצל את הפולינום המסכן הזה; גם השדה \( \mathbb{Q}\left(i\right) \), שהוא הרחבה ממעלה 2 של \( \mathbb{Q} \), היה מפצל את \( p\left(x\right) \). מצד שני, אם שדה כלשהו שמרחיב את \( \mathbb{Q} \) מפצל את \( p\left(x\right) \) הוא בוודאי חייב לכלול את השורש \( i \) של \( \mathbb{Q} \), ומכאן שכל שדה שמפצל את \( p\left(x\right) \) יכיל את \( \mathbb{Q}\left(i\right) \) (שמוגדר להיות השדה המינימלי שמכיל את \( \mathbb{Q} \) ואת \( i \)). על כן, \( \mathbb{Q}\left(i\right) \) הוא שדה הפיצול של \( x^{2}+1 \) מעל \( \mathbb{Q} \).

באופן כללי, שדה פיצול של פולינום \( p\left(x\right) \) מעל \( F \) הוא ההרחבה הקטנה ביותר של \( F \) שמפצלת את \( p\left(x\right) \). מכיוון שכל הרחבה שמפצלת את \( p\left(x\right) \) חייבת לכלול את השורשים של \( p\left(x\right) \), אז ההרחבה של \( F \) שמתקבלת בדיוק מהוספת השורשים הללו - מה שסימנתי \( F\left(a_{1},a_{2},\dots,a_{n}\right) \) בפוסט קודם - תהיה שדה פיצול של \( p\left(x\right) \). אבל יש כאן כמה נקודות עדינות שצריך להתייחס אליהן. ראשית, כאשר נתון לנו פולינום \( p\left(x\right) \) מעל \( F \), לא נתון לנו שקיימים לו שורשים בכלל מעבר למה שנמצא בתוך \( F \). אין לנו איזו הרחבה פלאית \( E \) של \( F \) שבה הפולינום מתפצל; כל האתגר הוא לבנות אותה בעצמנו. את זה אנחנו יודעים לעשות “צעד-צעד” - בכל פעם לבנות הרחבת שדות שמוסיפה שורש אחד. אז הנה דרך מסודרת לעשות את זה:

אם ל-\( p\left(x\right) \) יש שורש ב-\( F \), נהדר! נסמן אותו \( a_{1} \) ונגדיר “הרחבה” \( F_{1}=F\left(a_{1}\right) \) (שבעצם תהיה שווה ל-\( F \) כי לא הוספנו כלום). אם אין לו שורש ב-\( F \), נהדר! נבנה שדה הרחבה \( F_{1}/F \) שמכיל שורש של \( p\left(x\right) \) ונסמן את השורש הזה \( a_{1} \). כלומר, בשני המקרים קיבלנו \( F_{1}=F\left(a_{1}\right) \). כעת נסתכל על הפולינום \( p_{1}=\frac{p\left(x\right)}{\left(x-a_{1}\right)} \) ונחפש שורש שלו מעל \( F_{1} \) באותה הדרך וכן הלאה. כך נקבל סדרה \( F_{1},F_{2},\dots \) של הרחבות של \( F \) ופולינומים \( p_{1},p_{2},\dots \) שהם רכיבים הולכים וקטנים מתוך \( p \). כל צעד מקטין את הדרגה של הפולינום שאנחנו עובדים עליו כרגע ב-\( 1 \), ולכן אם \( n \) היא הדרגה של \( p \) המקורי, נסיים תוך \( n \) צעדים, אחרי שמצאנו/המצאנו \( n \) שורשים (לאו דווקא שונים זה מזה) \( a_{1},\dots,a_{n} \) ובנינו \( n \) הרחבות פשוטות מהצורה \( F_{k}=F_{k-1}\left(a_{k}\right) \) (כאשר \( F_{0}=F \)). כבר ראינו בפוסט קודם שלי שסדרה כזו של הרחבות פשוטות שנוצרת מהוספה סדרתית של \( a_{1},a_{2},\dots,a_{n} \) נותנת לנו את ההרחבה \( F\left(a_{1},\dots,a_{n}\right) \) של \( F \); הנקודה העדינה פה היא שכשהתחלתי את ההוכחה לא הנחתי שכבר קיימים איברים \( a_{1},\dots,a_{n} \) אלא יצרתי אותם יש מאין במהלך ההוכחה.

הבונוס הוא שאני מקבל הערכה כלשהי למימד של שדה הפיצול: \( \left[F_{1}:F_{0}\right]\le n \) כי \( F_{1} \) מתקבלת על ידי הוספת שורש של פולינום ממעלה \( n \), ולכן הפולינום המינימלי של השורש הזה הוא מדרגה לכל היותר \( n \). מאותו נימוק גם \( \left[F_{2}:F_{1}\right]\le n-1 \) וכן הלאה: נקבל ש-\( \left[F_{n}:F\right]=\left[F_{n}:F_{n-1}\right]\cdots\left[F_{1}:F_{0}\right]\le1\cdot2\cdots n=n! \). כלומר, המימד של שדה פיצול של \( p\left(x\right) \) ממעלה \( n \) מעל \( F \) הוא לכל היותר \( n! \), אם כי ברוב המוחץ של המקרים המימד יהיה קטן משמעותית יותר (אבל “במקרה הכללי” הוא יהיה שווה בדיוק \( n! \); אותו “מקרה כללי” יהיה בעל חשיבות אדירה בהמשך, כשנדבר על תורת גלואה, ואז נראה אותו).

עוד נקודה עדינה אף יותר שצריך להתייחס אליה הוא ששדה הפיצול הוא לא יחיד. אמנם, דיברתי על “השדה הקטן ביותר” וכל אופן ההצגה שלי היה כאילו יש לפולינום רק שדה פיצול אחד, אבל זה לא בהכרח המצב. הוכחת הקיום שלי של שדה הפיצול התבססה על שיטת בניה ספציפית של שדה הרחבה שמוסיף שורשים לפולינום; בוודאי שאפשר לתת בניות שונות שיתנו שדות שונים. יותר מכך - הבניה שלי תלויה בסדר שבו אני בוחר לאיזה גורם אי-פריק של הפולינום בא לי להוסיף שורש באותו הרגע. בחירות שונות יניבו שדות הרחבה שונים. העניין הוא שכל הדברים הללו הם בסופו של יום איזומורפיים. הסיבה שהיה לי נוח להציג שיטה אחת ליצור יש מאין שורש לפולינום ולא לדון בכלל על שיטות אפשריות היא שאפשר להוכיח שכל הרחבה שמוסיפה שורש אחד לפולינום תהיה איזומורפית למה שבנינו. באופן כללי בתורת השדות הרבה ממה שאנחנו מדברים עליו הוא “עד כדי איזומורפיזם” עד שאנחנו כבר שוכחים מהשטות הזו של “פורמלית אלו לא אותם שדות”.

העסק הזה תקף גם לשדות פיצול: אפשר להוכיח שכל שני שדות פיצול של \( p\left(x\right) \) מעל \( F \) יהיו איזומורפיים. ההוכחה היא אחת מאותן הוכחות שכמעט כותבות את עצמן, אבל בהבדל אחד - אם לא בוחרים נקודת פתיחה חכמה, פשוט נתקעים, וזה לקח שכדאי לזכור גם באופן כללי. מה הבעיה? הנה הניסוח הנאיבי שהייתי מנסח בו את המשפט שאנחנו רוצים להוכיח: אם \( p\left(x\right) \) פולינום מעל \( F \) ואם \( E_{1},E_{2} \) שני שדות פיצול של \( p\left(x\right) \) מעל \( F \) אז \( E_{1}\cong E_{2} \) (הסימון \( \cong \) מייצג איזומורפיזם).

הוכחה של טענה כזו מזמינה אינדוקציה על המעלה של \( p\left(x\right) \). אני אומר - בואו ניקח \( a\in E_{1} \) ו-\( b\in E_{2} \) שהם שורשים של \( p\left(x\right) \) מעל השדות הללו. אנחנו יודעים ש-\( F\left(a\right)\cong F\left(b\right) \) כי כל שני שדות שורש של אותו פולינום הם איזומורפיים. אז אפשר להסתכל על \( p_{1}\left(x\right)=\frac{p\left(x\right)}{x-a} \) ו-\( p_{2}\left(x\right)=\frac{p\left(x\right)}{x-b} \) מעל שני השדות הללו ועכשיו… אה… המ… מה שרציתי לעשות הוא להשתמש בהנחת האינדוקציה, אבל הנחת האינדוקציה שלי מדברת על פולינום אחד מעל שדה אחד שיש לו שני שדות פיצול, ואילו כאן יש לי שני פולינומים (\( p_{1},p_{2} \)) מעל שני שדות (\( F\left(a\right),F\left(b\right) \)) עם שני שדות פיצול. הנחת האינדוקציה שלי חלשה מדי מכדי להתמודד עם הסיטואציה הזו. גם להגיד “אוקיי, בואו נוותר על האינדוקציה ובמקום זה פשוט נבנה את שדה השורש הבא בתור” לא תעבוד יותר - אין לי כרגע משפט שאומר שאם יש לי שני פולינומים שונים מעל שני שדות שונים אז יהיה להם את אותו שדה שורש; זה לא בהכרח נכון בכלל. צריך איכשהו להשתמש בזה ש-\( F\left(a\right)\cong F\left(b\right) \).

אז הניסוח הנאיבי של המשפט כושל, ומזמין ניסוח כללי יותר, שכשאני נתקל בו בספרי הלימוד בלי לזכור מראש למה הוא כללי כל כך, הוא נראה לי כבד שלא לצורך, אבל עכשיו ברור לנו למה הוא הכרחי: אם \( F_{1}\cong F_{2} \) הם שני שדות איזומורפיים עם איזומורפיזם \( \varphi:F_{1}\to F_{2} \), ו-\( p_{1}\in F_{1}\left[x\right] \) פולינום ו-\( p_{2}=\varphi\left(p_{1}\right)\in F_{2}\left[x\right] \) הוא הפולינום המתקבל מ-\( p_{1} \) על ידי הפעלת \( \varphi \) על המקדמים של \( p_{1} \), ואם \( E_{1}/F_{1} \) הוא שדה פיצול של \( p_{1} \) ו-\( E_{2}/F_{2} \) הוא שדה פיצול של \( p_{2} \) - אז במקרה זה \( E_{1}\cong E_{2} \) עם איזומורפיזם \( \psi:E_{1}\to E_{2} \) כך ש-\( \psi \) מצומצם ל-\( F_{1} \) נותן את \( \varphi \). עם הניסוח הזה, ההוכחה היא באמת אינדוקציה שגרתית בסגנון של מה שכתבתי למעלה; ברשותכם אוותר על הפרטים.

סגור אלגברי

כשדיברתי קודם על הפולינום \( x^{2}+1 \) ורציתי לתת דוגמא לשדה שבו הוא מתפצל, נתתי את \( \mathbb{C} \), המרוכבים. למה דווקא את המרוכבים? כי לכל מי שמכיר קצת מתמטיקה, המרוכבים הם שדה הפיצול האולטימטיבי - כל פולינום במקדמים רציונליים מתפצל ב-\( \mathbb{C} \). למעשה, כל פולינום במקדמים ממשיים מתפצל. למעשה, כל פולינום במקדמים מרוכבים מתפצל. התוצאה הזו נקראת המשפט היסודי של האלגברה והיא הוזכרה בבלוג הזה אינספור פעמים. אפשר לנסח אותה בתור “כל פולינום ב-\( \mathbb{C}\left[x\right] \) מתפצל מעל \( \mathbb{C} \) לגורמים לינאריים” ואפשר באופן שקול לגמרי לנסח אותה בתור “לכל פולינום לא קבוע ב-\( \mathbb{C}\left[x\right] \) יש שורש ב-\( \mathbb{C} \)” (ואז אפשר לחלק ב-\( x \) פחות השורש הזה ולמצוא שורש לפולינום שהתקבל וכן הלאה עד שמפצלים לגורמים לינאריים). העניין הוא ש-\( \mathbb{C} \) הוא לא ייחודי. יש עוד שדות עם התכונה הזו שלו, כך שהיא זוכה לשם כללי: שדה \( F \) הוא סגור אלגברית אם כל פולינום מעל \( F \) מתפצל לגורמים לינאריים, ובאופן שקול, אם לכל פולינום לא קבוע מעל \( F \) יש שורש ב-\( F \).

עכשיו, ל-\( \mathbb{C} \) יש את התכונה הנחמדה מבחינת \( \mathbb{Q} \) לפיה כל פולינום מעל \( \mathbb{Q} \) מתפצל ב-\( \mathbb{C} \), אבל יש להרחבה \( \mathbb{C}/\mathbb{Q} \) תכונה לא נחמדה: היא לא אלגברית. יש איברים של \( \mathbb{C} \) שאין אף פולינום ב-\( \mathbb{Q} \) שמאפס אותם; למשל \( \pi \). התחושה היא ש-\( \mathbb{C} \) הוא הרחבה “גדולה מדי” של \( \mathbb{Q} \) אם כל מה שמעניין אותנו הוא לפצל כל פולינום ב-\( \mathbb{Q} \). זה לא מקרי; הסיבה ש-\( \mathbb{C} \) קיים הוא בשביל להוות שדה סגור אלגברית הרחבה אלגברית עבור שדה אחר, עבור \( \mathbb{R} \), והסיבות לקיום של \( \mathbb{R} \) מבחינתנו הן לא משהו שמנוסח באלגברה שיש לנו כרגע (בנפנוף ידיים, אנחנו צריכים את \( \mathbb{R} \) כדי לעשות חדו"א כמו שצריך; ספציפית, אנחנו זקוקים לתכונה לפיה לכל קבוצה חסומה ב-\( \mathbb{R} \) יש חסם עליון או באופן שקול, לכך שכל סדרת קושי ב-\( \mathbb{R} \) תתכנס). האינטואיציה הזו נותנת לנו מוטיבציה לעוד הגדרה כללית: \( E \) הוא סגור אלגברי של \( F \) אם \( E \) הוא שדה סגור אלגברית שהוא גם הרחבה אלגברית של \( F \). כמו עם כל אובייקט מתמטי שאנחנו מגדירים, עולות מייד שתי שאלות:

האם האובייקט קיים?
האם האובייקט יחיד?

ראינו דוגמא לזה בפוסט הנוכחי: בהינתן שדה ופולינום מעליו, קיים שדה פיצול לפולינום, ושדה הפיצול הזה הוא יחיד עד כדי איזומורפיזם (ה”עד כדי” הזה קריטי, כמובן; הרבה הוכחות של “יחידות” במתמטיקה הן “יחיד עד כדי מה שחשוב לנו כרגע”). על פניו נראה די מתבקש שזו תהיה הסיטואציה גם עם סגור אלגברי, וזה נכון חלקית: לכל שדה \( F \) קיים סגור אלגברי והוא יחיד עד כדי איזומורפיזם, אבל זאת רק בהנחת אקסיומת הבחירה (גם עבור הוכחת הקיום וגם עבור הוכחת היחידות). לי אישית אין בעיה עם אקסיומת הבחירה, אבל הנוכחות שלה בהוכחה מסויימת תמיד מצביעה על כך שאנחנו עושים סוג של קסם באותה הוכחה ובונים אובייקט מורכב, שלא נוכל לתאר בהכרח במפורש.

בפוסט הזה אסתפק בהוכחת ה”קיים” ולא אכנס להוכחת היחידות, כי הוא יהיה מספיק ארוך גם ככה. בואו נתחיל עם האבחנה שאפשר להחליש קצת את הדרישה מסגור אלגברי. בהינתן שדה \( F \), נסמן ב-\( \overline{F} \) שדה שמרחיב אלגברית את \( F \) וכל פולינום ב-\( F \) מתפצל בו (הסימון קצת מרמז על כך שה-\( \overline{F} \) הזה הוא יחיד, אבל זה לא נדרש פה). אני טוען ש-\( \overline{F} \) הוא סגור אלגברית (וכתוצאה מכך, \( \overline{\overline{F}}=\overline{F} \); מתאים לאינטואיציה המתמטית הכללית לגבי “סגור” של משהו). ההוכחה פשוטה, בהינתן דברים שראינו בפוסטים קודמים: ניקח פולינום \( p\left(x\right)\in\overline{F} \); אנחנו רוצים להראות שקיים לו שורש ב-\( \overline{F} \). יהא \( a \) שורש כלשהו של \( p\left(x\right) \) שאנחנו לוקחים מתוך שדה הפיצול של \( p \) שמרחיב את \( \overline{F} \). אז ההרחבה הפשוטה \( \overline{F}\left(a\right) \) היא אלגברית (ראינו שהרחבה פשוטה על ידי איבר אלגברי היא אלגברית). מכאן שיש לנו מגדל של הרחבות אלגבריות: \( F\subseteq\overline{F}\subseteq\overline{F}\left(a\right) \). ראינו שבמגדל של הרחבות אלגבריות, השדה האחרון אלגברי מעל השדה הראשון, כלומר \( \overline{F}\left(a\right) \) אלגברי מעל \( F \) ובפרט \( a \) אלגברי מעל \( F \), כלומר \( a \) הוא שורש של פולינום עם מקדמים מ-\( F \) ולכן בוודאי שייך ל-\( \overline{F} \) שמכילה את כל השורשים של כל הפולינומים עם מקדמים מ-\( F \). מכאן שהגדרה שקולה וקצת יותר פשוטה לסגור אלגברי של \( F \) היא - שדה \( E \) שמרחיב אלגברית את \( F \) ולכל פולינום ב-\( F \) יש שורש ב-\( E \).

למה שיהיה קשה, בהינתן \( F \), לבנות את \( \overline{F} \)? למה לא לומר “ראינו שלכל פולינום מעל \( F \) קיימים שורשים היכן שהוא; למה לא לקחת את כל השורשים הללו, להוסיף ל-\( F \) ולסגור?” ובכן, עד כה כשהוספנו איברים לשדה ו”סגרנו” אותו, זה תמיד היה בהקשר שבו האיברים שהוספנו חיים בתוך שדה גדול יותר שאנחנו כבר יודעים שקיים. הסיטואציה היחידה שבה יצרנו איברים חדשים יש מאין הייתה כשבנינו שדה שורש, ושם באמת לא אמרנו “נוסיף שורש ונסגור” אלא עשינו משהו הפוך - לקחנו חוג גדול מעל השדה הנוכחי שלנו, ויצרנו חוג מנה - “הקטנו” את החוג שלנו. סתם להגיד “נוסיף איברים ונסגור” זה חסר משמעות.

אני רוצה לחדד את הבעיה העקרונית שעלולה להיווצר פה. בואו נניח שיש לנו שלושה פולינומים מעל \( F \), נקרא להם \( p,q,r \). נניח ש-\( p\left(a\right)=0,r\left(c\right)=0 \) ו-\( q\left(b\right)=0 \) עבור \( a,b,c \) שחיים בהרחבה כלשהי של \( F \). מה אנחנו יכולים להגיד על הקשר בין \( a,b,c \)? התשובה היא, במבט ראשון, ששום דבר, אבל כמובן שקשר כלשהו עשוי להיות: למשל, אם \( F=\mathbb{Q} \) ו-\( p=x^{2}-2 \) ו-\( q=x^{2}-3 \) אז \( a=\sqrt{2} \) ו-\( b=\sqrt{3} \) יהיו שורשים של הפולינומים הללו, ואז \( ab=\sqrt{6} \) יהיה שורש של הפולינום \( r=x^{2}-6 \). כלומר, יש לנו קשר אלגברי בין שורשים של הפולינומים הללו: \( ab=c \). אם אנחנו רוצים לומר משהו בסגנון “ניקח את כל השורשים של כל הפולינומים ונדחוף אותם פנימה”, לא מספיק לנו לעשות את זה - צריך לדחוף פנימה גם את כל הקשרים האלגבריים ביניהם. כלומר, יש לנו פה הזמנה לתסבוכת.

דרך יותר אינטואיטיבית אולי היא להסתכל על שדות הפיצול של כל הפולינומים מעל \( F \). יש לנו ערב-רב של שדות, וסתם לאחד שדות לא מניב בהכרח שדה, אבל אם יש לנו יחסי הכלה בין חלק מהשדות בערב-רב כבר יש יותר עם מה לעבוד - תחשבו על לבנות שדה גדול ומאוחד מתוך הרבה חתיכות קטנות - הרבה “טלאים” שמסתדרים יפה אחד עם השני. זה נשמע קצת עקום, אבל למעשה זה הרעיון מאחורי שלל הוכחות יפות במתמטיקה, עם עקב האכילס שהכלי הטכני שמשמש אותנו למלאכת ההרכבה הקסומה הזו הוא אקסיומת הבחירה, בתחפושת שלה בתור הלמה של צורן. אני לא אנקוט בשיטה הזו כאן כי אני רוצה להציג הוכחה קצת יותר אלגנטית, אבל אי אפשר להתחמק מאקסיומת הבחירה - ההוכחה שלי תתבסס על משפט קצת יותר בסיסי שכן מוכיחים בעזרת “שמיכת טלאים” שכזו, והוא מגיע מתורת החוגים: אם \( R \) חוג ו-\( I\ne R \) אידאל כלשהו שאינו כל החוג, אז קיים אידאל מקסימלי \( J \) ב-\( R \) כך ש-\( I\subseteq J \).

הלמה של צורן היא בדיוק כלי שמייצר לנו איברים מקסימליים שכאלו. הניסוח שלה הוא זה: אם \( A \) קבוצה שסדורה ביחס סדר חלקי \( \le \) כלשהו, כך שלכל שרשרת \( C\subseteq A \) של איברים קיים ב-\( A \) חסם מלעיל, אז יש ב-\( A \) איבר מקסימלי. “שרשרת” היא קבוצה שכל שני איברים בה ניתנים להשוואה, ו”חסם מלעיל” של שרשרת הוא איבר שגדול או שווה מכל האיברים בשרשרת.

במקרה שלנו, \( A \) היא קבוצת כל האידאלים של \( R \) שאינם \( R \) עצמו ומכילים את \( I \). יחס הסדר \( \le \) הוא במקרה הזה בסך הכל יחס ההכלה \( \subseteq \). אם נתונה לנו שרשרת \( C \) של אידאלים, האיחוד של כל האידאלים בה כן יהיה אידאל בעצמו. איחוד של שני אידאלים כלליים \( S,T \) לא ייתן אידאל כי אם \( a\in S \) ו-\( b\in T \) אז \( a+b \) לאו דווקא יהיה שייך לאף אחד מהם; אבל בשרשרת אחד משני האידאלים מוכל בשני ולכן \( a,b \) שניהם שייכים לאחד מהאידאלים ולכן \( a+b \) גם שייך אליו. האיחוד של כל האידאלים בשרשרת גם בוודאי מכיל גם אחד מהם ולכן הוא חסם מלעיל שלה, והמסקנה היא שקיים אידאל ב-\( R \) שמכיל את \( I \) ושונה מ-\( R \) שהוא מקסימלי. עד כאן אקסיומת הבחירה; לא אזדקק לה בהמשך ההוכחה של קיום סגור אלגברי.

אני אוכיח קיום של סגור אלגברי בשני שלבים: בחלק הראשון, הקשה, אני אוכיח שלכל שדה \( F \) יש הרחבה שהיא סגורה אלגברית; היא לאו דווקא תהיה סגור אלגברי כי היא לאו דווקא תהיה אלגברית מעל \( F \). ברגע שיש לנו הרחבה כזו, אפשר לעשות את תעלול “ניקח את השדה שנוצר על ידי כל שורשי הפולינומים” שתיארתי לעיל; אפרמל את זה בהמשך.

ההוכחה שאציג כעת לקיום הרחבה סגורה אלגברית של \( F \) היא של ארטין, ואני חושב שהיא מהממת; רק אחרי שקוראים כל מני הוכחות אחרות שניגשות לעניין בצורה ישירה יותר ועושות מהומות טכניות קל לטעמי להעריך עד כמה ההוכחה של ארטין פשוטה וכמה שהיא הכללה טבעית של בניית שדה שורש. בואו ניזכר מה זה אומר לבנות שדה שורש: אנחנו מתחילים עם שדה \( F \) ופולינום לא קבוע \( p\left(x\right)\in F\left[x\right] \) שאנחנו רוצים לייצר עבורו שורש יש מאין. אז אנחנו נוקטים בטכניקה הבאה: אנחנו ממציאים יש מאין “משתנה” שאני אסמן כאן דווקא באות \( t \), ומסתכלים על החוג \( F\left[t\right] \) של הפולינומים עם מקדמים מ-\( F \) במשתנה \( t \). המטרה הכמעט מוצהרת שלי היא ש-\( t \) יהיה בסופו של דבר שורש של \( p\left(x\right) \). כדי להשיג את האפקט הזה, אני לוקח את כל החוג \( F\left[t\right] \) ומחלק אותו באידאל \( \left\langle p\left(t\right)\right\rangle \) - האידאל שאני מקבל מכך שאני לוקח את הפולינום \( p\left(x\right) \), “מציב את \( t \)” בתוכו, ואז יוצר מתוכו אידאל. אחרי החלוקה, החוג \( F\left[t\right]/\left\langle p\left(t\right)\right\rangle \) יהיה בפועל החוג \( F\left[t\right] \) עם היחס החדש \( p\left(t\right)=0 \), כלומר \( t \) הוא אכן שורש של \( p \), כתוצאה מהחלוקה הזו. הבעיה היחידה בכל הבניה הזו? לא מובטח לי ש-\( F\left[t\right]/\left\langle p\left(t\right)\right\rangle \) יהיה שדה; הוא שדה אך ורק כאשר \( p\left(x\right) \) הוא אי-פריק. לכן, אפשר “לתקן” את הבניה: במקום לחלק ב-\( \left\langle p\left(t\right)\right\rangle \) אפשר לקחת גורם אי פריק \( q\left(x\right) \) של \( p\left(x\right) \), ולחלק ב-\( \left\langle q\left(t\right)\right\rangle \). האידאל \( \left\langle q\left(t\right)\right\rangle \) הוא כן אידאל מקסימלי, וכזה שמרחיב את \( \left\langle p\left(t\right)\right\rangle \).

ההוכחה של ארטין עושה את אותו דבר, רק בבת אחת עבור כל הפולינומים מעל \( F \). התעלול המרכזי הוא להשתמש במשתנה שונה לכל פולינום. לכל \( p\left(x\right)\in F\left[x\right] \), נוסיף משתנה חדש \( t_{p} \) שיצרנו יש מאין, והמטרה שלנו בחיים הוא לבנות שדה שבו \( t_{p} \) יהיה שורש של \( p \), כלומר שיתקיים \( p\left(t_{p}\right)=0 \) באותו שדה. לצורך כך נסתכל על החוג \( R=F\left[\dots,t_{p},\dots\right] \) של כל הפולינומים עם משתנים מהקבוצה \( \left\{ t_{p}\ |\ p\left(x\right)\in F\left[x\right]\right\} \). \( R \) הזה הוא חוג ענקי, מפלצתי; יש בו מספר כביר של משתנים שמסתובבים להם. זה לא מפריע לנו. כל פולינום במשתנים הללו הוא יצור סופי - כולל רק מספר סופי של מחוברים שכל אחד מהם הוא מכפלה של מספר סופי של משתנים ועוד מקדם מ-\( F \).

במקרה של בניית שדה שורש, השלב הבא היה לקחת את האידאל שנוצר על ידי האיבר \( p\left(t\right) \) בחוג \( F\left[t\right] \). במקרה הנוכחי נעשה משהו דומה מאוד: נגדיר אידאל \( I \) שהוא האידאל שנוצר מכל האיברים \( p\left(t_{p}\right) \); כל הפולינומים מהחוג \( F\left[x\right] \) המקורי רק עם משתנה חדש במקום \( x \); והמשתנה החדש הזה הוא בדיוק אותו \( t_{p} \) שהתווסף במיוחד עבורם; לכל פולינום יש את המשתנה “שלו”. אם נסתכל עכשיו על חוג המנה \( R/I \) נקבל שבחוג הזה \( p\left(t_{p}\right)=0 \) לכל פולינום \( p \) מעל \( F \). הבעיה היא שלא מובטח לי שהחוג הזה הוא שדה; לצורך כך אני צריך לחלק באידאל מקסימלי. לא מובטח לי ש-\( I \) הוא אידאל מקסימלי שכזה, אבל אם \( I\ne R \) מה שכן מובטח לי, בזכות אקסיומת הבחירה ומה שתיארתי קודם, ש-\( I \) מוכל באידאל מקסימלי \( J \) שכזה כך ש-\( R/J \) יהיה שדה שבו לכל פולינום \( p \) מעל \( F \) יש שורש. זו המקבילה של ההוכחה הזו למעבר מ-\( \left\langle p\left(t\right)\right\rangle \) אל \( \left\langle q\left(t\right)\right\rangle \) שתיארתי קודם.

כדי להשתמש בטענה הזו אני צריך להוכיח ש-\( I\ne R \). התעלול פה הוא פשוט ויפה: אם \( I=R \) אז קיים איבר ב-\( I \) ששווה 1 (כלומר, שווה לפולינום הקבוע 1). אברי \( I \) הם צירופים לינאריים סופיים של היוצרים - הפולינומים \( p\left(t_{p}\right) \) - עם מקדמים כלליים מתוך \( R \), כלומר יש לנו את הצירוף הלינארי \( 1=f_{1}p_{1}\left(t_{p_{1}}\right)+\dots+f_{n}p_{n}\left(t_{p_{n}}\right) \) כאשר ה-\( f_{1},\dots,f_{n}\in R \) הם פלינומים במשתנים כלשהם מבין ה-\( t_{p} \)-ים של החוג \( R \).

אינטואיטיבית, מה שאני רוצה לעשות עכשיו הוא להציב ב-\( t_{p_{1}},\dots,t_{p_{n}} \) ערכים שמאפסים את הפולינומים \( p_{1},\dots,p_{n} \) (ובשאר המשתנים של החוג \( R \) אני אציב משהו שרירותי, למשל 0) אם אעשה דבר כזה, אקבל את המשוואה \( 1=0 \) שהיא כמובן בלתי אפשרית ואגיע לסתירה. אבל כדי להציב את הערכים הללו אני צריך שתהיה קיימת הרחבה \( E/F \) שבה יש לכל הפולינומים הללו שורש; האם זו לא ביצה ותרנגולת? לכאורה זה בדיוק מה שאני מנסה לבנות כרגע. אלא ש-\( p_{1},\dots,p_{n} \) זה מספר סופי של פולינומים, ולכן אפשר לנקוט בתעלול הבא: נסתכל על הפולינום שהוא המכפלה שלהם, \( p_{1}\cdots p_{n} \); זה פולינום תקין לגמרי מעל \( F \). על כן, קיים לו שדה פיצול \( E \). בשדה \( E \) הזה כל הפולינומים \( p_{1},\dots,p_{n} \) מתפרקים לגורמים לינאריים ולכן \( E \) כולל את השורשים שלהם, ומכאן שאפשר לבצע את ההצבה שדיברתי עליה ולקבל את ה”שוויון” \( 1=0 \) מעל \( E \), ובכך להגיע לסתירה עם ההנחה ש-\( I=R \).

זה מסיים את השלב הזה בהוכחה: הראינו שאם יש לנו שדה \( F \), אז אנחנו יודעים לבנות הרחבה \( E/F \) כך שלכל פולינום ב-\( F \) יש שורש ב-\( E \). בשלב הזה אני יכול לעצור ולהגדיר את \( \overline{F} \) בתור אוסף כל האיברים האלגבריים ב-\( E \), אבל אני רוצה לשכנע אתכם שאפשר לבנות את \( E/F \) כך ש-\( E \) יהיה סגור אלגברית. כרגע לא מובטח שהוא סגור אלגברית; רק מובטח שלכל פולינום ב-\( F\left[x\right] \) יש שורש, אבל לא שלכל פולינום ב-\( E\left[x\right] \) יש שורש.

אז מה עושים? בואו נגדיר סדרה אינסופית של שדות, \( F_{0}\subseteq F_{1}\subseteq F_{2},\dots \) כך ש-\( F_{0}=0 \) ואילו \( F_{n} \) מתקבל מתוך \( F_{n-1} \) על ידי הבניה שתיארתי, שמבטיחה שלכל פולינום מעל \( F_{n-1} \) יהיה שורש ב-\( F_{n} \). כעת נגדיר \( E=\bigcup_{n=0}^{\infty}F_{n} \). זה שדה בגלל שזה איחוד של שדות שמכילים זה את זה; הוא סגור אלגברית כי אם ניקח פולינום כלשהו ב-\( E \), אז מכיוון שיש לפולינום רק מספר סופי של מקדמים, קיים \( F_{k} \) בשרשרת שכל המקדמים נמצאים בתוכו, ואז השורש שלו נמצא ב-\( F_{k+1} \) ומכאן שהוא נמצא ב-\( E \), מה שמסיים את ההוכחה. כלומר, מרגע שהיה לי כבר את התהליך של “בניית שדה שורש לכל הפולינומים בבת אחת”, להפיק מזה שדה סגור אלגברית זה כבר קל.

מה שאני אוהב בהוכחה הנפלאה הזו הוא עד כמה בולט בה הייחוד של היצורים המוזרים הללו שנקראים “פולינומים”. ההוכחה עוסקת באובייקטים שיכולים להיות ענקיים: שדות ענק לא בני מניה, חוגי פולינומים עם מספר מפלצתי של משתנים, וכדומה; אבל הסופיות של הפולינומים עצמם משרה סדר גדול בתוך הכאוס של הסיטואציה. התופעה הזו של “אובייקט סופי בתוך כאוס אינסופי שעושה סדר” חוזרת על עצמה שוב ושוב במתמטיקה.

נהניתם? התעניינתם? אם תרצו, אתם מוזמנים לתת טיפ: