שדות סופיים - מי, מה, כמה ולמה

בפוסט הקודם הסברתי מהו שדה והראיתי דוגמאות לשדות סופיים פשוטים: השדות \(\mathbb{Z}_{p}\) לכל ראשוני \(p\) של השלמים מ-0 עד \(p-1\) עם חיבור וכפל מודולו \(p\) (הסברתי מדוע זה חייב להיות ראשוני). בפוסט הזה אני רוצה לשכנע אתכם בשלושה דברים, בהתבסס על כמה תוצאות במתמטיקה שאותן אציין אך לא אוכיח - ראשית, שכל שדה סופי חייב להכיל מספר איברים שהוא חזקה של ראשוני (ולכן, למשל, אין שדה סופי עם 10 איברים, כי 10 אינו חזקה של ראשוני); שנית, שלכל חזקה כזו של ראשוני קיים שדה סופי עם מספר האיברים הזה בדיוק; ושלישית, שהשדה הזו הוא יחיד, כלומר כל שני שדות סופיים עם אותו מספר איברים הם "אותו דבר", במובן זה שעל ידי שינוי הסימון של איברי השדה הראשון מקבלים בדיוק את השדה השני.

כדי להבין כמה זה מעניין כדאי לחשוב על מבנה קצת יותר פשוט משדה - חבורה. חבורה היא קבוצה שבה יש רק פעולה אחת (שנקראת לפעמים "כפל" אבל יש לה המון פרשנויות אפשריות - חיבור רגיל, כפל רגיל, הרכבה של פונקציות ועוד ועוד; הכל בהתאם להקשר) שצריכה לקיים רק אסוציאטיביות, קיום אדיש לפעולה וקיום הופכי לפעולה (אפילו קומוטטיביות לא דורשים). לכל מספר \(n\) קיימת חבורה עם \(n\) איברים, ולרוב המספרים קיימות המון חבורות, שנראות שונות אחת מהשניה באופן מהותי. אפילו עבור \(n=4\) כבר יש שתי חבורות שונות (נסו למצוא אותן). כך שהמבנה הנוסף של שדה בעצם "כופה" הרבה יותר סדר על העניינים. אגב, אם אני כבר מזכיר את זה - אחת מהתוצאות הנחמדות הבסיסיות של תורת החבורות היא שעבור ראשוני \(p\) קיימת רק חבורה יחידה עם \(p\) איברים; הנה שוב הראשוניים נכנסים לתמונה.

אז בואו ניקח את \(q\) להיות מספר טבעי כלשהו ונניח שיש לנו שדה סופי \(F\) עם בדיוק \(q\) איברים. בהכרח \(F\) חייב להיות ממציין שונה מאפס, כי אם היה ממציין אפס הוא היה מכיל לפחות את \(\mathbb{Q}\) שהיא קבוצה אינסופית. אז המציין שלו הוא \(p\) עבור ראשוני כלשהי, וזה אומר שבתוך \(F\) מתחבא לו עותק של \(\mathbb{Z}_{p}\). במילים אחרות, \(F\) הוא שדה סופי שמכיל את השדה \(\mathbb{Z}_{p}\). על סיטואציה כזו אומרים ש-\(F\) הוא שדה הרחבה של \(\mathbb{Z}_{p}\) (אם כי בדרך כלל קצת נזהרים ואומרים דברים בסגנון "\(F\) מכיל עותק איזומורפי של \(\mathbb{Z}_{p}\)" וכדומה - לא אכנס לדקויות הללו כאן). לרוב משתמשים בסימון \(F/\mathbb{Z}_{p}\) כדי לומר ש-\(F\) מרחיב את \(\mathbb{Z}_{p}\), ובאופן כללי \(F/E\) אומר ש-\(F,E\) הם שדות ו-\(E\subseteq F\).

את מה שהולך לקרות עכשיו אפשר לסכם עבור מי שבקיא במושגים המתאימים כך: קל לראות ש-\(F\) הוא מרחב וקטורי מעל \(\mathbb{Z}_{p}\) ממימד סופי \(n\) ולכן יש \(p^{n}\) צירופים לינאריים אפשריים של אברי הבסיס ולכן ב-\(F\) בדיוק \(p^{n}\) איברים. עכשיו אנסה להסביר מה זה אומר גם עבור מי שלא בקיא כל כך במושגים.

מרחב וקטורי הוא אחד מהמושגים הבסיסיים ביותר שנלמדים כיום במתמטיקה אוניברסיטאית (במסגרת האלגברה הלינארית). האינטואיציה הטובה כאן מגיעה מפיזיקה - יש גדלים שהם "וקטורים" - בעלי גודל וכיוון - להבדיל מגדלים שהם "סקלרים", שהם פשוט מספרים. אפשר לכפול וקטורים בסקלרים ולקבל וקטורים חדשים, ואפשר גם לחבר וקטורים ולקבל וקטורים חדשים (אבל מושג של כפל בין שני וקטורים הוא לא מיידי). האלגברה הלינארית מכלילה את האינטואיציה הזו לאינספור מקרים - שבהם ה"וקטורים" הם איברים של מרחב \(n\)-ממדי כלשהו, או מטריצות, או פונקציות, או פתרונות של מערכת משוואות לינאריות, ועוד ועוד.

פורמלית, מרחב וקטורי \(V\) מעל שדה \(F\) נראה כמו "שדה בלי פעולת כפל" - כלומר, מוגדרת על \(V\) פעולת חיבור בין איברים שהיא אסוציאטיבית וקומוטטיבית וקיים איבר אדיש חיבורי (שמסומן ב-\(\overline{0}\) כי רוצים להבדיל בין האדיש החיבורי של \(V\) לאדיש החיבורי של \(F\)) וקיים הופכי חיבורי לכל איבר, ובנוסף לכך יש גם פעולת כפל של איבר מ-\(V\) באיבר מ-\(F\). אברי \(F\) מכונים "סקלרים" כדי להבדיל אותם מאברי \(V\), ולרוב גם מסמנים אותם באות מוזרה כמו \(\lambda\) לשם כך. הדרישה היא שהכפל הזה "יתנהג יפה", במובן זה ש-\(\lambda_{1}\cdot\left(\lambda_{2}\cdot v\right)=\left(\lambda_{1}\times\lambda_{2}\right)\cdot v\) (שימו לב! סימנתי כאן ב-\(\cdot\) כפל של סקלר בוקטור, וב-\(\times\) כפל של שני סקלרים כדי שיהיה ברור למה השוויון לעיל לא מובן מאליו), וש-\(\left(\lambda_{1}+\lambda_{2}\right)v=\lambda_{1}v+\lambda_{2}v\) וש-\(\lambda\left(v+u\right)=\lambda v+\lambda u\).

שלוש התכונות שלעיל הן מעין תכונות של אסוציאטיביות ודיסטריביוטיביות על כפל של סקלר בוקטור. הן מבטיחות שמרחבים וקטוריים יהיו בעלי מבנה יפה ופשוט יחסית - כל כך פשוט שאפשר להבין את רוב המבנה הזה כבר במסגרת קורס הבסיס באלגברה לינארית, מה שהופך את הנושא הזה למבוא טוב (לדעתי) למתמטיקה מופשטת. חלק מהמבנה הזה בא לידי ביטוי בתוצאה הבאה: לכל מרחב וקטורי \(V\) מעל כל שדה \(F\) קיימת קבוצה \(B\subseteq V\) כך שלכל \(v\in V\) ניתן לכתוב \(v=\sum_{i=1}^{n}\lambda_{i}b_{i}\), כאשר \(\lambda_{i}\in F\) ו-\(b_{i}\in B\). הקבוצה \(B\) נקראת בסיס, סכום מהצורה \(\sum_{i=1}^{n}\lambda_{i}b_{i}\) נקרא "צירוף לינארי של איברי \(B\)" (הוא חייב להיות סופי - אין משמעות לסכום אינסופי כאן), ואולי אתם כבר מנחשים שחסרה לי כאן עוד תכונה מהותית כי למה לא לקחת את \(V\) להיות \(B\) עצמה? התכונה המהותית היא שלכל \(v\in V\), התיאור של \(v\) כצירוף לינארי של אברי \(B\) הוא יחיד.

בואו נבין איך זה עוזר לנו. ראשית, קל לראות שאם \(F\) הוא שדה שמכיל את \(\mathbb{Z}_{p}\) אז הוא אכן מרחב וקטורי מעליו, כשהפעולה של כפל בסקלר מ-\(\mathbb{Z}_{p}\) היא פשוט פעולת הכפל הרגילה ב-\(F\) (מכאן נובעות תכונות האסוציאטיביות והדיסטריביוטיביות מייד מכך שהן מתקיימות לכל שני איברים ב-\(F\)). לכן קיים בסיס ל-\(F\), ומכיוון ש-\(F\) סופי, גם הבסיס סופי - בואו נסמן את מספר האיברים שבו ב-\(n\). כעת, כל איבר ב-\(F\) ניתן לכתיבה בצורה יחידה כ-\(\sum_{i=1}^{n}\lambda_{i}b_{i}\) (כאשר \(\lambda_{i}\in\mathbb{Z}_{p}\) ו-\(b_{i}\) איבר בסיס), וגם ברור שכל ביטוי מהצורה \(\sum_{i=1}^{n}\lambda_{i}b_{i}\) הוא איבר חוקי ב-\(F\) (כי \(F\) שדה; לכפול איברים מהשדה ולחבר אותם בסופו של דבר מניב איבר בשדה). לכן מספר האיברים ב-\(F\) הוא בדיוק כמספר הביטויים מהצורה \(\sum_{i=1}^{n}\lambda_{i}b_{i}\). כמה כאלו יש? ובכן, כמספר הדרכים השונות שלנו לבחור את המקדמים \(\lambda_{i}\). לכל \(1\le i\le n\) אנחנו יכולים לבחור כל סקלר מתוך \(\mathbb{Z}_{p}\), וזו קבוצה בעלת \(p\) איברים. אז יש לנו בסך הכל \(p\cdot p\cdots p\) בחירות, כאשר הכפל הוא של \(n\) איברים - בסך הכל \(p^{n}\), ולכן זהו גודל השדה: \(q=p^{n}\). את כל זה אפשר לסכם, כאמור, ב-"קל לראות ש-\(F\) הוא מרחב וקטורי מעל \(\mathbb{Z}_{p}\) ממימד סופי \(n\) ולכן יש \(p^{n}\) צירופים לינאריים אפשריים של אברי הבסיס ולכן ב-\(F\) בדיוק \(p^{n}\) איברים."

יפה, אז ראינו שכל שדה סופי חייב להיות בעל \(p^{n}\) איברים עבור \(p\) ראשוני ו-\(n\) טבעי כלשהם. כעת נותר להראות כי לכל ראשוני ולכל טבעי אכן קיים שדה שמכיל את המספר הזה של איברים, ושהוא יחיד. הרעיון הוא להתחיל מ-\(\mathbb{Z}_{p}\) ולהרחיב אותו באופן כזה שיתקבל שדה בן \(p^{n}\) איברים. כאן אנו נזקקים למושג מרכזי בתורת השדות - שדה פיצול של פולינום.

נניח ש-\(F\) הוא שדה כלשהו (אפילו לא בהכרח סופי), אז פולינום מעליו הוא ביטוי מהצורה \(a_{k}x^{k}+a_{k-1}x^{k-1}+\dots+a_{1}x+a_{0}\), כאשר \(a_{0},\dots,a_{k}\) הם כולם איברים של \(F\) ומכונים מקדמי הפולינום, ואילו \(x\) הוא סתם סימון. אפשר להציב בפולינום ערכים - להחליף את \(x\) ביצורים שבאמת אפשר לכפול במקדמים ולחבר ולראות מה מקבלים. אם מקבלים 0, אז הערך נקרא שורש של הפולינום (אין קשר אמיתי ל-\(\sqrt{}\), אם כי שורש של הפולינום \(x^{2}-a\) הוא אכן \(\sqrt{a}\)). אם יש לנו פולינום שמקדמיו לקוחים מתוך \(F\), זה לחלוטין לא מבטיח שיהיו לו שורשים ב-\(F\), אבל ייתכן שיהיו לו שורשים בשדה שמכיל את \(F\). למשל, לפולינום \(x^{2}-2\), שמקדמיו לקוחים מתוך \(\mathbb{Q}\), אין שורשים רציונליים כי \(\sqrt{2}\) איננו רציונלי וכך גם \(-\sqrt{2}\).

שורש כזה מצוי, למשל, ב-\(\mathbb{R}\), והרי \(\mathbb{R}/\mathbb{Q}\) היא הרחבת שדות לגיטימית על פי ההגדרה שנתתי למעלה. אלא שזו הרחבה "חזקה מדי" במובן מסויים - יש ב-\(\mathbb{R}\) גם המון איברים שלא קשורים בכלל לפולינום \(x^{2}-2\) וגם כאלו שלא מאפסים אף פולינום במקדמים רציונליים, למשל \(\pi\). אם מסתכלים על \(\mathbb{R}\) כמרחב וקטורי מעל \(\mathbb{Q}\) מקבלים מרחב אינסוף-ממדי. בקיצור, נראה שאולי כדאי לדבר כאן על רזולוציות קטנות יותר.

כאן נכנס לתמונה השדה \(\mathbb{Q}\left(\sqrt{2}\right)\) שהזכרתי בפוסט הקודם - השדה שאיבריו הם כל המספרים הממשיים מהצורה \(a+b\sqrt{2}\) כאשר \(a,b\) רציונליים. בשדה הזו נמצאים כל השורשים של הפולינום \(x^{2}-2\), ולא קשה במיוחד לראות שהוא "אופטימלי" במובן זה שכל שדה הרחבה של \(\mathbb{Q}\) שמכיל את שני השורשים הללו, מכיל גם את \(\mathbb{Q}\left(\sqrt{2}\right)\) (אם שדה מכיל גם את הרציונליים וגם את \(\sqrt{2}\) אז בוודאי שאפשר לכפול את \(\sqrt{2}\) ברציונלי \(b\) כלשהו ולקבל ש-\(b\sqrt{2}\) גם הוא איבר בשדה; ולזה אפשר לחבר \(a\) רציונלי כלשהו ולקבל שוב איבר בשדה; ולכן \(a+b\sqrt{2}\) בהכרח בשדה). שדה הרחבה כזה מכונה שדה הפיצול של הפולינום. בניסוח פורמלי: בהינתן פולינום \(p\left(x\right)\) שמקדמיו לקוחים משדה \(F\), שדה הפיצול שלו הוא שדה הרחבה של \(F\) שבו נמצאים כל שורשי \(p\left(x\right)\) והוא מינימלי ביחס להכלה.

אחד מהאתגרים המיידיים של תורת השדות הוא להראות כי לכל שדה ולכל פולינום מעליו, אכן קיים שדה פיצול שכזה, ושדה הפיצול הוא יחיד (במובן זה שאם נבנה, בשתי שיטות שונות כלשהן, שדות פיצול עבור הפולינום מעל השדה, נקבל שני שדות שהם איזומורפיים). לא אכנס כרגע לפרטי הבניה, אבל די בבירור האתגר הממשי הוא זה: בהינתן פולינום \(p\left(x\right)\) מעל שדה \(F\), האם ניתן לבנות בעזרת הכלים הרגילים שלנו שדה חדש \(E\) שמכיל את \(F\) (או עותק איזומורפי של \(F\), אמרנו שמבחינתנו זה אותו הדבר), ויש בו שורש של \(p\left(x\right)\) (לא בהכרח את כל השורשים)? אם כן, אז אפשר לבנות את שדה הפיצול של \(p\left(x\right)\) על ידי סדרה של הרחבות שכאלו שבכל פעם מוסיפות לפחות עוד שורש לפולינום (פורמלית מוסיפים שורש ואז הפולינום \(p\left(x\right)\) מתפרק לרכיבים קטנים יותר שעוד אין להם שורשים ומטפלים גם בהם).

כדי לבנות את ההרחבה הזו משתמשים בכלים סטנדרטיים מתורת החוגים דווקא - מסתכלים על חוג הפולינומים מעל \(F\) ובונים חוג מנה כלשהו של חוג הפולינומים הזה ומהר מאוד מתברר שהוא שדה, ושדה שבו ל-\(p\left(x\right)\) יש שורש. זו בניה נפלאה ואני לא הולך להגיד עליה עוד שום דבר. על ההוכחה ששדה הפיצול הוא יחיד, שהיא לב העניין פה, אני הולך להגיד עוד פחות. השימוש שלי בכל הסיפור הזה צפוי: לכל \(n\) טבעי, אני הולך להציג פולינום מעל \(\mathbb{Z}_{p}\) כך ששדה הפיצול שלו הוא בדיוק הרחבה מדרגה \(n\) (כלומר, אם חושבים עליה כמרחב וקטורי מעל \(\mathbb{Z}_{p}\), המימד שלה יהיה \(n\)). זה יראה לי קיום, ועם עוד טיפונת מאמץ גם יראה יחידות.

אז בואו ניקח \(q=p^{n}\) כלשהו וננסה לבנות שדה סופי עם \(q\) איברים, בתור שדה פיצול של פולינום מסויים מעל \(\mathbb{Z}_{p}\). כדי להבין איזה פולינום כדאי לקחת בשביל שדה הפיצול, צריך להראות עוד טריק שמגיע הפעם הישר מתורת החבורות. שדה הוא גם חבורה ביחס לכפל, בתנאי שמעיפים ממנו את 0 שאין לו הופכי כפלי. כלומר, משדה עם \(q\) איברים אפשר לקבל חבורה כפלית עם \(q-1\) איברים (לרוב מסמנים אותה ב-\(F^{*}\), אבל נעזוב את זה). כאן אני שולף מהשרוול משפט בסיסי בתורת החבורות - אם יש לנו חבורה עם \(m\) איברים ו-\(a\) הוא איבר בחבורה, אז \(a^{m}=1\) (\(a\) בחזקת \(m\) הוא מה שמתקבל כשכופלים את \(a\) בעצמו \(m\) פעמים). מקרה פרטי מפורסם של המשפט הזה נקרא "המשפט הקטן של פרמה" (לא המשפט האחרון של פרמה!) ואולי שמעתם עליו. מכל מקום, במקרה שלנו המסקנה היא ש-\(a^{q-1}=1\) לכל \(a\in F\) שאיננו אפס; ולכן \(a^{q}=a\) לכל \(a\in F\), כולל אפס (עבור אפס מוודאים את המשוואה ישירות...). מכאן ש-\(a^{q}-a=0\), והנה גילינו פולינום שמאפס את כל איברי \(F\): \(p\left(x\right)=x^{q}-x\). זה יהיה הפולינום שאת שדה הפיצול שלו ניקח, ונקבל ששדה הפיצול כולל בדיוק את כל השורשים שלו, ושום דבר פרט להם.

אם כן, הבה נסמן ב-\(E\) את שדה הפיצול של \(x^{q}-x\) מעל \(\mathbb{Z}_{p}\). "שדה פיצול" הוא מונח טיפה אבסטרקטי ולא ברור לנו איך \(E\) נראה כרגע, אז בואו נגדיר קבוצה \(K\) של כל איברי \(E\) שהם שורשים של \(x^{q}-x\), כלומר \(K=\left\{ a\in E|a^{q}-a=0\right\} \). הפאנץ' הוא שגם קבוצת השורשים הזו היא עצמה שדה; ומכיוון ששדה הפיצול של פולינום הוא השדה המינימלי ביחס להכלה שמכיל את כל השורשים שלו, נקבל ש-\(E=K\). אבל איך משתכנעים ש-\(K\) הוא שדה? אין מה לעשות, צריך לבדוק את כל התכונות של שדה. למרבה המזל, תכונות כמו קומוטטיביות, אסוציאטיביות ודיסטריביוטיות "נורשות" מהשדה הגדול ביותר (קחו \(a,b\in K\), אז בפרט \(a,b\in E\) ולכן \(a+b=b+a\) כי \(E\) שדה; אז המשוואה הזו מתקיימת באותה מידה גם ב-\(K\)). נשאר לבדוק שכפל וחיבור של איברים ב-\(K\) עדיין משאירים אותנו ב-\(K\); ש-0,1 שניהם ב-\(K\); ושאם \(a\in K\) כך גם ההופכיים החיבורי והכפלי שלו.

די בבירור 0,1 מאפסים את הפולינום \(x^{q}-x\), כך שזו לא בעיה.

בואו נעבור לטפל בתכונות הסגירות: אנחנו רוצים להראות שאם לוקחים שורשים כלשהם של \(x^{q}-x\) אז גם ההופכיים החיבורי והכפלי שלהם, וסכומם, ומכפלתם - כולם גם הם שורשים של \(x^{q}-x\).

בנוגע לקיום הופכי חיבורי: אם \(q\) אי זוגי אז

\(\left(-a\right)^{q}-\left(-a\right)=\left(-1\right)^{q}a^{q}+a=-a^{q}+a=-\left(a^{q}-a\right)=0\)

ואם \(q\) זוגי אז בהכרח \(q=2^{n}\) ואז השדה שבנינו הוא מעל \(\mathbb{Z}_{2}\), שהוא ממציין 2; ובמציין 2, \(1=-1\) ולכן \(-a=a\in K\).

בנוגע לקיום הופכי כפלי,

\(\left(a^{-1}\right)^{q}-a^{-1}=\left(a^{q}\right)^{-1}-a^{-1}=a^{-1}-a^{-1}=0\)

כאן הסתמכתי על זה ש-\(a^{q}=a\) שהרי \(a\) הוא שורש של \(x^{q}-x\).

נותר רק להראות שכפל של שורשים הוא שורש, ושסכום של שורשים הוא שורש. כפל גם הוא קל:

\(\left(ab\right)^{q}-\left(ab\right)=a^{q}b^{q}-ab=ab-ab=0\)

שוב, הסתמכתי על כך ש-\(a^{q}=a\) וכו'.

עבור חיבור היינו רוצים לעשות את אותו הדבר:

\(\left(a+b\right)^{q}-\left(a+b\right)=\left(a^{q}+b^{q}\right)-\left(a+b\right)=\left(a+b\right)-\left(a+b\right)=0\)

אבל כאן אנחנו בבעיה - השוויון \(\left(a+b\right)^{q}=a^{q}+b^{q}\) נראה אמנם מפתה, אבל כולם יודעים שהוא אינו נכון. הוא עד כדי כך מפתה עד שהוא זכה לשם Freshman's dream , אבל כבר בחזקת 2 אנחנו יודעים שזה לא עובד: \(\left(a+b\right)^{2}=a^{2}+2ab+b^{2}\) וזה כמובן שונה מ-\(a^{2}+b^{2}\). רק מה, אמרתי לכם שבשדות סופיים העולם מתנהג שונה ממה שאנחנו רגילים; ולמעשה, אפילו לא צריך שדות סופיים אלא שדות ממציין שונה מאפס. הנה לכם טענה נחמדה: בשדה ממציין \(p\), השוויון \(\left(a+b\right)^{q}=a^{q}+b^{q}\) הוא נכון לחלוטין אם \(p\) מחלק את \(q\).

למה? ובכן, בשדה ממציין \(p\), כל איבר שמחברים לעצמו מספר פעמים שהוא כפולה של \(p\) הוא אפס. כעת, את \(\left(a+b\right)^{q}\) אפשר לפתוח בעזרת הבינום של ניוטון ולקבל \(\left(a+b\right)^{q}=\sum_{i=0}^{q}{q \choose i}a^{q-i}b^{i}\). האיבר הראשון פה הוא \(a^{q}\) והאחרון הוא \(b^{q}\), ומה באמצע? האיבר השני הוא \(qa^{q-1}b\), כלומר \(a^{q-1}b\) מחובר לעצמו \(q\) פעמים, וזו כפולה של \(p\) אז האיבר הזה מתאפס. ובאופן כללי?

באופן כללי קל להתחיל מהמקרה שבו \(q=p\), כלומר החזקה עצמה היא הראשוני \(p\). במקרה כזה \({p \choose i}=\frac{p!}{i!\left(p-i\right)!}\) בבירור חייב להתחלק ב-\(p\), כי \(p\) מחלק את המונה (הוא חלק מהמכפלה \(p!\)) אבל אינו מחלק את המכנה, כי המכנה הוא כולו מכפלה של מספרים שקטנים יותר מ-\(p\), ו-\(p\) ראשוני. מכאן נובע חיש קל ש-\(\left(a+b\right)^{p}=a^{p}+b^{p}\), ומכאן פשוט להמשיך הלאה באינדוקציה: אם כבר ראינו ש-\(\left(a+b\right)^{p^{n-1}}=a^{p^{n-1}}+b^{p^{n-1}}\), אז

\(\left(a+b\right)^{p^{n}}=\left(\left(a+b\right)^{p^{n-1}}\right)^{p}=\left(a^{p^{n-1}}+b^{p^{n-1}}\right)^{p}=\left(a^{p^{n-1}}\right)^{p}+\left(b^{p^{n-1}}\right)^{p}=a^{p^{n}}+b^{p^{n}}\)

ובכך הוכחנו ש-\(\left(a+b\right)^{q}=a^{q}+b^{q}\) לכל \(q=p^{n}\), כשאנו עובדים בשדה ממציין \(p\).

נסכם - ראינו שאותו \(K\), אוסף השורשים של \(x^{q}-x\) בשדה הפיצול של הפולינום הזה מעל \(\mathbb{Z}_{p}\), הוא בעצמו שדה. ולכן זהו שדה הפיצול המדובר. לפולינום \(x^{q}-x\) יש בדיוק \(q\) שורשים כי ידוע שלפולינום ממעלה \(n\) יש \(n\) שורשים, ולכן...

הופ! שוב נפלנו למלכודת. אמנם, אפשר להוכיח שלפולינום ממעלה \(n\) יש בשדה הפיצול שלו \(n\) שורשים - עושים זאת באינדוקציה תוך אבחנה שאם \(a\) שורש של \(p\left(x\right)\) אז \(p\left(x\right)=\left(x-a\right)q\left(x\right)\) כאשר \(q\left(x\right)\) פולינום שדרגתו קטנה ב-1 מדרגת \(p\left(x\right)\) וכל שורש שלו הוא גם שורש של \(q\left(x\right)\) - אבל זה לא מבטיח שאותם שורשים הם שונים. למשל, לפולינום \(x^{2}-2x+1\) יש רק שורש יחיד: 1. זה שורש "מריבוי 2" כי אם כותבים את הפולינום כמכפלה של איקס-פחות-שורש, אז הגורם שמתאים ל-1 מופיע בחזקת 2: \(x^{2}-2x+1=\left(x-1\right)^{2}\). באופן דומה לפולינום \(\left(x-3\right)^{4}\left(x-5\right)\) יש שני שורשים: 5, שהוא שורש מריבוי 1, ו-3, שהוא שורש מריבוי 4. כשנפתח את הסוגריים נקבל פולינום ממעלה חמישית.

אנחנו רוצים להבטיח איכשהו שכל השורשים של \(x^{q}-x\) יהיו שונים זה מזה (פולינום שכזה נקרא ספרבילי). לשם כך אני רוצה להכניס למשחק עוד מושג שבאמצעותו יהיה לנו תכסיס נאה לבדיקה שפולינום הוא ספרבילי; הכלי הוא נגזרת פורמלית.

הנגזרת של הפולינום \(a_{k}x^{k}+a_{k-1}x^{k-1}+\dots+a_{1}x+a_{0}\) היא הפולינום \(a_{k}kx^{k-1}+a_{k-1}\left(k-1\right)x^{k-2}+\dots+a_{1}\). במילים אחרות, כופלים את המקדם של \(x^{k}\) ב-\(k\) ומקטינים את החזקה ב-1. בדרך כלל אם \(p\left(x\right)\) הוא פולינום, הנגזרת הפורמלית שלו מסומנת ב-\(p^{\prime}\left(x\right)\).

זו הגדרה "פורמלית", במובן זה שהיא לא מתבססת על גבולות, כמו ההגדרה הרגילה של נגזרת. הסיבה לכך היא שנגזרת היא מושג שבא לטפל במחלקה רחבה בהרבה של פונקציות, אבל במחיר של הנחות מסויימות של מבנה טופולוגי על השדה שמעליו עובדים (למשל, מעל \(\mathbb{R}\) הנגזרת מתבססת על כך שיש מושג של מרחק שמוגדר באמצעות ערך מוחלט). אנחנו לא רוצים להיכנס לזה ואין לנו בהכרח דרך טובה להגדיר נגזרת מעל שדות כלליים, ומצד שני מושג הנגזרת ספציפית עבור פולינומים הוא עדיין יעיל למדי, ולכן אנחנו מגדירים אותו באופן ישיר שכזה. מההגדרה הזו קל להוכיח את כללי הנגזרת הרגילים - למשל, ש-\(\left(p\left(x\right)\cdot q\left(x\right)\right)^{\prime}=p^{\prime}\left(x\right)q\left(x\right)+p\left(x\right)q^{\prime}\left(x\right)\), ותוצאה נחמדה אחת שנעזרת בנגזרת של פולינומים היא זו: לפולינום \(p\left(x\right)\) יש שורש מריבוי גדול מ-1 אם ורק אם יש ל-\(p\left(x\right)\) ול-\(p^{\prime}\left(x\right)\) שורש משותף (ומן הסתם, כל שורש משותף כזה יהיה דוגמה לשורש מריבוי גדול מ-1).

הנה ההוכחה: נניח ש-\(a\) הוא שורש של \(p\left(x\right)\), אז אפשר לכתוב \(p\left(x\right)=\left(x-a\right)q\left(x\right)\). נגזור את הביטוי ונקבל \(p^{\prime}\left(x\right)=q\left(x\right)+\left(x-a\right)q^{\prime}\left(x\right)\). כעת נציב את \(a\) ונקבל \(p^{\prime}\left(a\right)=q\left(a\right)\). כלומר, \(p^{\prime}\left(a\right)\) מתאפס אם ורק אם \(q\left(a\right)\) מתאפס; כלומר \(a\) הוא שורש של \(p^{\prime}\left(x\right)\) אם ורק אם הוא שורש של \(q\left(x\right)\) ולכן אם ורק אם הוא שורש מרובה של \(p\left(x\right)\).

כאשר גוזרים את \(x^{q}-x\) מקבלים \(qx^{q-1}-1\), אבל מכיוון ש-\(p\) מחלק את \(q\), אז הנגזרת היא \(-1\), שהוא פולינום ממעלה אפס ובפרט אין לו שורשים, ולכן לא יכול להיות לו שורש משותף עם \(x^{q}-x\) ולכן אין לפולינום הזה שורש מרובה וכל שורשיו שונים, כפי שרצינו. כאן זה יישום פשוט למדי של התעלול עם הנגזרת, אבל זה תעלול מועיל באופן כללי.

אם כן, לסיכום - הראנו ששדה הפיצול של \(x^{q}-x\) מעל \(\mathbb{Z}_{p}\) הוא בעל בדיוק \(q\) איברים, מה שהוכיח את קיומו של שדה עם \(q\) איברים. היחידות נובעת מכך ששדה פיצול הוא יחיד: נניח שיש לנו עוד שדה עם \(q=p^{n}\) איברים. הוא חייב להיות ממציין \(p\) (כי אם היה ממציין אחר, מספר האיברים שבו היה חייב להיות חזקה של המציין האחר הזה) ולכן מכיל בתוכו את \(\mathbb{Z}_{p}\). בנוסף, מכיוון שהוא בעל \(q\) איברים אז כפי שכבר ראינו כל איבר בו מקיים \(a^{q}-a=0\), ולכן הוא מכיל את כל שורשי \(x^{q}-x\) ורק אותם - לכן הוא שדה פיצול של \(x^{q}-x\), וכפי שאמרנו שדה פיצול הוא יחיד. זה מסיים את ההוכחה.

משפט האפיון הזה הוא יפהפה לטעמי לא רק בגלל התוצאה המעניינת לכשעצמה אלא גם בזכות שלל הטכניקות (הלא מסובכות אך האלגנטיות) שבהן השתמשנו לצורך ההוכחה. אני מקווה שיצא לי לכתוב בעתיד עוד פוסטים שבהם אשתמש באותם רעיונות.