ה-Casus irreducibilis, או: למה חייבים מספרים מרוכבים

הפעם הראשונה שבה פגשתי את המושג "מספר מרוכב" הייתה בספר לימוד אלגברה של בני גורן. מה שגורן אומר הוא זה: "למשוואה \(x^{2}+1=0\) אין פתרון כי לא קיים מספר ממשי \(x\) המקיים \(x^{2}=-1\). כדי שיהיה פתרון למשוואות מהסוג הנ"ל נצרף למערכת המספרים הממשיים "מספר" חדש שנסמנו ב-\(i\) ונגדירו בתור מספר שמקיים \(i^{2}=-1\)".

הדבר הזה הכה אותי בהלם. זו נראתה לי כמו רמאות מהסוג הנלוז ביותר. משוואה בלי פתרון? מה הבעיה? פשוט נגיד שיש פתרון! ומכאן ואילך נעשה המון דברים עם הפתרון הזה, בלי לעצור בכלל לשאול את עצמנו מה הלך פה כרגע ולמה כן יש פתרון ומאיפה זה הגיע. התוצאה הייתה שבמשך זמן רב הסתובבתי ואמרתי לאנשים דברים כמו "המספרים המרוכבים זה שטויות במיץ עגבניות" (טוב, אני לא בטוח שזה הציטוט המדויק…). ואז התחלתי ללמוד מתמטיקה, ודי מהר נתקלתי בבניה של המספרים המרוכבים מתוך זוגות של ממשיים וקצת נרגעתי – היה ברור לי שלא ממציאים פתרון אלא בונים אותו. אחר כך למדתי גם את הבניה ה"נכונה יותר" באמצעות בניית שדה שורש, משהו שהצגתי לא מזמן בבלוג, וראיתי עד כמה המספרים המרוכבים דומיננטיים במתמטיקה ומופיעים בשלל הקשרים שונים באופן טבעי, עד ששיניתי את דעתי – כבר לא היה ברור לי שבונים את המרוכבים, אלא נהיה לי ברור שמגלים את המרוכבים. שהם "נמצאים שם" באותו מובן שבו כל דבר במתמטיקה שנראה לנו טבעי וסביר "נמצא שם", ושגם אם ננסה בכוח לא להסתכל עליהם, הם שם ואנחנו נתנגש בהם אם נלך לכיוונם גם אם ננסה בכוח לא להביט בהם.

יש לא מעט דוגמאות לאופן שבו המרוכבים "חייבים להתגלות" גם אם ננסה להתעלם מהם, ובפוסט הזה אני רוצה לדבר על הדוגמא שהיא אולי המפורסמת והחשובה מכולן, מכיוון שהיא הדוגמא ההיסטורית של האופן שבו המספרים המרוכבים באמת התגלו. זה קרה במאה ה-16 באיטליה (אם כי אפשר לטעון שדיברו על מרוכבים גם קודם – ההיסטוריה אף פעם אינה עד כדי כך פשוטה) ושני הגיבורים המרכזיים של הסיפור נקראים ג'ירולמו קרדאנו ורפאל בומבלי, שניהם מתמטיקאים שעסקו באלגברה, ובפרט בפתרון משוואות ממעלה שלישית.

הסיפור ההיסטורי המלא הוא מרתק ומזכיר רומן ריגול, ולא אכנס לפרטיו כאן (הכרחי למשל להזכיר את שמו של טרטליה, שקרדאנו גנב ממנו את שיטת הפתרון שלו למשווואות מסויימות ממעלה שלישית – אבל זה לפוסט ייעודי בנושא).

קרדאנו זה עסק מרתק – הוא כתב את החיבור האירופאי המשמעותי הראשון על אלגברה, וטיפל בו ביסודיות במשוואות ממעלה שלישית, והזניק את המתמטיקה שנות אור קדימה, והוא הכיר בזה שקיימים מספרים מרוכבים, ועם זאת היחס שלו אליהם היה שלילי ביותר, כאל משהו הזוי שעדיף לדבר עליו כמה שפחות ולא לגמרי להתעסק איתו. כתוצאה מכך, הספר הכל כך חשוב שלו לא באמת נכנס לאלגברה של מספרים מרוכבים, לשאלות כמו אילו תכונות אלגבריות שיש בממשיים משתמרות ואילו לא, מה הטעם במרוכבים וכדומה. במילים אחרות, היחס שלו למרוכבים היה דומה ליחס שאני חשתי כלפיהם כששמעתי עליהם לראשונה, או ליחס של העולם המתמטי ל"אינסוף" לפני גאורג קנטור, וכדומה. האדם שלקח את המרוכבים צעד אחד קדימה וכן שאל עליהם את השאלות הנכונות ונתן תשובות היה רפאל בומבלי, בן זמנו של קרדאנו, שפרסם בעקבותיו ספר אלגברה משלו, שנחשב לטיפול הרציני הראשון במספרים מרוכבים. מה גרם לבומבלי להתייחס אליהם בצורה שונה כל כך מקרדאנו? כל הדברים היפים שאני יודע על מרוכבים עוד לא היו קיימים אז. מה כן היה? משוואות ממעלה שלישית. בומבלי ידע שבשביל לטפל בצורה מלאה במשוואות ממעלה שלישית הוא חייב מספרים מרוכבים.

אני רוצה להבהיר את ה"חייב" הזה. בשביל המשוואה \(x^{2}+1=0\) מתחילת הפוסט אנחנו לא חייבים מרוכבים. אפשר גם לומר "אין למשוואה פתרון" וזהו. עצם זה שאני "ממציא" פתרון לא באמת עוזר לי לכשעצמו – מה ההבדל בין לומר "אין פתרון ממשי" ובין לומר "אין פתרון ממשי אבל יש פתרון לא ממשי שהמצאתי כרגע"? אז לא, לא על זה מדובר. אני מדבר על משוואה כמו זו:

\(x^{3}+x^{2}-2x-1=0\)

זו משוואה פשוטה למדי, והפתרונות שלה הם בערך \(x_{1}\approx-1.80194,x_{2}\approx-0.445042,x_{3}\approx1.24698\). את ה"בערך" הזה קל למצוא בשיטות של אנליזה נומרית, למשל ניוטון-רפסון שהזכרתי בפוסט הזה. העניין הוא שבומבלי לא היה מעוניין ב"בערך" – הוא רצה נוסחה שנותנת את הפתרון בדיוק, כשהוא מתואר עם פעולות החשבון והוצאות שורשים. והעניין הוא שהנוסחה הזו חייבת להשתמש במספרים מרוכבים – כלומר, בהוצאות שורש למספרים שליליים – אפילו שהפתרונות בסופו של דבר הם ממשיים. בפוסט הזה אני גם אוכיח את ה"חייבת" הזה, אם כי ההוכחה עצמה לא הייתה מוכרת לבומבלי כי היא תשתמש בשיטות של תורת גלואה; פשוט לא הייתה ידועה דרך אחרת בזמנו של בומבלי שבה תהיה נוסחה שנותנת את הפתרונות ללא הוצאות שורש למספרים שליליים, וכיום אנחנו יודעים שלא הייתה ידועה דרך כזו פשוט כי אין דרך כזו.

בואו נחזור אל מה שדיברתי עליו בפוסט הקודם, כשהצגתי את הנוסחאות של קרדנו. הדרך לפתרון משוואה כללית מהצורה \(x^{3}+ax^{2}+bx+c\) עוברת דרך השלבים הבאים:

  1. לבצע את ההחלפה \(y=x+\frac{1}{3}\) שתחליף את המשוואה שלנו במשוואה \(y^{3}+px+q\) (הגורם הריבועי נעלם)
  2. לחשב את הדיסקרימיננטה \(D=-4p^{3}-27q^{2}\).
  3. להגדיר \(A=\sqrt[3]{-\frac{27}{2}q+\frac{3}{2}\sqrt{-3D}}\) ו-\(B=-\frac{3p}{A}\) (יוצא ש-\(B=\sqrt[3]{-\frac{27}{2}q-\frac{3}{2}\sqrt{-3D}}\), אבל צריך לבחור את השורש הנכון מבין השלושה כדי שיתקיים \(AB=-3p\)).
  4. נסמן \(\omega=\frac{1+\sqrt{-3}}{2}\) (זהו שורש יחידה פרימיטיבי מסדר 3) וכעת הפתרונות למשוואה \(y^{3}+px+q\) הם
  5. \(x_{1}=\frac{A+B}{3}\)
  6. \(x_{2}=\frac{\omega A+\omega^{2}B}{3}\)
  7. \(x_{3}=\frac{\omega^{2}A+\omega B}{3}\)

הדיסקרימיננטה של המשוואה, \(D=-4p^{3}-27q^{2}\), נותנת לנו אינדיקציה כלשהי על טיב הפתרונות. בואו ניזכר שניה בדיסקרימיננטה של משוואה ממעלה שניה, \(x^{2}+bx+c\): במקרה הזה, \(D=b^{2}-4c\), והחוק אומר כך: אם \(D>0\) אז למשוואה יש שני פתרונות ממשיים שונים; אם \(D=0\) יש פתרון ממשי יחיד (אפשר לחשוב על זה בתור פתרון ש"חוזר על עצמו", אם אנחנו מצפים שלמשוואה ממעלה שניה יהיו שני פתרונות), ואם \(D<0\) אז אין פתרונות ממשיים (יש שני פתרונות מרוכבים).

עבור ה-\(D\) של המעלה השלישית, הסיפור הוא שונה. אם \(D=0\) אז יש פתרון שחוזר על עצמו; לא נדבר על המקרה הזה. אם \(D<0\) אז \(\sqrt{-3D}\) הולך להיות שורש של מספר ממשי חיובי, ולכן מספר ממשי בעצמו; ונקבל מכך ש-\(A,B\) שניהם ממשיים חיוביים ולכן \(\frac{A+B}{3}\) יהיה פתרון ממשי. שני הפתרונות האחרים יהיו מרוכבים, ולכן מי שלא מתעניין במרוכבים יכול פשוט להתעלם מקיומם. לעומת זאת, המקרה \(D>0\) הוא בעייתי. במקרה הזה, \(\sqrt{-3D}\) כולל הוצאת שורש למספר שלילי, כלומר הנוסחה מכריחה אותנו להשתמש במרוכבים (או לא להשתמש בה ולקוות שיש נוסחה אחרת), ובמקרה הזה כל שלושת הפתרונות הם ממשיים. מה שקורה הוא ש-\(A,B\) יהיו מספרים מרוכבים, אבל החלקים המדומים שלהם יבטלו זה את זה כשמחברים אותם, ולכן התוצאה שתתקבל לבסוף תהיה מספר ממשי. בכל שלושת המקרים. המקרה הזה של \(D>0\) נקרא המקרה האי-פריק, ובלטינית: ה-Casus irreducibilis. היסטורית, הדילמה שהסיטואציה הזו הציבה בפני המתמטיקאים – השתמשו במספרים מרוכבים או שתפספסו פתרונות ממשיים – נפתרה בצורה החד משמעית של אימוץ זהיר של המספרים המרוכבים למתמטיקה. יעבור עוד כמה מאות שנים עד שהאימוץ הזה יסתיים סופית, וזה חומר טוב לפוסט שיכתב בפעם אחרת.

ראשית, צריך לחדד נקודה אחת. הפולינום \(x^{3}-6x^{2}+11x-6\) הוא עם השורשים \(1,2,3\) – הופס, הנה הבענו אותם בלי מרוכבים ובלי שורשים. מה הולך פה? ובכן, זה פולינום פריק מעל \(\mathbb{Q}\). "המקרה האי פריק" מתייחס לסיטואציה שבה הפולינום לא פריק – כלומר, אין לו שורש רציונלי. בתור דוגמא קונקרטית, קחו את המשוואה שהראיתי קודם, \(x^{3}+x^{2}-2x-1=0\). אחרי ביצוע ההחלפה \(y=x+\frac{1}{3}\) תקבלו את המשוואה \(y^{3}-\frac{7}{3}y-\frac{7}{27}=0\) שהיא לא כזה להיט, אז רק כדי שתיראה נחמדה יותר נבצע את ההחלפה \(y=3\left(x+\frac{1}{3}\right)\) ונקבל משוואה יותר קלה לעיכול: \(y^{3}-21y-7=0\). עבור המשוואה הזו נקבל \(D=35721=3^{6}\cdot7^{2}\). למספר הזה קל להוציא שורש: \(\sqrt{D}=3^{3}\cdot7\). לכן, אם נציב בנוסחה, נקבל:

\(A=\sqrt[3]{-\frac{27}{2}q+\frac{3}{2}\sqrt{-3D}}=\sqrt[3]{\frac{27\cdot7}{2}+\frac{3\cdot3^{3}\cdot7}{2}\sqrt{-3}}\)

\(=\sqrt[3]{27\left(\frac{7}{2}+\frac{21}{2}\sqrt{-3}\right)}=3\sqrt[3]{\frac{7}{2}+\frac{21}{2}\sqrt{-3}}\)

צריך להוסיף לזה גם את \(B\), ובסוף מקבלים פתרון מהצורה

\(3\sqrt[3]{\frac{7}{2}+\frac{21}{2}\sqrt{-3}}+3\sqrt[3]{\frac{7}{2}-\frac{21}{2}\sqrt{-3}}\)

ומה עושים עם דבר כזה? הוא מכיל מרוכבים באופן שאי אפשר להיפטר ממנו. אז איך אני יודע שכל הפתרונות ממשיים, בעצם? הנה שתי דרכים שונות לראות את זה. ראשית, אם נציב ב-\(f\left(y\right)=y^{3}-21y-7\) ערכים קונקרטיים, נראה שהפולינום הזה מחליף בין ערכים חיוביים ושליליים:

\(f\left(-5\right)=-27\)

\(f\left(-1\right)=13\)

\(f\left(0\right)=-7\)

\(f\left(5\right)=13\)

משפט ערך הביניים בחדו"א אומר לנו שיש לפולינום הזה שורשים ממשיים: אחד בקטע \(\left(-5,-1\right)\), השני בקטע \(\left(-1,0\right)\) והשלישי בקטע \(\left(0,5\right)\). אם זה לא משכנע אתכם, אתם פשוט יכולים לחשב את הנוסחה עד הסוף: להוציא שורשים זה לא קשה במיוחד אפילו ידנית, אבל הכי סביר לתת למחשב לבצע את החישובים בשבילכם. כמובן, אין סיבה שתטרחו – כבר נתתי את הפתרונות בקירוב למעלה, וזה יהיה מה שתקבלו.

בואו נעבור לדבר עכשיו על העיקר – למה אי אפשר לפתור משוואה עם \(D>0\) באמצעות רדיקלים מבלי לערב בתמונה מספרים מרוכבים. ברור לנו שעם השיטה של נוסחאות קרדנו אי אפשר, אבל אנחנו באים לומר שאף שיטה לא תעבוד (ויש עוד שיטות פרט לנוסחאות קרדנו).

עכשיו, נניח ש-\(p\left(x\right)\) פתיר באמצעות רדיקלים ללא שימוש במרוכבים. זה אומר שיש לנו מגדל של שדות \(\mathbb{Q}=E_{0}\subset E_{1}\subset E_{2}\subset\dots\subset E_{k}\) (הסימן \(\subset\) מתאר הכלה ממש, ללא שוויון) כך ש-\(E_{k}\) מכיל את כל השורשים של \(p\left(x\right)\), כל השדות מוכלים ב-\(\mathbb{R}\), ו-\(E_{i+1}/E_{i}\) היא הרחבה רדיקלית – \(E_{i+1}=E_{i}\left(\sqrt[n_{i}]{a_{i}}\right)\) כך ש-\(a_{i}\in E_{i}\). מה שאראה בסופו של דבר הוא שלשדה האחרון חייב להתגנב \(\omega_{3}=\frac{1+\sqrt{-3}}{2}\) – שורש יחידה פרימיטיבי מסדר 3, שהוא כמובן מספר לא ממשי.

הדבר הראשון שאעשה יהיה להכניס את \(\sqrt{D}\) לכל השדות – אני מוסיף מספר ממשי, אז זה לא משנה את האופן שבו כל השדות מוכלים ב-\(\mathbb{R}\). כלומר, אפשר להניח שהסיטואציה היא מגדל שדות \(\mathbb{Q}\subset\mathbb{Q}\left(\sqrt{D}\right)\subset E_{2}\subset E_{3}\subset\dots\subset E_{k}\). אם בגלל הוספת \(\sqrt{D}\) נוצרו לנו שוויונות בין שדות באמצע אפשר פשוט להסיר אותם.

כעת, כמה שאלות מנחות שיעזרו לנו להבין את הסיטואציה.

שאלה ראשונה: האם ייתכן שכל שורשי \(p\left(x\right)\) כבר נמצאים ב-\(\mathbb{Q}\left(\sqrt{D}\right)\), ואז המגדל שלנו הוא בסך הכל \(\mathbb{Q}\subset\mathbb{Q}\left(\sqrt{D}\right)\)? תשובה: לא ייתכן! כי \(p\left(x\right)\) הוא פולינום אי פריק ממעלה שלישית ולכן שדה שמכיל שורש אחד שלו לפחות יהיה ממימד 3 או יותר מעל \(\mathbb{Q}\), ואילו \(\left[\mathbb{Q}\left(\sqrt{D}\right):\mathbb{Q}\right]=2\). מסקנה: \(k\ge2\), כלומר יש לפחות שלושה שדות במגדל ההרחבות שלנו.

שאלה שניה: האם ייתכן שבאחד מהשדות לפני \(E_{k}\) יהיה שורש כלשהו של \(p\left(x\right)\)? תשובה: אפשר להניח שלא! כי אם שדה כלשהו מכיל גם את \(\sqrt{D}\) וגם שורש כלשהו של \(p\left(x\right)\), נובע מכך שהוא מכיל את כל השורשים של \(p\left(x\right)\) ולכן אפשר פשוט לוותר על כל השדות בהמשך ולהסיר אותם מהמגדל. רגע, למה אם מכילים את \(\sqrt{D}\) ושורש של \(p\left(x\right)\) אז מכילים את כל השורשים? זה דורש עוד הסבר.

מה שקורה פה הוא קסם בסגנון תורת גלואה. נניח ש-\(K\) הוא שדה הפיצול של \(p\left(x\right)\) מעל \(\mathbb{Q}\). אנחנו יודעים ש-\(\left[K:\mathbb{Q}\right]\le6\). כעת, אנחנו גם יודעים ש-\(\left[\mathbb{Q}\left(\sqrt{D}\right):\mathbb{Q}\right]=2\) וש-\(\mathbb{Q}\left(\sqrt{D}\right)\subseteq K\) (כי מה זה \(\sqrt{D}\)? זה בסך הכל \(\left(\alpha-\beta\right)\left(\alpha-\gamma\right)\left(\beta-\gamma\right)\) עבור השורשים \(\alpha,\beta,\gamma\) של \(p\left(x\right)\) שכולם שייכים ל-\(K\)). כעת, מכיוון ש-\(p\left(x\right)\) עדיין אי-פריק מעל \(\mathbb{Q}\left(\sqrt{D}\right)\) (פולינום ממעלה שלישית הוא פריק מעל שדה אם ורק אם יש לו שורש בו), נקבל ש-\(\left[\mathbb{Q}\left(\sqrt{D},\alpha\right):\mathbb{Q}\left(\sqrt{D}\right)\right]=3\) ולכן \(\left[\mathbb{Q}\left(\sqrt{D},\alpha\right):\mathbb{Q}\right]=6\). מצד שני, \(\mathbb{Q}\left(\sqrt{D},\alpha\right)\subseteq K\) וזה מכריח את שני השדות הללו להיות שווים.

שאלה שלישית: מה יכול להכריח את \(E_{k}\) להכיל מספרים מרוכבים? הנה תשובה פשוטה: אם אראה ש-\(E_{k}/E_{k-1}\) היא הרחבה ממימד 3, זה יסיים את זה מייד. למה? כי ראשית כל, ב-\(E_{k-1}\) אין שורשים של \(p\left(x\right)\) ואילו ב-\(E_{k}\) יש את כולם ולכן \(E_{k}\) הוא בהכרח שדה הפיצול של \(p\left(x\right)\) מעל \(E_{k-1}\) (הוא לא יכול להיות גדול ממש ממנו, כי גם שדה הפיצול ממימד 3). זה אומר ש-\(E_{k}/E_{k-1}\) היא הרחבה גלואה. יותר מכך: אנחנו יודעים ש-\(E_{k}=E_{k-1}\left(\sqrt[3]{a}\right)\) עבור \(a\in E_{k-1}\) כי זוהי הרחבה רדיקלית (למה השורש הוא שלישי? כי אחרת ההרחבה לא הייתה ממימד 3).

כעת הפאנץ': מכיוון ש-\(E_{k}/E_{k-1}\) היא גלואה, אז כל השורשים של \(\sqrt[3]{a}\) שייכים ל-\(E_{k}\) (זכרו שהרחבת גלואה \(E/F\) היא בעלת התכונה שאם \(E\) כולל שורש של פולינום אי-פריק מעל \(F\) אז \(E\) כולל את כל השורשים שלו). אבל מי השורשים הללו? בדיוק \(\sqrt[3]{a},\omega\sqrt[3]{a},\omega^{2}\sqrt[3]{a}\). קחו שני שורשים, חלקו אחד בשני והופס, קיבלתם מספר לא ממשי. סוף הסיפור.

הצלחנו אם כן להגיע עם הדיון למצב כזה שבו הכל תלוי בכך ש-\(\left[E_{k}:E_{k-1}\right]=3\). איך מוכיחים את זה? ראשית, מכיוון ש-\(E_{k}\) בודאות מכילה את שדה הפיצול של \(p\left(x\right)\) מעל \(E_{k-1}\) והמימד של שדה הפיצול הזה מתחלק ב-3, אז גם \(\left[E_{k}:E_{k-1}\right]\) מתחלק ב-3. רק צריך להראות שהוא בהכרח שווה ל-3.

ראשית, שימו לב שאם יש לי הרחבה רדיקלית מהצורה \(E=F\left(\sqrt[nm]{a}\right)\) אז אפשר לפרק אותה לשתי הרחבות רדיקליות מהצורה \(K=F\left(\sqrt[n]{a}\right)\) ו-\(E=K\left(\sqrt[m]{\left(\sqrt[n]{a}\right)}\right)\). זה מאפשר לנו להניח תמיד שההרחבות שלנו הן מהצורה \(F\left(\sqrt[p]{a}\right)\) כאשר \(p\) הוא ראשוני. אם נוכיח ש-\(\left[F\left(\sqrt[p]{a}\right):F\right]=p\), סיימנו; זה כי הראשוני היחיד שמתחלק ב-3 הוא 3.

אנחנו יודעים ש-\(\left[F\left(\sqrt[p]{a}\right):F\right]=d\) כאשר \(d\) היא הדרגה של הפולינום המינימלי של \(\sqrt[p]{a}\) מעל \(F\). איך הפולינום המינימלי הזה נראה? זה לא כל כך טריוויאלי; זכרו שכדי למצוא את הפולינום המינימלי לשורשי היחידה הפרימיטיביים, מה שנקרא הפולינום הציקלוטומי, עבדנו לא מעט. אבל יש לנו כאן דרך קיצור. אנחנו יודעים ש-\(\sqrt[p]{a}\) הוא שורש של הפולינום \(x^{p}-a\) מעל \(F\), ולכן הפולינום המינימלי מחלק את הפולינום הזה, ובפרט השורשים של הפולינום המינימלי הם כולם מהצורה \(\omega_{p}\sqrt[p]{a}\) כאשר \(\omega_{p}\) הוא שורש יחידה פרימיטיבי מסדר \(p\). כעת, אנחנו יודעים שהמקדם החופשי של פולינום הוא מכפלת השורשים שלו, ולכן אם נסמן \(\alpha=\sqrt[p]{a}\) נקבל שהמקדם החופשי של הפולינום המינימלי הזה הוא \(\alpha^{d}\zeta\) כאשר \(\zeta\) הוא שורש יחידה כלשהו, כלומר אנחנו יודעים ש-\(\alpha^{d}\zeta\in F\).

כעת אפשר להכניס לתמונה את ההנחה הנוספת שלנו – ש-\(F\) ממשי, כלומר \(F\subseteq\mathbb{R}\). הממשיות הזו מתווה לנו נתיב מאוד צר ללכת בו; זו אולי הסיבה העיקרית שבגללה כדאי לראות את ההוכחה. זה מאפשר לנו להרגיש עד כמה מרוכבים הם משהו שבלתי אפשרי לחמוק ממנו – לא משנה לאיזה כיוון תנסו ללכת, הופס, צצים מרוכבים. במקרה הנוכחי, אם אנחנו רוצים שיתקיים \(\alpha^{d}\zeta\in\mathbb{R}\), אז מכיוון ש-\(\alpha\in\mathbb{R}\) אנחנו נדחפים לכך ש-\(\zeta\in\mathbb{R}\), ויש רק שני שורשי יחידה ממשיים, \(\zeta=\pm1\). המסקנה היא ש-\(\alpha^{d}\in F\) (כלומר, בכתיב פחות יפה, \(\sqrt[p]{a^{d}}\in F\)). אני טוען שזה מוכיח ש-\(d=p\).

כדי לראות למה זה קורה, שימו לב לכך ש-\(\alpha^{p}=a\in F\), אז יש לנו ב-\(F\) את האיברים \(\alpha^{d},\alpha^{p}\). את שני האיברים הללו אפשר להעלות באיזו חזקה שלמה שבא לנו, ולכפול אותם, ולכן נקבל ש-\(\alpha^{xd+yp}\in F\) לכל \(x,y\in\mathbb{Z}\). כעת אני שולף את אחד מסוסי העבודה הבסיסיים שלנו באלגברה: התחלנו את הדיון על תורת השדות עם התוצאה הנפלאה על כך שכדי שמספר יהיה ניתן לבניה באמצעות סרגל ומחוגה, ההרחבה הפשוטה שהוא יוצר חייבת להיות חזקה של 2; זה הוכיח שאי אפשר להכפיל את נפח הקוביה כי זה דרש לבנות מספר שההרחבה שלו היא ממימד 3. הדמיון הוא לא מקרי, אבל שם ניסינו לבנות את האיבר \(\sqrt[3]{2}\) שהוא שורש של \(x^{3}-2\) שכן יש לו שורשים מרוכבים, כך שאלו עדיין תוצאות נפרדות; אבל הן משלימות זו את זו יפה, כשהדובדבן שבקצפת הוא ששורש כזה של פולינום שכל מקדמיו ממשיים והוא ניתן לפתרון באמצעות רדיקלים ממשיים – שורש כזה יהיה ניתן בהכרח לבניה בסרגל ומחוגה.

סגירת המעגל הזו היא נקודה טובה לסיים בה את סדרת הפוסטים על תורת גלואה ולעבור לנושא הבא באלגברה, אבל יש עוד נושא אחד שלדעתי כדאי לטפל בו – המשפט היסודי של האלגברה שניתן להוכחה באמצעות תורת גלואה (יחד עם שימוש הכרחי במשפט ערך הביניים מחדו"א, שהזכרתי גם בפוסט הזה). למרבה המזל, כבר כתבתי פוסט כזה. בשעתו נפנפתי קצת בידיים על תורת הגלואה שבו מתוך תקווה שיום אחד יהיה בבלוג הסבר מפורט לכל העניינים הללו בסדרת פוסטים ייעודית והוא יעמוד בפני עצמו בתור המשך טבעי של הפוסטים האלה. כמעט עשור חלף, והנה זה אכן קרה.

6 תגובות בנושא “ה-Casus irreducibilis, או: למה חייבים מספרים מרוכבים”

  1. נראה לי שנשמט בטעות קטע בפסקה הלפני אחרונה, אחרי "כעת אני שולף את אחד מסוסי העבודה הבסיסיים שלנו באלגברה:", שמשתמש בעובדה שקיימים $x,y$ שלמים שמקיימים: $(p,d)=xd+yp$.
    המסקנה המיידית תהיה שאם $(p,d)=1$, אז $\alpha \in F$, וזאת הרחבה מנוונת. מכיוון ש-$d \le p$ ו-$p$ ראשוני, ה-gcd של $p$ וכל טבעי קטן יותר הוא 1, ולכן הפתרון היחיד הוא $p=d$.

  2. אחלה פוסט, היה מעניין לקרוא.
    יש אי-דיוק בתשובה לשאלה השנייה: "אנחנו גם יודעים ש-z $[\mathbb{Q}[\sqrt{D}]:\mathbb{Q}] = 2$". זה לא בהכרח נכון, מימד ההרחבה הזו בהחלט יכול להיות גם שווה ל-1, בדיוק במקרה ש-D הוא ריבוע רציונלי (כמו בדוגמה שלך!). התיקון הנדרש להוכחה הוא בשימוש בעובדה עדינה יותר מאשר z$[K:\mathbb{Q}] \le 6$: מעלת ההרחבה הזו שווה ל-6 אם ורק אם D אינו ריבוע רציונלי, ושווה ל-3 אחרת. זה (ובעצם העובדה הסופית שאתה רוצה להוכיח) היא בעצם מקרה פרטי של מה שהוכח בפוסט הקודם, אולי בנוסח אחר: שחבורת הגלואה של K מעל השדה עם שורש הדיסקרימיננטה מוכלת ב-$A_n$.

    במעלה 3 לדעתי מעניין גם להוכיח את זה ישירות: באמצעות מקדמי הפולינום, אחד השורשים, ושורש הדיסקרימיננטה, אפשר לחשב במפורש את השורשים האחרים (מתוך המקדמים והשורש האחד אפשר לחשב את הסכום של השניים האחרים, ואת ריבוע הפרשם; בחירת שורש לדיסקרימיננטה מאפשרת לחשב את ההפרש ממש, לא רק עד כדי הוצאת שורש / בחירת סימן). במילים אחרות, הוספת שורש אחד כבר מוסיפה את שלושתם, בהנתן שורש הדיסקרימיננטה.

    1. אני לא מבין מה הרעיון בפתרון הזה. שימוש ב-arccos במקום להסתפק בארבע פעולות החשבון והוצאות שורש? זו דרך לטאטא את השורש-שלישי והמרוכבים מתחת לשטיח. ב-arccos יכול להיכנס ערך שהוא לא בין מינוס 1 ל-1.

  3. לא הבנתי למה נבחר דווקא y=1/3x+1 ואיך מזה אתה מגיע להשוואה מהמעלה השלישית שהגעת אליה עם y ובלי הגורם הריבועי

  4. השורשים של הפולינום שנתת כדוגמה בהתחלה
    X^3+X^2-2X-1 הם
    (2cos (2n×pai÷7
    כש n הוא בין 1ל3
    חשבתי שיהיה נחמד עם תציין את זה באיזו הערת שוליים בפוסט
    זה גם יראה איך מרוכבים צצים ובאופן בלתי נמנע אפילו במקומות "ממשיים" כמו טריגומטריה

כתיבת תגובה

האימייל לא יוצג באתר.