אז איך פותרים משוואה ממעלה שלישית?
סדרת הפוסטים שלי על תורת גלואה הגיעה בפוסט הקודם אל נקודת השיא שלה, שבה הוכחתי שאין נוסחה כללית לפתרון משוואות (פולינומיות, כשהפתרון הוא בעזרת רדיקלים) ממעלה 5 ומעלה. ליתר דיוק, מה שהוכחתי הוא זה:
- פולינום הוא פתיר באמצעות רדיקלים אם ורק אם חבורת הגלואה שלו היא פתירה.
- חבורת הגלואה של "פולינום כללי" ממעלה \( n \) מעל שדה \( F \) שכולל גם את המקדמים של הפולינום היא \( S_{n} \).
- \( S_{n} \) לא פתירה עבור \( n\ge5 \) וכן פתירה עבור \( n\le4 \).
מה שעניין אותי עד כה היה ה-“\( S_{n} \) לא פתירה עבור \( n\ge5 \)”, אבל עכשיו היוצרות מתהפכות ואני מנסה להבין איך המשפט של גלואה “מגלה לנו” את הפתרונות עבור המקרים \( n=2,3,4 \). זו גישה קצת אנכרוניסטית כי היא הופכת את הסדר - הנוסחאות לפתרון משוואות ממעלה רביעית ומטה היו ידועות היטב בימיו של גלואה והתגלו מאות שנים לפני כן. לא “צריך” את תורת גלואה בשבילן, אבל אני חושב שתורת גלואה עוזרת להבין מה בעצם הולך בהן, וזו גם הזדמנות טובה להראות את הצד ה”חיובי” של תורת גלואה בפעולה - זה שאשכרה יודע לפתור משוואות ולא רק להגיד שתשכחו מזה.
הדיסקרימיננטה
כזכור או לא, שיטת העבודה שגלואה הציע היא זו: אם \( E/F \) היא ההרחבה שבה \( E \) הוא שדה הפיצול של הפולינום מעל \( F \) שאנחנו רוצים לפתור, ואם \( G=\text{Gal}\left(E/F\right) \) היא פתירה, אז זה נותן לנו סדרה של תת-חבורות \( G=G_{0}\supset G_{1}\supset\dots\supset G_{k}=\left\{ e\right\} \) כך ש-\( G_{i}/G_{i+1} \) היא ציקלית לכל \( 0\le i<k \). תת-החבורות הללו נותנות לנו סדרה של שדות, שהם שדות השבת שלהן: \( F=E_{0}\subset E_{1}\subset\dots\subset E_{k}=E \). הטוויסט של גלואה עכשיו הוא שאפשר לקבל כל \( E_{i+1} \) כזו מתוך \( E_{i} \) על ידי הוצאת שורש מסדר כלשהו לאיבר ב-\( E_{i} \) (בתנאי שב-\( E_{i} \) כבר יש את שורשי היחידה המתאימים, אחרת תוקעים הרחבה נוספת בין \( E_{i} \) ו-\( E_{i+1} \) שמוסיפה אותם, גם כן על ידי הוצאת שורש).
כעת נשאלת השאלה איך מבצעים בפועל כל צעד בסדרת הצעדים הזו. כלומר, אם \( E/F \) הרחבה כך ש-\( \text{Gal}\left(E/F\right) \) ציקלית מסדר \( n \) ויש ב-\( F \) כבר את שורשי היחידה מסדר \( n \), מה עושים כדי למצוא את האיבר שצריך להרחיב באמצעות שורש שלו את \( F \) כדי לקבל את \( E \)? אם נסתכל בהוכחה שהראיתי, אז נראה שהפתרון עובר דרך מה שנקרא הרזולבנטה של לגראנז'. הרעיון הוא זה: אם \( \text{Gal}\left(E/F\right) \) ציקלית עם יוצר \( \sigma \), ואם \( \omega \) הוא שורש יחידה פרימיטיבי מסדר \( n \), ואם \( \alpha\in E \) הוא איבר כלשהו, אז מגדירים את הרזולבנטה כך:
\( \left(\alpha,\omega\right)=\alpha+\omega\sigma\left(\alpha\right)+\omega^{2}\sigma^{2}\left(\alpha\right)+\dots+\omega^{n-1}\sigma^{n-1}\left(\alpha\right) \)
כלומר, הרזולבנטה של \( \alpha,\omega \) היא איבר של \( E \) שנבנה בתור איזה סכום מתוחכם של דברים שמתקבלים מ-\( \alpha,\omega \) וחבורת הגלואה. מה שהוכחנו כבר הוא שהחזקה ה-\( n \)-ית של האיבר הזה שייכת ל-\( F \), ושאם האיבר הזה שונה מאפס אז הוא לא שייך לאף שדה ביניים של \( E \), כלומר הוספה שלו ל-\( F \) תייצר בהכרח את \( E \). מה שעושים עכשיו הוא לסמן \( a\triangleq\left(\alpha,\omega\right)^{n} \) ולקבל \( E=F\left(\sqrt[n]{a}\right) \) (כאשר כאמור \( a\in F \) כי זה הקסם שרזולבנטה עושה).
בואו נתחיל מלראות דוגמא למה קורה במקרה הפשוט של הרחבה ממימד 2. נסתכל על המקרה הקונקרטי של יחס הזהב \( \varphi \) שהוא שורש של הפולינום \( x^{2}-x-1 \), שקל לראות שהוא אי-פריק מעל \( \mathbb{Q} \) ולכן ההרחבה \( \mathbb{Q}\left(\varphi\right)/\mathbb{Q} \) היא ממימד 2. כרגע לא ברור שהיא רדיקלית כי \( \varphi \) אינו שורש של אף איבר ב-\( \mathbb{Q} \). השאלה היא “לאיזה איבר של \( \mathbb{Q} \) ישתלם לנו עכשיו להוציא שורש כדי לקבל את \( \mathbb{Q}\left(\varphi\right) \)”.
מכיוון שההרחבה \( \mathbb{Q}\left(\varphi\right)/\mathbb{Q} \) היא ממימד 2, חבורת הגלואה המתאימה היא בת שני איברים, היחידה ו-\( \sigma \), כאשר \( \sigma \) מחליפה בין \( \varphi \) לבין הפתרון השני של המשוואה שמסומן לעתים כ-\( \varphi_{-} \). במקרה של חבורה ממימד 2, שורש היחידה שצריך בשביל הרזולבנטה הוא פשוט \( \omega=-1 \), והרזולבנטה של איבר כלשהו תצא \( \left(\alpha,\omega\right)=\alpha-\sigma\left(\alpha\right) \). מה שאנחנו מחפשים, אם כן, הוא איבר של \( \mathbb{Q}\left(\varphi\right) \) שהרזולבנטה שלו לא תהיה 0, ואז הרזולבנטה הזו תהיה יוצרת של \( \mathbb{Q}\left(\varphi\right) \) והריבוע שלה יהיה שייך ל-\( \mathbb{Q} \).
את מי ניקח כדי לייצר את הרזולבנטה הזו? למה לא את \( \varphi \) עצמו? \( \varphi\ne\sigma\left(\varphi\right) \) (לא מאמינים? פשוט תבדקו ש-\( x^{2}-x-1 \) ספרבילי על ידי גזירה שלו) ולכן \( \varphi-\varphi_{-} \) הוא האיבר שאנחנו מחפשים. אבל מי הוא בעצם? אם פותרים את \( x^{2}-x-1 \) בעזרת נוסחת השורשים רואים ש-\( \varphi=\frac{1+\sqrt{5}}{2} \) ואילו \( \varphi_{-}=\frac{1-\sqrt{5}}{2} \); כלומר, הרזולבנטה היא \( \left(\frac{1+\sqrt{5}}{2}\right)-\left(\frac{1-\sqrt{5}}{2}\right)=\sqrt{5} \). טה-דה! ההוכחה של גלואה הראתה לנו את מה שהיה ברור לנו אינטואיטיבית מראש - שאם מסתכלים על \( \frac{1+\sqrt{5}}{2} \), אז “החלק החשוב” פה הוא \( \sqrt{5} \); ש-\( \mathbb{Q}\left(\sqrt{5}\right) \) היא הדרך ה”רדיקלית” להציג את ההרחבה שלנו. עדיין, זה לא אומר שמה שהולך פה לא היה חמוד - אני מקווה שזה הזכיר לכם את האופן שבו כדי לבודד את החלק המדומה מתוך מספר מרוכב \( a+bi \), מחסרים ממנו את הצמוד שלו; זה בדיוק הסיפור כאן.
עכשיו בואו נדבר על מה קורה במקרה של “פולינום כללי”. בפוסט הקודם הצגתי שתי שיטות סימון לפולינום כללי, אחת שמציגה אותו בעזרת המקדמים שלו (שההנחה היא שהם בלתי תלויים אלגברית) ואחרת שמציגה אותו באמצעות השורשים שלו (שגם עליהם יש את ההנחה הזו). ההצגה באמצעות מקדמים נראית קצת מוזרה במבט ראשון אבל ראינו למה היא עדיפה על הכתיב היותר אינטואיטיבי בפוסט הקודם:
\( p\left(x\right)=x^{n}-s_{1}x^{n-1}+s_{2}x^{n-2}+\dots+\left(-1\right)^{n-1}s_{n-1}x+\left(-1\right)^{n}s_{n} \)
ההצגה באמצעות שורשים היא זו:
\( p\left(x\right)=\left(x-\alpha_{1}\right)\left(x-\alpha_{2}\right)\cdots\left(x-\alpha_{n}\right) \)
וההרחבה הרלוונטית שאנחנו רוצים להראות שהיא רדיקלית היא \( F\left(\alpha_{1},\dots,\alpha_{n}\right)/F\left(s_{1},\dots,s_{n}\right) \), כאשר \( F \) הוא שדה כלשהו ממציין 0 אבל בדרך כלל אנחנו חושבים עליו בתור \( \mathbb{Q} \) (הוא בוודאי מכיל את \( \mathbb{Q} \), ואנחנו לא משתמשים בהנחות נוספות לגביו).
בפוסט הקודם ראינו שחבורת הגלואה של ההרחבה הזו היא \( S_{n} \); עבור כל \( \sigma\in S_{n} \), האוטומורפיזם של \( F\left(\alpha_{1},\dots,\alpha_{n}\right) \) ש-\( \sigma \) מתארת הוא זה שמבצע פרמוטציה על השורשים \( \alpha_{1},\dots,\alpha_{n} \) כמו ש-\( \sigma \) מבצעת פרמוטציה על \( \left\{ 1,2,\dots,n\right\} \), כלומר אם משתמשים ב-Abuse of notation ומשתמשים ב-\( \sigma \) גם כדי לתאר את האוטומורפיזם, זה האוטומורפיזם שמבצע \( \sigma\left(\alpha_{i}\right)=\alpha_{\sigma\left(i\right)} \). על אברי \( F \) האוטומורפזים \( \sigma \) פועל כמו הזהות, ולכן הוא הזהות על כל \( F\left(s_{1},\dots,s_{n}\right) \), כי כל \( s_{i} \) כזה הוא פונקציה סימטרית בשורשים \( \alpha_{1},\dots,\alpha_{n} \) ולכן משתמר על ידי פרמוטציות שלהם.
בואו נסתכל שוב על המקרה של פולינום ממעלה שניה, הפעם פולינום כללי \( p\left(x\right)=x^{2}-bx+c \). אם אסמן את שורשי הפולינום ב-\( \alpha,\beta \) נקבל את שתי המשוואות
\( b=\alpha+\beta \)
\( c=\alpha\beta \)
במקרה הזה, חבורת הגלואה שלנו כוללת שני איברים, הזהות ו-\( \sigma \) שמקיימת \( \sigma\left(\alpha\right)=\beta \) ו-\( \sigma\left(\beta\right)=\alpha \). אז אם ניקח את \( \alpha \) בתור יוצר אפשרי של רזולבנטה מועילה, נקבל את הרזולבנטה \( \alpha-\sigma\left(\alpha\right)=\alpha-\beta \). אם ניקח את הריבוע שלה, נקבל \( \left(\alpha-\beta\right)^{2}=\alpha^{2}-2\alpha\beta+\beta^{2} \) שאמור להיות איבר של \( \mathbb{Q}\left(b,c\right) \). איך אני יודע שזה יעבוד? כי \( \alpha^{2}-2\alpha\beta+\beta^{2} \) היא פונקציה סימטרית, ולכן ניתנת להצגה בתור צירוף של פונקציות סימטריות פרימיטיביות. עכשיו, לא התעסקתי באלגוריתם שתמיד מוצא ייצוג כזה, אבל אפשר עם תעלול קטן להצליח פה בקלות: פשוט שמים לב לכך ש-
\( b^{2}=\left(\alpha+\beta\right)^{2}=\alpha^{2}+2\alpha\beta+\beta^{2} \)
שזה כמעט אותו דבר כמו מה שאנחנו רוצים, רק צריך להפוך את הסימן של ה-\( 2\alpha\beta \) שבאמצע - ואת זה אפשר לעשות בעזרת \( c=\alpha\beta \). נקבל:
\( b^{2}-4c=\left(\alpha-\beta\right)^{2} \)
ולכן \( \sqrt{b^{2}-4c}=\left(\alpha-\beta\right) \) הוא האיבר שאם נרחיב את \( \mathbb{Q} \) באמצעותו נגיע לשדה שבו נמצאים \( \alpha,\beta \): \( \mathbb{Q}\left(\alpha,\beta\right)=\mathbb{Q}\left(\sqrt{b^{2}-4c}\right) \). הביטוי \( b^{2}-4c \) בוודאי מוכר לכם - הוא מופיע בנוסחה הכללית לפתרון משוואה ממעלה שניה, ואולי שמעתם את השם דיסקרימיננטה שבא לתאר אותו. אנחנו מכירים את הדיסקרימיננטה בתור כלי שבא לספר לנו משהו על הפתרונות: אם \( b^{2}-4c>0 \) אז יש לנוסחה שני פתרונות ממשיים, אם \( b^{2}-4c=0 \) אז יש פתרון ממשי יחיד ואם \( b^{2}-4c<0 \) אז יש שני פתרונות מרוכבים. עם זאת, זה לא יהיה ההיבט שיעניין אותי עכשיו (אבל שימו לב שאם \( b^{2}-4c=0 \) אז אכן, אין הרחבה; הפתרון למשוואה במקרה הזה הוא איבר יחיד שכבר שייך ל-\( \mathbb{Q} \)).
עכשיו השאלה היא מה קורה במקרה של פולינום כללי ממעלות גבוהות יותר. התשובה היא שתמיד ניתן להגדיר דיסקרימיננטה, והוספה שלה היא תמיד הצעד הראשון החיובי שאפשר לנקוט בו. אבל מה ההגדרה הנכונה לדיסקרימיננטה כללית? בשביל להבין את זה בואו ננסה להבין את הפרטים המלוכלכים שהיה קל לטאטא מתחת לשטיח במקרה של מימד 2. בואו נסמן ב-\( E \) את שדה השבת של \( A_{n} \) בתוך \( F\left(\alpha_{1},\dots,\alpha_{n}\right) \), אז מה שאנחנו יודעים הוא שחבורת הגלואה של \( E/F\left(s_{1},\dots,s_{n}\right) \) איזומורפית ל-\( \mathbb{Z}_{2} \), ואנחנו מנסים למצוא דרך לייצר את \( E \). הבעיה היא שלא ברור מי הוא \( E \) במקרה הכללי; במקרה של מימד 2, זה היה פשוט \( F\left(\alpha,\beta\right) \) עצמו.
אם כן, השאלה שלנו היא זו: בהינתן \( \sigma\in A_{n} \), מי האיברים שמשתמרים על ידי כל \( \sigma \) שכזו?מה שדה הביניים של \( F\left(\alpha_{1},\dots,\alpha_{n}\right) \) שמתאים ל-\( A_{n} \)? בשביל לענות לשאלה הזו כדאי לחזור לפוסט שבו הגדרתי לראשונה את \( A_{n} \). ההגדרה שלי הייתה מוזרה במבט ראשון - הגדרתי את \( A_{n} \) בתור גרעין של הומומורפיזם של פונקציה שעשתה את הדבר הבא: הסתכלה על הפולינום \( \Delta=\prod_{1\le i<j\le n}\left(x_{i}-x_{j}\right) \) ולכל \( \sigma \) התאימה את \( \frac{\sigma\left(\Delta\right)}{\Delta} \), כאשר \( \sigma \) פעל על \( \Delta \) בדרך ה”צפויה”: \( \sigma\left(x_{i}\right)=x_{\sigma\left(i\right)} \). לא קשה להוכיח שזה הומומורפיזם שמחזיר או 1 או \( -1 \), ו-\( A_{n} \) הוגדרה להיות הגרעין שלו. כלומר כל התמורות \( \sigma \) שמקיימות \( \sigma\left(\Delta\right)=\Delta \). עכשיו, מה זה אומר לנו? אם במקום לדבר על \( x_{i} \)-ים נדבר על \( \alpha_{i} \)-ים, מה שאנחנו רואים הוא ש-\( \Delta \) הוא איבר ששייך לשדה השבת של כל אברי \( A_{n} \), אבל מכיוון שיש איברים ב-\( S_{n} \) שמחזירים עליו \( -1 \), הוא בוודאי לא שייך לשדה השבת של \( S_{n} \), כלומר הוא לא שייך ל-\( F\left(s_{1},\dots,s_{n}\right) \).
עכשיו, מהי הרזולבנטה של \( \Delta \)? מכיוון ש-\( S_{n}/A_{n}\cong\mathbb{Z}_{2} \) הסיטואציה דומה לזו שהייתה קודם - הרזולבנטה תהיה \( \Delta-\sigma\left(\Delta\right) \), אבל צריך להיות קצת זהירים לגבי מהי \( \sigma \) הזו. הרי האיברים של \( S_{n}/A_{n} \) הם קוסטים של \( S_{n} \). מה זה אומר במקרה שלנו? אנחנו לא יכולים להפעיל קוסט על \( \Delta \)!
ובכן, אם נחזור למה שעשינו בהוכחת המשפט היסודי של תורת גלואה נראה שהרעיון הכללי היה זה: אם \( F\subseteq K\subseteq E \) היא מגדל של הרחבות כך ש-\( \text{Gal}\left(E/F\right)=G \) ו-\( \text{Gal}\left(E/K\right)=H \) אז \( \text{Gal}\left(K/F\right)\cong G/H \), אבל צריך להבין שזה רק איזומורפיזם; זה לא שוויון ממש של חבורות. האיברים של \( \text{Gal}\left(K/F\right) \) הם אוטומורפיזמים של \( K \), לא קוסטים של \( G/H \), כלומר קבוצות של אוטומורפיזמים של \( G \). הנקודה הייתה שאם \( \sigma\in\text{Gal}\left(K/F\right) \) היא אוטומורפיזם של \( K \) אז ניתן להרחיב את \( \sigma \) לאוטומורפיזם של \( G \) בשלל דרכים שונות, והדרכים הללו יניבו בדיוק את האיברים של \( G/H \). במילים אחרות, אם אני רוצה להבין מה \( \sigma \) עושה לאיברים של \( K \), אני יכול לקחת איבר כלשהו של הקוסט המתאים ב-\( G/H \) ולהפעיל אותו על אברי \( K \), ומובטח לי שלא משנה איזה איבר אני אקח מהקוסט אני אקבל את אותה התוצאה.
במקרה שלנו, כדי להבין מה \( \sigma\in S_{n}/A_{n} \) עושה ל-\( \Delta \) אני יכול לבחור \( \sigma\in S_{n} \) כלשהו ששייך לקוסט הלא טריוויאלי ב-\( S_{n}/A_{n} \); כלומר, \( \sigma \) היא בדיוק תמורה אי-זוגית כלשהי. העניין הוא שכפי שכבר ראינו, הפעולה של כל התמורות האי זוגיות על \( \Delta \) היא זהה: \( \sigma\left(\Delta\right)=-\Delta \). מכאן שהרזולבנטה של \( \Delta \) תהיה \( \left(\Delta,-1\right)=\Delta-\sigma\left(\Delta\right)=\Delta+\Delta=2\Delta \). כלומר, עד כדי הקבוע חסר המשמעות של 2, הרזולבנטה של \( \Delta \) זו היא עצמה, מה שאומר ש-\( \Delta^{2}\in F\left(s_{1},\dots,s_{n}\right) \). כמובן, אין כאן משהו מפתיע במיוחד: נסמן \( D=\Delta^{2} \) אז קל לראות ש-\( D=\prod_{1\le i<j\le n}\left(\alpha_{i}-\alpha_{j}\right)^{2}=\prod_{i\ne j}\left(\alpha_{i}-\alpha_{j}\right) \) היא פולינום סימטרי ולכן בוודאי שניתן לכתיבה באמצעות \( s_{1},\dots,s_{n} \). ה-\( D \) הזה נקרא הדיסקרימיננטה של הפולינום; לכל פולינום עם שורשים \( \alpha_{1},\dots,\alpha_{n} \) הדיסקרימיננטה מוגדרת כ-\( \prod_{1\le i<j\le n}\left(\alpha_{i}-\alpha_{j}\right)^{2} \), גם אם זה לא פולינום גנרי ואפילו אם שורש כלשהו חוזר על עצמו (ולכן \( D=0 \) במקרה הזה).
לסיכום: אם אנחנו רוצים לפתור משוואה פולינומית כלשהי באמצעות רדיקלים, הצעד הראשון שכדאי שננקוט בו הוא להוסיף לשדה שלנו את \( \sqrt{D} \) - השורש הריבועי של הדיסקרימיננטה של המשוואה. במשוואות ממעלה שניה זה מסיים את הסיפור. ובמשוואה ממעלה שלישית? ובכן, כאן הסיטואציה מסובכת יותר.
איך פותרים משוואה ממעלה שלישית, שלב א': מציאת הדיסקרימיננטה
נתחיל במילה זריזה למי שבאים לפה בתקווה למצוא נוסחה פשוטה כמו עבור משוואות למעלה שניה - תשכחו מזה. לא סתם הייתה מהומה שלמה סביב פתרון משוואות כאלו, ואני מקווה לכתוב פוסט מפורט בנושא בעתיד. אבל, וזה אבל גדול, עכשיו משאנחנו מצויידים בידע מתורת גלואה, מה שהולך פה לא יראה כמו מהומה אקראית אלא יש סדר והגיון כלשהו במה שנעשה.
השלב הראשון הוא פישוט של המשוואה שאנחנו רוצים לפתור, על ידי החלפת משתנים. לא מזמן הצגתי שיטה פשוטה למציאת הנוסחה של משוואה ממעלה שניה; התעלול המרכזי שם היה לפשט את \( x^{2}+ax+b \) על ידי ההחלפה \( y=x+\frac{a}{2} \). זה “מחק” לגמרי את המקדם של \( x \) במשוואה, ונותרה לנו משוואה עם מקדם חופשי מסובך.
במשוואה ממעלה שלישית ננקוט בתעלול דומה, אבל זה לא יסיים את הסיפור עבורנו אלא רק יעלים את אחד מהגורמים במשוואה, ובכך יפשט את מצב העניינים. אם המשוואה שלנו היא \( x^{3}+ax^{2}+bx+c \), אז נשתמש בהחלפה \( y=x+\frac{a}{3} \). כלומר, \( x=y-\frac{a}{3} \). עכשיו אפשר לבצע חישוב ארוך וכואב ולבדוק עם מה אנחנו נשארים:
\( x^{3}=\left(y-\frac{a}{3}\right)^{3}=y^{3}-y^{2}a+\frac{ya^{2}}{3}-\frac{a^{3}}{27} \)
\( ax^{2}=a\left(y-\frac{a}{3}\right)^{2}=ay^{2}-\frac{2ya^{2}}{3}+\frac{a^{3}}{9} \)
\( bx=by-\frac{ba}{3} \)
שימו לב ל-\( -y^{2}a \) בשורה של \( x^{3} \) ול-\( ay^{2} \) בשורה של \( ax^{2} \) - הם מבטלים זה את זה, ולכן אנחנו הולכים להישאר עם משוואה מהצורה
\( y^{3}+py+q \)
החישוב המדויק של \( p,q \) לא כל כך חשוב לנו כי מכאן ואילך אני הולך לפתור רק את המשוואה הזו ולא אטרח בסוף לחזור למשוואה המקורית, אבל למי שזה חשוב לו, אפשר לבצע את החישוב הזה בקלות, הוא פשוט לא יפה:
\( p=\frac{a^{2}}{3}-2\frac{a^{2}}{3}+b=b-\frac{a^{2}}{3}=\frac{1}{3}\left(3b-a^{2}\right) \)
\( q=-\frac{a^{3}}{27}+\frac{a^{3}}{9}-\frac{ba}{3}+c=\frac{1}{27}\left(2a^{3}-9ab+27c\right) \)
זהו, מעכשיו אני רוצה להתמקד בשאלה איך פותרים את המשוואה הבאה:
\( x^{3}+px+q \)
אם הולכים על פי השיטה של תורת גלואה, הצעד הראשון הוא להוסיף את \( \sqrt{D} \) לשדה שלנו, מה שאומר שנצטרך לחשב את הדיסקרימיננטה (בגלל הפישוט של המשוואה, גם הדיסקרימיננטה תצא פשוטה). השלב השני הוא להמשיך את שרשרת התת-חבורות שלנו: האיבר הנוכחי בשרשרת הוא \( A_{3} \), שהוא פשוט החבורה הציקלית \( \mathbb{Z}_{3} \). זה אומר שאם אנחנו כרגע בשדה \( E \), אז ההרחבה שאנחנו צריכים כדי להגיע אל הפתרונות של המשוואה היא זו: קודם כל להוסיף ל-\( E \) את שורשי היחידה מסדר 3, ואחר כך להוסיף ל-\( E \) רזולבנטה שונה מאפס של איבר כלשהו משדה הפיצול.
אני אגלה מראש שהדיסקרימיננטה שנקבל תהיה \( D=-4p^{3}-27q^{2} \), אבל כדי לקבל אותה נצטרך לעשות קצת להטוטים.
בואו נסמן את השורשים של המשוואה ב-\( \alpha,\beta,\gamma \). מה שאנחנו מחפשים הוא דרך לתאר ב-\( \mathbb{Q}\left(p,q\right) \) את
\( \left(\alpha-\beta\right)^{2}\left(\alpha-\gamma\right)^{2}\left(\beta-\gamma\right)^{2} \)
אפשר פשוט לפתוח את הסוגריים ולקבץ איברים, אבל זה יהיה איבר מפלצתי בגודלו. הנה תעלול שיכול לפשט מאוד את העניינים: בואו נכתוב את \( g\left(x\right)=x^{3}+px+q \) במפורש בעזרת השורשים:
\( g\left(x\right)=\left(x-\alpha\right)\left(x-\beta\right)\left(x-\gamma\right) \)
עכשיו, מצד אחד קל לנו לגזור את \( g\left(x\right) \) כשהוא מוצג עם \( p,q \):
\( g^{\prime}\left(x\right)=3x^{2}+p \)
אם נגזור את \( g\left(x\right) \) בצורה הכפלית שלה, על פי כללי הגזירה הרגילים, נקבל:
\( g^{\prime}\left(x\right)=\left(x-\beta\right)\left(x-\gamma\right)+\left(x-\alpha\right)\left(x-\gamma\right)+\left(x-\alpha\right)\left(x-\beta\right) \)
עכשיו ננקוט בתעלול ונציב בתוך \( g^{\prime} \) הזו כל אחד משלושת השורשים. זה תמיד יאפס שניים מהמחוברים, כך שנקבל:
\( g^{\prime}\left(\alpha\right)=\left(\alpha-\beta\right)\left(\alpha-\gamma\right) \)
\( g^{\prime}\left(\beta\right)=\left(\beta-\alpha\right)\left(\beta-\gamma\right) \)
\( g^{\prime}\left(\gamma\right)=\left(\gamma-\beta\right)\left(\gamma-\alpha\right) \)
ועכשיו תראו איזה קסם קרה! המכפלה של כל שלושת הביטויים הללו היא בדיוק \( D \), עד כדי סימן!
\( D=-g^{\prime}\left(\alpha\right)g^{\prime}\left(\beta\right)g^{\prime}\left(\gamma\right)=-\left(3\alpha^{2}+p\right)\left(3\beta^{2}+p\right)\left(3\gamma^{2}+p\right) \)
הבעיה היא שעכשיו הכיף נגמר - עדיין יש לי ביטוי מסובך שצריך לפשט, ואין לי ברירה אלא לפתוח את הסוגריים. זה כאילו עברתי לדבר על פולינום אחר, שהמשתנה שלו הוא \( p \) והשורשים שלו הם \( -3\alpha^{2},-3\beta^{2},-3\gamma^{2} \). לכן ברור שכשאני אפתח את הסוגריים אני אקבל פונקציות סימטריות בשורשים; הכי פשוט יהיה לכתוב את זה ולגמור עם זה:
\( -D=p^{3}+3\left(\alpha^{2}+\beta^{2}+\gamma^{2}\right)p^{2}+9\left(\alpha^{2}\beta^{2}+\alpha^{2}\gamma^{2}+\beta^{2}\gamma^{2}\right)p+27\left(\alpha^{2}\beta^{2}\gamma^{2}\right) \)
אנחנו יודעים שכל פונקציה סימטרית ב-\( \alpha,\beta,\gamma \) ניתנת לכתיבה בתור צירוף כלשהו של \( p,q \) (כי כל פונקציה סימטרית בשורשים של פולינום ניתנת לכתיבה בתור צירוף של המקדמים). זה לא חוסך מאיתנו את הצורך המעיק למצוא את הצירוף הזה.
מה אנחנו יודעים על הקשר בין המקדמים והשורשים?
- \( \alpha+\beta+\gamma=0 \) (זה המקדם של \( x^{2} \))
- \( p=\alpha\beta+\alpha\gamma+\beta\gamma \)
- \( q=-\alpha\beta\gamma \)
אם כן, מייד אנחנו רואים ש-\( \alpha^{2}\beta^{2}\gamma^{2}=q^{2} \) וזה כבר טיפל לנו באחת משלוש הפונקציות הסימטריות שיש למעלה. בואו נמשיך אל הבאות בתור.
אם נעלה בריבוע את \( \alpha+\beta+\gamma \) נקבל:
\( 0=\left(\alpha^{2}+\beta^{2}+\gamma^{2}\right)+2\left(\alpha\beta+\alpha\gamma+\beta\gamma\right)=\left(\alpha^{2}+\beta^{2}+\gamma^{2}\right)+2p \)
כך שיש לנו עוד מקדם: המקדם של \( p^{2} \) בדיסקרימיננטה הוא פשוט \( -2p \).
התעלול האחרון יהיה להעלות בריבוע את \( p \) עצמו. נקבל:
\( p^{2}=\left(\alpha^{2}\beta^{2}+\alpha^{2}\gamma^{2}+\beta^{2}\gamma^{2}\right)+2\left(\alpha^{2}\beta\gamma+\alpha\beta^{2}\gamma+\alpha\beta\gamma^{2}\right) \)
המחובר הימני יעלים את עצמו:
\( \alpha^{2}\beta\gamma+\alpha\beta^{2}\gamma+\alpha\beta\gamma^{2}=q\left(\alpha+\beta+\gamma\right)=0 \)
כך שקיבלנו:
\( p^{2}=\left(\alpha^{2}\beta^{2}+\alpha^{2}\gamma^{2}+\beta^{2}\gamma^{2}\right) \)
וכשנציב הכל בביטוי של הדיסקרימיננטה נקבל:
\( -D=p^{3}+3\left(-2p\right)p^{2}+9\left(p^{2}\right)p+27\left(q^{2}\right)=4p^{3}+27q^{2} \)
בדיוק כמו שהבטחתי למעלה.
איך פותרים משוואה ממעלה שלישית, שלב ב' - שובן של הרזולבנטות
סיכום ביניים קצר: התחלנו מ-\( \mathbb{Q}\left(p,q\right) \) ועברנו אל \( \mathbb{Q}\left(p,q,\sqrt{D}\right) \) כאשר \( D=-4p^{3}-27q^{2} \). עכשיו, אומרת תורת גלואה, נא להרחיב את השדה עם שורש יחידה פרימיטיבי מסדר 3. אוקיי, נסמן את השורש הזה ב-\( \omega\triangleq e^{\frac{2\pi i}{3}} \). אנחנו עכשיו מעל השדה \( \mathbb{Q}\left(p,q,\sqrt{D},\omega\right) \). ועכשיו? עכשיו אנחנו מחפשים איבר שעדיין אין לנו, שחזקת 3 שלו כן נמצאת איתנו. איבר כזה יכול להתקבל בתור הרזולבנטה של משהו, בתנאי שהרזולבנטה הזו תהיה שונה מאפס.
איך נראית רזולבנטה במקרה שלנו? היא יותר מסובכת ממה שהיה קודם - קודם התעסקנו עם שורש היחידה הפרימיטיבי מסדר 2 ואילו עכשיו יש לנו את \( \omega \). חבורת הגלואה הרלוונטית היא \( A_{3} \) שאפשר לכתוב הכי במפורש בעולם: \( A_{3}=\left\{ e,\left(1\ 2\ 3\right),\left(1\ 3\ 2\right)\right\} \). אז אני אסמן \( \sigma=\left(1\ 2\ 3\right) \). באופן מפורש, זו הפונקציה שמבצעת
\( \sigma\left(\alpha\right)=\beta \)
\( \sigma\left(\beta\right)=\gamma \)
\( \sigma\left(\gamma\right)=\alpha \)
ולכן:
\( \sigma^{2}\left(\alpha\right)=\gamma \)
\( \sigma^{2}\left(\beta\right)=\alpha \)
\( \sigma^{2}\left(\gamma\right)=\beta \)
מה שנעשה עכשיו הוא להסתכל על כל הרזולבנטות של השורש \( \alpha \), עבור כל אחד משלושת שורשי היחידה האפשריים, \( 1,\omega,\omega^{2} \):
\( \left(\alpha,1\right)=\alpha+\sigma\left(\alpha\right)=\sigma^{2}\left(\alpha\right)=\alpha+\beta+\gamma=0 \)
\( \left(\alpha,\omega\right)=\alpha+\sigma\left(\alpha\right)\omega=\sigma^{2}\left(\alpha\right)\omega^{2}=\alpha+\beta\omega+\gamma\omega^{2}=\theta_{1} \)
\( \left(\alpha,\omega^{2}\right)=\alpha+\sigma\left(\alpha\right)\omega^{2}=\sigma^{2}\left(\alpha\right)\omega=\alpha+\beta\omega^{2}+\gamma\omega=\theta_{2} \)
השילוב של שלוש הרזולבנטות הללו ביחד יכול לחלץ את \( \alpha \) כמעט מייד באופן הבא: בואו נחבר את שלושתן ונקבל
\( 0+\theta_{1}+\theta_{2}=3\alpha+\left(1+\omega+\omega^{2}\right)\beta+\left(1+\omega^{2}+\omega\right)\gamma \)
העניין הוא ש-\( 1+\omega+\omega^{2}=0 \). אין כאן קסם מיוחד - זה כך לכל סכום של כל שורשי היחידה מסדר מסוים, ונובע פשוט מכך ש-
\( 1+\omega+\omega^{2}+\dots+\omega^{n-1}=\frac{\omega^{n}-1}{\omega-1}=\frac{1-1}{\omega-1}=0 \)
לכן קיבלנו:
\( \alpha=\frac{\theta_{1}+\theta_{2}}{3} \)
כאשר מובטח לנו ש-\( \theta_{1}^{3},\theta_{2}^{3} \) כבר שייכים לשדה שאנחנו עובדים מעליו. כל מה שנשאר לנו לעשות הוא למצוא הצגה מפורשת שלהם. זה יהיה, אולי שלא במפתיע, החלק הכי טכני פה.
איך אני אחשב את \( \theta_{1}^{3} \)? ובכן, במפורש. זה סכום של שלושה איברים, ולכן כשאעלה אותו בחזקה שלישית אני אקבל סכום של 27 איברים וזה לא נעים בכלל, אבל נתמודד עם זה. תהיה הרבה סימטריה.
הנוסחה הכללית שרלוונטית לנו היא זו:
\( \left(x+y+z\right)^{3}=\left(x^{3}+y^{3}+z^{3}\right)+3x^{2}\left(y+z\right)+3y^{2}\left(x+z\right)+3z^{2}\left(x+y\right)+6xyz \)
הרעיון פה הוא כמו הבינום של ניוטון: כל מונום בפיתוח הוא תוצאה של בחירה של איבר מכל אחד משלושת המוכפלים. \( x^{3} \) למשל מתאים לסיטואציה שבה בחרנו את \( x \) מכולם, ויש רק דרך אחת לעשות זאת; לעומת זאת, \( x^{2}y \) פירושו שבחרנו \( x \) משני מוכפלים ו-\( y \) מהשלישי, ויש 3 דרכים לעשות זאת (אנחנו בוחרים מאיזה מהמוכפלים ניקח את \( y \)). ה-\( 6xyz \) בסיום מגיע מכך שיש 6 פרמוטציות אפשריות על 1,2,3 וכל פרמוטציה אומרת לנו “מהמוכפל ה-\( i \) קח את האיבר ה-\( \sigma\left(i\right) \)-י”.
עכשיו אני מציב:
\( x=\alpha \)
\( y=\beta\omega \)
\( z=\gamma\omega^{2} \)
ומקבל:
\( \left(\alpha^{3}+\beta^{3}+\gamma^{3}\right)+ \)
\( 3\alpha^{2}\left(\beta\omega+\gamma\omega^{2}\right)+3\beta^{2}\omega^{2}\left(\alpha+\gamma\omega^{2}\right)+3\gamma^{2}\omega\left(\alpha+\omega\beta\right)+ \)
\( 6\alpha\beta\gamma \)
המחובר התחתון הוא פשוט מאוד: זה \( -6q \) ידידינו משכבר הימים.
המחובר העליון גם כן לא מסובך. בואו נציב את \( \alpha,\beta,\gamma \) בביטוי ל-\( \left(x+y+z\right)^{3} \) שהראיתי קודם - אנחנו הרי יודעים ש-\( \alpha+\beta+\gamma=0 \) וזה יעזור לנו פעמיים: זה אומר לנו ש-\( \left(x+y+z\right)^{3}=0 \) במקרה הזה, וזה מחליף גורם כמו \( 3x^{2}\left(y+z\right) \) בגורם הידידותי יותר \( -3x^{3} \), כך שבסופו של דבר נקבל:
\( 0=-2\left(\alpha^{3}+\beta^{3}+\gamma^{3}\right)+6\alpha\beta\gamma \)
כלומר
\( \alpha^{3}+\beta^{3}+\gamma^{3}=-3q \)
עיקר המהומה נמצאת בגורם האמצעי; יותר קל להבין מה קורה איתו אם מקבצים אותו לפי חזקות של \( \omega \). אנחנו נקבל:
\( 3\omega\left(\alpha^{2}\beta+\beta^{2}\gamma+\gamma^{2}\alpha\right)+3\omega^{2}\left(\alpha^{2}\gamma+\beta^{2}\alpha+\gamma^{2}\beta\right) \)
שזה, למען האמת, ביטוי די סימטרי ונחמד! אבל די קשה להרגיש את זה מבלי שתהיו חייבים לכתוב את כל זה בעצמכם (ובואו לא נשלה את עצמנו - אני כותב את הפוסט ברמת הפירוט הזו בדיוק בגלל שאני רוצה להבין את הסיפור הזה פעם אחת ולתמיד). אבל “די סימטרי ונחמד” לא עוזר לי - אני צריך משהו שחי בשדה \( \mathbb{Q}\left(p,q,\sqrt{D},\omega\right) \). אז בואו אני אוכיח לכם שהמקדם של \( 3\omega \) שווה ל-\( \frac{3q+\sqrt{D}}{2} \) והמקדם של \( 3\omega^{2} \) שווה ל-\( \frac{3q-\sqrt{D}}{2} \).
בשביל זה צריך לחזור קודם כל להגדרה של \( \sqrt{D} \):
\( \sqrt{D}=\left(\alpha-\beta\right)\left(\alpha-\gamma\right)\left(\beta-\gamma\right) \)
מכפלות כאלו כבר קטנות עלינו; בואו נפתח את הסוגריים ונקבל
\( \sqrt{D}=\left(\alpha^{2}\beta+\beta^{2}\gamma+\gamma^{2}\alpha\right)-\left(\alpha^{2}\gamma+\beta^{2}\alpha+\gamma^{2}\beta\right) \)
בואו ניקח את אותו ביטוי בדיוק רק עם פלוס במקום מינוס באמצע:
\( S=\left(\alpha^{2}\beta+\beta^{2}\gamma+\gamma^{2}\alpha\right)+\left(\alpha^{2}\gamma+\beta^{2}\alpha+\gamma^{2}\beta\right) \)
אז ברור ש-
\( \frac{S+\sqrt{D}}{2}=\left(\alpha^{2}\beta+\beta^{2}\gamma+\gamma^{2}\alpha\right) \) (זה המקדם של \( 3\omega \))
\( \frac{S-\sqrt{D}}{2}=\left(\alpha^{2}\gamma+\beta^{2}\alpha+\gamma^{2}\beta\right) \) (זה המקדם של \( 3\omega^{2} \))
נשאר רק להבין את \( S \) עצמו, אבל זה בדיוק הביטוי שצץ במהלך הפיתוח של \( \left(\alpha+\beta+\gamma\right)^{3} \):
\( 0=\left(\alpha+\beta+\gamma\right)^{3}=\left(\alpha^{3}+\beta^{3}+\gamma^{3}\right)+3S+6\alpha\beta\gamma=-3q+3S-6q \)
כלומר, נקבל \( S=3q \), כפי שהבטחתי.
בזאת סיימנו! סיימנו את החישוב של \( \theta_{1}^{3} \):
\( \theta_{1}^{3}=-3q+\frac{3}{2}\omega\left(3q+\sqrt{D}\right)+\frac{3}{2}\omega^{2}\left(3q-\sqrt{D}\right)-6q \)
האם אפשר לפשט את הביטוי הזה עוד יותר? ובכן, כן, אם רוצים להיפטר משורשי היחידה. ראשית, \( \omega+\omega^{2}=-1 \), אז מביטוי כמו זה קל להיפטר. שנית, וזה פחות טריוויאלי, \( \omega-\omega^{2}=\sqrt{-3} \). כדי לראות את הדבר השני בואו נזכור ש-\( \omega \) הוא שורש של הפולינום הציקלוטומי \( x^{2}+x+1 \) ובעזרת הנוסחה לפתרון משוואה ממעלה שניה נקבל \( \omega=\frac{1+\sqrt{-3}}{2} \) ו-\( \omega^{2}=\frac{1-\sqrt{-3}}{2} \) ומהם זה מיידי.
עכשיו הפישוט ברור: נקבל איבר מהצורה \( \frac{9q}{2}\left(\omega+\omega^{2}\right) \) ואיבר מהצורה \( \frac{3\sqrt{D}}{2}\left(\omega-\omega^{2}\right) \), ובסך הכל נקבל:
\( \theta_{1}^{3}=-9q-\frac{9q}{2}+\frac{3\sqrt{D}}{2}\sqrt{-3} \)
ולכן:
\( \theta_{1}^{3}=-\frac{27}{2}q+\frac{3}{2}\sqrt{-3D} \)
שזה… די פשוט, חייבים להודות!
אוקיי, ומה עם \( \theta_{2}^{3} \)? זה מזעזע, אבל גם אותו צריך לחשב!
אבל… אם עוצרים וחושבים רגע, מה ההבדל בין שניהם? בואו ניזכר איך הם הוגדרו:
\( \theta_{1}=\alpha+\beta\omega+\gamma\omega^{2} \)
\( \theta_{2}=\alpha+\gamma\omega+\beta\omega^{2} \)
כל מה שהשתנה הוא החלפת התפקידים של \( \beta \) ו-\( \gamma \), אבל למה שזה ישפיע על משהו מהמשך החישוב? כל מה שקורה הוא סימטרי לחלוטין ביחס ל-\( \beta \) ו-\( \gamma \) ו… רגע, לא, לא נכון. יש דבר אחד שבמובהק שובר את הסימטריה: \( \sqrt{D} \). אולי כבר שכחנו, אבל זו הייתה כל הפואנטה של \( \sqrt{D} \); שזה איבר שלא נמצא בשדה השבת של \( S_{3} \); הגענו לכך שחילוף בודד מעביר את \( \sqrt{D} \) אל \( -\sqrt{D} \). זה בדיוק מה שיקרה כאן - הביטוי שנקבל ל-\( \theta_{2}^{3} \) זהה לביטוי של \( \theta_{1}^{3} \) למעט זה שצריך להחליף את \( \sqrt{D} \) ב-\( -\sqrt{D} \), ונקבל:
\( \theta_{2}^{3}=-\frac{27}{2}q-\frac{3}{2}\sqrt{-3D} \)
איך פותרים משוואה ממעלה שלישית, שלב ג' - נוסחאות קרדנו
בואו נעשה סיכום ביניים של מה שיש לנו. מצאנו איברים \( \theta_{1},\theta_{2} \) שנותנים לנו את השורש \( \alpha \) של הפולינום \( x^{3}+px+q \) באופן הבא:
\( \alpha=\frac{\theta_{1}+\theta_{2}}{3} \)
\( \theta_{1}^{3}=-\frac{27}{2}q+\frac{3}{2}\sqrt{-3D} \)
\( \theta_{2}^{3}=-\frac{27}{2}q-\frac{3}{2}\sqrt{-3D} \)
מפתה מאוד לכתוב עכשיו משהו בסגנון הזה:
\( \alpha=\frac{1}{3}\left(\sqrt[3]{-\frac{27}{2}q+\frac{3}{2}\sqrt{-3D}}+\sqrt[3]{-\frac{27}{2}q-\frac{3}{2}\sqrt{-3D}}\right) \)
אבל למרות שזה מפתה, צריך להיזהר פה. לכתוב \( \sqrt[3]{a} \) אומר “קחו את אחד מהשורשים השלישיים של \( a \), לא חשוב איזה”. עכשיו, זה נכון שאפשר לקבל את \( \theta_{1} \) על ידי בחירת שורש שלישי כלשהו של \( -\frac{27}{2}q+\frac{3}{2}\sqrt{-3D} \) באופן שרירותי (עבור בחירה שונה של שורש נקבל בסוף גם שורש שונה מבין שלושת השורשים של הפולינום), אבל מרגע שבחרנו את \( \theta_{1} \) אנחנו כבר לא יכולים לבחור בשרירותיות את \( \theta_{2} \); הוא תלוי אלגברית ב-\( \theta_{1} \). לכן, אם אנחנו רוצים לסיים את הסיפור סופית, אנחנו צריכים למצוא את הקשר האלגברי בין שניהם. הקשר הזה הוא די פשוט: \( \theta_{1}\theta_{2}=-3p \). איך רואים את זה? ובכן, בואו נעשה עוד חשבון ארוך וכואב, בפעם האחרונה:
\( \theta_{1}\theta_{2}=\left(\alpha+\beta\omega+\gamma\omega^{2}\right)\left(\alpha+\gamma\omega+\beta\omega^{2}\right)= \)
\( \left(\alpha^{2}+\beta^{2}+\gamma^{2}\right)+\left(\alpha\beta+\alpha\gamma+\gamma\beta\right)\left(\omega+\omega^{2}\right)= \)
\( -2p-p=-3p \)
כאשר אני מתבסס על החישובים שכבר ביצעתי קודם. זה מסיים את הסיפור כמעט לגמרי, למעט העובדה שבינתיים הראיתי איך למצוא שורש אחד של המשוואה; איך מוצאים את כולם?
ובכן, זה החלק הפשוט בסיפור. בואו ניזכר שוב בשלושת האיברים שמככבים פה:
\( 0=\alpha+\beta+\gamma \)
\( \theta_{1}=\alpha+\beta\omega+\gamma\omega^{2} \)
\( \theta_{2}=\alpha+\beta\omega^{2}+\gamma\omega \)
הגעתי לנוסחה הקודמת על ידי כך שחיברתי את שלושת האיברים הללו. הפואנטה הייתה שהמקדם של \( \alpha \) היה זהה בשלושתם, ועבור שאר השורשים המקדמים היו שונים בין שלושתם. אפשר לנסות להשיג אפקט דומה עבור \( \beta,\gamma \) על ידי כפל של המשוואות ב-\( \omega \) ו-\( \omega^{2} \). למשל, כדי לבודד את \( \beta \) אפשר לכפול את \( \theta_{1} \) ב-\( \omega^{2} \) ואת \( \theta_{2} \) ב-\( \omega \) ולקבל:
עכשיו, בואו נכפול את \( \theta_{2} \) ואת \( 0 \) ב-\( \omega \) ורק אז נחבר:
\( 0=\alpha+\beta+\gamma \)
\( \omega^{2}\theta_{1}=\alpha\omega^{2}+\beta+\gamma\omega \)
\( \omega\theta_{2}=\alpha\omega+\beta+\gamma\omega^{2} \)
ועכשיו נקבל \( \beta=\frac{\omega^{2}\theta_{1}+\omega\theta_{2}}{3} \)
ובאותו אופן נקבל \( \gamma=\frac{\omega\theta_{1}+\omega^{2}\theta_{2}}{3} \)
וזה כבר מסיים לחלוטין את הפתרון, ונותן את הנוסחה שמוכרת בתור נוסחת קרדנו. הנה הניסוח ה”נקי”, שלא מצריך את ההבנה של מה שהלך פה:
בהינתן פולינום \( x^{3}+px+q \), נגדיר
\( D=-4p^{3}-27q^{2} \)
\( A=\sqrt[3]{-\frac{27}{2}q+\frac{3}{2}\sqrt{-3D}} \)
\( B=\sqrt[3]{-\frac{27}{2}q-\frac{3}{2}\sqrt{-3D}} \)
כאשר \( B \) נבחר באופן כזה ש-\( AB=-3p \), וכעת השורשים של הפולינום נתונים על ידי
\( x_{1}=\frac{A+B}{3} \)
\( x_{2}=\frac{\omega A+\omega^{2}B}{3} \)
\( x_{3}=\frac{\omega^{2}A+\omega B}{3} \)
ביחס לטירוף שעברנו כדי להגיע אל הנוסחה הזו, אני מרגיש שהתוצאה הסופית היא דווקא אלגנטית למדי.
נהניתם? התעניינתם? אם תרצו, אתם מוזמנים לתת טיפ: