שלוש בעיות הבניה בסרגל ומחוגה של היוונים (או: למה אי אפשר לרבע את המעגל)

אני רוצה לדבר בפוסט הזה על אחד מהסיפורים היפים במתמטיקה - שלוש בעיות בניה שראשיתן בימי יוון העתיקה, שבמשך 2,000 שנים בערך הביסו את כל המתמטיקאים שניסו להתמודד איתן, עד שבמאה ה-19 התברר שכלל אין להן פתרון, מה שגרר את הפיכת אחת מהן למטבע לשון - לא ניתן לרבע את המעגל. בפוסט הזה נסביר מה הבעיות היו (את זה כולם יכולים להבין) ואיך התפתחה המתמטיקה עד לשלב שבו תוכל להתמודד איתן בכבוד (גם את זה כולם יכולים להבין) וגם ניכנס לפרטים הטכניים של למה בדיוק הן לא פתירות (וזה יצריך היכרות כלשהי עם הנושאים שאני מכסה בסדרת הפוסטים הנוכחית בבלוג על אלגברה מופשטת, ובפרט את הפוסט האחרון שעסק בהרחבת שדות). אמנם, כבר יש לי סדרת פוסטים מלפני עשור שעסקה בדיוק בנושא הזה (הנה הפוסט הפותח שלה) אבל אז בגלל המחסור ברקע נתתי סדרת פוסטים מפוזרת למדי; הפעם אני מתכנן לתת פוסט יחיד, שיעמוד בזכות עצמו ככל הניתן (ובתקווה יהיה כתוב טוב יותר מהפוסטים ההם, כי אני מכיר את הנושא טוב יותר כיום).

חלק ראשון, ובו יסופר על תלס, אוקלידס, ומה שביניהם

אם תשאלו אותי “איפה התחילה המתמטיקה”, התשובה שלי תהיה כפולה: ראשית, היא התחילה מאז הפרהיסטוריה. עוד לפני שהיו לנו שפות, כבר ידענו לספור וכבר היו לנו כלים ששימשו למטרה זו. תרבויות רבות ושונות התעסקו בחישובים שונים ומתוחכמים כבר לפני 4,000 שנים, כשהמפורסמות שבהן הן התרבויות הבבלית והמצרית. עם זאת, למתמטיקה כפי שאנחנו מכירים אותה כיום - התחום הזה עם הוכחות וטענות ומשפטים ואקסיומות - יש נקודת התחלה מאוד ברורה וחד משמעית: יוון העתיקה. ספציפית, נקודת הזמן שבה המתמטיקה כפי שאנחנו מכירים אותה נולדה היא פרק הזמן שבין תאלס - הפילוסוף היווני הידוע הראשון, שחי בסביבות 600 לפני הספירה, ועד אוקלידס שחי בסביבות 300 לפני הספירה. ב-300 השנים הללו התפתחה תורה מתמטית מפוארת למדי שהיו לה תורמים רבים. אז למה לסיים את תקופת הפתיחה עם אוקלידס? בגלל הספר שאוקלידס חיבר, “יסודות”, שהיה סוג של סיכום של הידע המתמטי של התקופה - גאומטריה של המישור, גאומטריה של המרחב ותורת המספרים.

אנחנו יודעים מעט מאוד על אוקלידס וקרוב לודאי שלא המציא בעצמו את רוב התוכן של הספר; הגאונות שלו הייתה באופן ההצגה המסודר, בשיטה שהציגה הגדרות, ואז טענות שנבנות מתוך ההגדרות הללו, ואז הוכחות לטענות שנבנות גם מתוך הוכחות קודמות. זה ספר שמאפשר ללמוד הרבה מאוד מתמטיקה “מאפס”, ולהשתכנע שבכך שכל מה שכתוב שם נכון.

שלוש האקסיומות הראשונות ב”יסודות” מתארות את כללי המשחק הבסיסיים של הגאומטריה בספר. האקסיומות הראשונה והשניה אומרות שבהינתן שתי נקודות, אפשר למתוח קטע ישר בין שתיהן ולמשיך את הקטע הזה עד אין קץ בכל אחד משני הכיוונים שלו. האקסיומה השניה אומרת שבהינתן שתי נקודות, אפשר לצייר מעגל שמרכזו באחת מהנקודות והוא עובר דרך השניה (“מעגל” הוא אוסף של נקודות בעלות מרחק שווה מנקודה נתונה - “המרכז”; במילים אחרות, הוא לא כל ה”תוכן”, לדבר הזה קוראים עיגול). האקסיומות הללו לא הגיעו משום מקום - הן מתארות את “כלי המשחק” שאיתם היוונים עשו גאומטריה - סרגל ומחוגה. את שניהם אנחנו מכירים גם כיום:

סרגלים מאפשרים להעביר קווים ישרים; מחוגות מאפשרות להעביר מעגלים. הבדל אחד בין הסרגלים “שלנו” והסרגל של אוקלידס הוא שבסרגלים “שלנו” יש גם שנתות שמאפשרות למדוד אורכים; אצל אוקלידס אין הנחה שקיים דבר כזה וזה לא חלק מהמשחק. באנגלית יש הבחנה בין שני סוגי הסרגלים: בלי שנתות זה Straightedge ועם שנתות זה Ruler.

די מדהים מה אפשר לעשות עם הכלים הפשוטים הללו עם קצת תחכום. למשל, הדבר הראשון שאוקלידס עושה ב”יסודות” הוא להראות איך בהינתן קטע ישר בונים משולש שווה צלעות שאורך הצלע שלו שווה לאורך הקטע; זה תעלול שמשתמש גם במחוגה ואפשר לראות פה. הנה פוסט שתיאר משחק שמאפשר להתנסות בזה עצמאית. חשוב לי להדגיש את הנקודה הזו - “כללי המשחק” המאוד פשוטים הללו של אוקלידס הובילו למתמטיקה מאוד לא טריוויאלית לזמנה. לכן באופן טבעי נשאלת השאלה מה אי אפשר לעשות איתם. וכאן נכנסות לתמונה שלוש בעיות גאומטריות שנולדו אי שם בתקופה העליזה הזו של בין 600 ל-300 לפני הספירה, ואף אחד לא הצליח לפתור גם לאחר מכן. שלוש הבעיות הללו הן:

  1. הכפלת הקוביה.
  2. חלוקת זווית לשלוש.
  3. ריבוע המעגל.

בכל הבעיות הללו נתון לנו משהו שאנחנו רוצים לבנות מתוכו דבר מה חדש. במקרה הראשון, נתונה לנו קוביה עם נפח \( S \) ואנחנו רוצים לבנות קוביה חדשה עם נפח \( 2S \). במקרה השני נתונה לנו זווית \( \alpha \) (כלומר, שני קטעים שמתחברים זה לזה בנקודה מסויימת והזווית נוצרת בנקודת החיבור) ואנחנו רוצים לבנות זווית חדשה \( \frac{\alpha}{3} \), ובמקרה השלישי נתון לנו עיגול עם שטח \( S \) ואנחנו רוצים לבנות ריבוע עם שטח \( S \) (לפעמים קוראים לבעיה הזו “תרבוע המעגל” או “ריבוע העיגול” וכדומה; אני לא בטוח שזה מעביר את המשמעות בצורה יותר טובה).

בגלל ש”ריבוע המעגל” השתרש בתרבות שלנו בתור מילה נרדפת למשהו בלתי אפשרי, כבר נתקלתי בכל מני מקומות שבהם חשבו שמדובר על אתגר שקצת יותר מובן מאליו שהוא בלתי אפשרי. למשל, לקחת מעגל ולשבור אותו לכמה חתיכות ולהרכיב מחדש כדי לקבל ריבוע, מה שאי אפשר לעשות כי מעגל הוא דבר עגול, וכדומה. אבל שימו לב שהבעיה המקורית לא מבקשת לעשות שום דבר עם המעגל עצמו; רק לבנות ריבוע חדש שיהיה בעל אותו שטח. אין סיבה עקרונית לחשוב שזה יהיה בלתי אפשרי. גם שתי הבעיות האחרות נראות סבירות למדי. לחלק זווית לשתי זוויות שוות, כלומר לבנות את \( \frac{\alpha}{2} \) מתוך \( \alpha \) - את זה אפשר לעשות עם סרגל ומחוגה. למעשה, אפשר לבנות את \( \frac{\alpha}{3} \) עם סרגל ומחוגה בתנאי שיש שנתות על הסרגל (מה שקראתי לו Ruler). ובאשר להכפלת הקוביה? זה נראה הכי פשוט, עד כדי כך שבאחת מהגרסאות היווניות למקור הבעיה מסופר על משורר יווני שסיפר על קורותיו של המלך מינוס שבנה חדר קבורה ואז החליט להכפיל את נפחו פי 2. המשורר מספר שכדי לעשות זאת מינוס הכפיל פי 2 את אורך הצלע של החדר; וזו טעות של המשורר, כי אם יש לנו קוביה עם אורך צלע \( a \) אז הנפח שלה הוא \( a^{3} \), אבל הנפח של קוביה עם אורך צלע כפול, \( 2a \), הוא \( 8a^{3} \) - פי 8.

רגע, מה זאת אומרת, אחת הגרסאות היווניות למקור הבעיה? האם אין לבעיות הללו מקור ספציפי ומוגדר? ובכן, לא. כולן היו כנראה מוכרות כבר לתרבויות מוקדמות יותר מהיוונים, וכל אחת מופיעה אצל היוונים בכמה מקומות שונים; אפשר לכתוב פוסט שלם רק על האספקט הזה של ההיסטוריה של הבעיות. נוותר על זה להפעם. השורה התחתונה היא שימי יוון העתיקה חלפו והבעיות עדיין נותרו בלי פתרון שמתבסס רק על הכלים האוקלידיים.

“התקעויות” כאלו הן נפוצות במתמטיקה, ומצביעות בדרך כלל על הצורך בפיתוח מתמטיקה חדשה לגמרי. כזו הולכת לצוץ רק אלף ומשהו שנים אחרי היוונים.

חלק שני, שבו אנחנו עוברים מהגאומטריה לאלגברה

בתהליך הדרגתי שראשיתו בימי הביניים והמשכו ברנסנס קרה פלא אדיר למתמטיקה - האלגברה כפי שאנחנו מכירים אותה הומצאה. לצורך העניין “אלגברה” אצלנו היא היכולת המופלאה לתאר מספרים ותכונות שלהם וקשרים ביניהם באמצעות משוואות סימבוליות במקום הסברים מילוליים. בואו ניקח דוגמא פשוטה: “יסודות” של אוקלידס, ספר 9, טענה 8:

If as many numbers as we please beginning from a unit are in continued proportion, then the third from the unit is square as are also those which successively leave out one, the fourth is cubic as are also all those which leave out two, and the seventh is at once cubic and square are also those which leave out five.

מה זה? מה הולך כאן? איך אפשר לקרוא את זה? הטענה פה היא פשוטה: נסתכל בסדרה ההנדסית \( 1,a,a^{2},a^{3},\dots \). אז האיברים \( a^{2},a^{4},\dots \) הם ריבועים, האיברים \( a^{3},a^{6},\dots \) הם חזקות שלישיות וכן הלאה. עכשיו, משאנחנו חמושים בתיאור ה”אלגברי” של \( 1,a,a^{2},a^{3},\dots \) אפשר לקרוא שוב את התיאור של אוקלידס ולהבין אותו, אבל המאמץ שנדרש מאיתנו להבין את הייצוג הסימבולי \( 1,a,a^{2},a^{3},\dots \) הוא קטן בהרבה. וזו דוגמא פשוטה; חשבו עכשיו על כך שכל דבר שאתם עושים באלגברה הייתם נאלצים לייצג ולקרוא בצורה מילולית כמו של אוקלידס. ובכן, ככה הייתה כל המתמטיקה פעם. גם בימי הביניים. אם תפתחו ספר של פיבונאצ’י או של אל-חוואריזמי, זה מה שתגלו שם.

אבל הקסם של האלגברה הוא לא רק בייצוג סימבולי נוח יותר של איברים, אלא גם ביכולת שלנו לחשוב באופן אבסטרקטי על עולמות מתמטיים שמוגדרים בעזרת הסימבולים הללו. מה עושים בתורת השדות? מדברים באופן כללי על סיטואציות כמו “קחו פולינום \( p\left(x\right) \) מעל שדה \( F \) והוסיפו שורש \( a \) של \( p \) ל-\( F \) ותראו מה השדה הקטן ביותר שמתקבל” וכן הלאה. הדברים הללו טבעיים לנו היום, אבל לא היו קיימים בעבר; זו המשוכה המחשבתית שהמתמטיקה הייתה צריכה להתגבר עליה כדי להיות מסוגלת להתמודד עם בעיות הסרגל והמחוגה.

הפסגה של המעבר הזה מהגאומטריה לאלגברה הייתה התחום שנקרא גאומטריה אנליטית. הקרדיט על המצאת התחום ניתן על פי רוב לפילוסוף רנה דקארט; דקארט כל כך מפורסם בתור פילוסוף עד כדי כך שתאפיל על תחומים אחרים שעסק בהם, ואנשים ממש מופתעים לגלות שהוא גם היה דמות חשובה בעולם המתמטיקה. כמובן, הסיפור האמיתי של “מי המציא את הגאומטריה האנליטית” מסובך יותר והתבסס על תרומה של אנשים רבים ושונים, אבל על זה עדיף לדבר בפוסט ייעודי.

מה היה כל כך גאוני בגאומטריה אנליטית? שזה היה תחום שהמיר לחלוטין את הדיון על אובייקטים גאומטריים כמו ישר או מעגל בדיון על פתרונות של מערכות של משוואות, כלומר זו המרה מוחלטת של הגאומטריה לאלגברה. בגאומטריה האנליטית “שדה המשחק” הוא הקבוצה \( \mathbb{R}\times\mathbb{R} \) של זוגות של מספרים ממשיים שמייצגים נקודות במישור - \( \left(a,b\right) \) היא הנקודה שקואורדינטת ה-\( x \) שלה היא \( a \) וקואורדינטת ה-\( y \) שלה היא \( b \).

המושגים הללו נראים לנו כל כך טבעיים היום, שצריך להזכיר שוב ושוב שפעם הם לא היו טבעיים בכלל. היה צריך להמציא אותם. היום אנחנו רואים אותם בבית הספר, ובגרפים שונים ומשונים, ובכל מקום. ברוב ההיסטוריה האנושית הם לא היו קיימים. זה מדהים במיוחד, בהתחשב בעובדה שקואורדינטות דו-ממדיות היו קיימות עוד מהעת העתיקה במפות. מפות חייבות קווי אורך ורוחב, והאנושות הכירה את המושגים הללו מאז מי יודע מתי; אבל הקישור בין המושגים הללו ובין העולם המתמטי לא היה קיים.

הגאומטריה האנליטית היא הצעד המרכזי בדרך להוכחת אי-הפתירות של בעיות הבניה של היוונים, כי היא מאפשרת לנו להמיר את הדיון הגאומטרי ואת כלי המשחק הגאומטריים במושגים אלגבריים מקבילים. בואו נבין איך זה עובד. בגאומטריה אנליטית, קו ישר שמוגדר באמצעות הפרמטרים \( a,b,c\in\mathbb{R} \) הוא אוסף כל הנקודות \( \left(x,y\right) \) שפותרות את המשוואה

\( ax+by+c=0 \)

תוך שאנחנו מניחים ש-\( a\ne0 \) או \( b\ne0 \).

למשל, עבור בחירת הפרמטרים \( a=1,b=-1,c=0 \) נקבל את הקו הישר שמורכב מכל הנקודות \( \left(x,y\right) \) עבורן \( x-y+0=0 \), כלומר \( x=y \); זה הקו שעובר דרך ראשית הצירים ויוצר זווית של 45 מעלות עם ציר \( x \). או למשל, עבור \( a=1,b=0,c=3 \) נקבל את הקו הישר שמורכב מכל הנקודות \( \left(x,y\right) \) עבורן \( x=3 \) - זה קו ישר שמאונך לציר \( y \). בחרתי את הדוגמא הזו כדי להסביר למה המשוואה שלי היא \( ax+by+c=0 \) ולא זו שנפוצה יותר בבית הספר, \( y=ax+b \); המשוואה עם שלושת הפרמטרים היא פשוט יותר כללית ומסוגלת לתאר יותר מקרים.

מה שנחמד בסיפור הזה הוא שעכשיו, אם יש לנו שני ישרים, אנחנו מסוגלים למצוא את נקודת החיתוך שלהם על ידי פתרון משוואות אלגבריות. בואו נראה את זה במפורש כי זה יהיה ממש חשוב, אבל אעשה לעצמי חיים קלים ואסתכל רק על המקרה שבו הישרים לא מאונכים לציר \( y \), כלומר אפשר להציג את שניהם בתור

\( y=ax+b \)

\( y=cx+d \)

זו מערכת של שתי משוואות בשני נעלמים, והמשוואות הן לינאריות, כלומר המשתנים \( x,y \) מופיעים שם בלי חזקות (אין \( x^{2} \) וכאלה). כדי לפתור אותה, פשוט מחסרים את אחת המשוואות מהשניה ומקבלים:

\( 0=\left(a-c\right)x+\left(b-d\right) \)

אם \( a\ne c \) אפשר להעביר אגף, לחלק ב-\( a-c \) ולקבל:

\( x=\frac{d-b}{a-c} \)

ואחרי הצבה במשוואה \( y=ax+b \) מקבלים גם

\( y=a\left(\frac{d-b}{a-c}\right)+b=\frac{ad-bc}{a-c} \)

כלומר, קיבלנו ש-\( \left(\frac{d-b}{a-c},\frac{ad-bc}{a-c}\right) \) היא נקודת החיתוך של הישרים. אם \( a=c \) אז הישרים מקבילים ואז או שהם לא נחתכים בכלל (אם \( d\ne b \)) או שהם שווים לגמרי ולכן אין להם נקודת חיתוך ישרה אלא אינסוף “נקודות חיתוך”. אם יש לנו ישרים שלפחות אחד מהם מאונך לציר \( y \) אז אפשר למצוא להם נקודת חיתוך בדרך דומה ולקבל תוצאה דומה; באלגברה לינארית מתעסקים עם פתרון מערכות כלליות של משוואות לינאריות ולא אכנס לזה כרגע.

השורה התחתונה המעניינת של הסיפור היא מה שקיבלנו פה, נקודת החיתוך \( \left(\frac{d-b}{a-c},\frac{ad-bc}{a-c}\right) \). זו נקודה שהקואורדינטות שלה נבנות מתוך הפרמטרים \( a,b,c,d \) תוך שימוש בארבע פעולות החשבון הרגילות: חיבור, חיסור, כפל וחילוק. ואיך מתקבלים הפרמטרים עצמם? ובכן, אם נתונות לנו שתי נקודות \( \left(x_{1},y_{1}\right) \) ו-\( \left(x_{2},y_{2}\right) \) ואנחנו מותחים ביניהן קטע, אז אם \( x_{1}\ne x_{2} \) אפשר להראות שהמשוואה של הקטע הזה היא \( y=ax+b \) עם \( a=\frac{y_{1}-y_{2}}{x_{1}-x_{2}} \) ו-\( b=y_{1}-x_{1}\left(\frac{y_{1}-y_{2}}{x_{1}-x_{2}}\right) \). במילים אחרות, הפרמטרים של הישרים שלנו מתקבלים מהנקודות שמשמשות לבניה שלהם על ידי ביצוע פעולות החשבון הרגילות.

עכשיו בואו נכניס גם מעגלים למשחק. בגאומטריה אנליטית מעגל מתואר על ידי המשוואה \( \left(x-a\right)^{2}+\left(y-b\right)^{2}=R^{2} \). כאן \( \left(a,b\right) \) היא נקודת מרכז המעגל ואילו \( R \) הוא הרדיוס; \( a,b,R \) אלו שלושת הפרמטרים של המעגל (אתם כמובן יכולים לתהות למה בעצם המשוואה הזו עובדת; ובכן, משפט פיתגורס, אבל לא אכנס לזה כרגע). המשוואה הזו היא כבר משוואה ממעלה שניה - יש בה \( x^{2} \) ויש בה \( y^{2} \). האופן שבו אנחנו פותרים משוואות ממעלה שניה הוא בעזרת נוסחת השורשים: אם \( ax^{2}+bx+c=0 \) היא משוואה בנעלם בודד ממעלה שניה, אז הפתרונות שלה הם \( x_{1,2}=\frac{-b\pm\sqrt{b^{2}-4ac}}{2a} \) (זוהי ככל הנראה הנוסחה היחידה במתמטיקה שאני זוכר בעל פה). אם אתם תוהים איך הגיעו לנוסחה הזו, יש לי פוסט על זה; הפתרון היה ידוע עוד לבבלים, הרבה לפני היוונים, אבל נוסחת השורשים עצמה היא משהו שלא התקיים לפני היות האלגברה בתקופת הרנסנס (אצל אל-חוואריזמי שחי כמה מאות שנים לפני הרנסנס יש תיאור מפורט של כל האופנים לפתור את המשוואה הזו, אבל אין נוסחה). מה שרלוונטי לענייננו במשוואה הזו הוא שהיא מערבת את ארבע פעולות החשבון כמקודם, אבל בנוסף לכך גם מערבת הוצאת שורש ריבועי.

אם לסכם את הדיון שהלך פה, המעבר לדיבור על גאומטריה אנליטית משנה את המשחק שלנו בצורה הבאה: קודם המשחק היה גאומטרי, והתבסס על הכלים של סרגל ומחוגה; כעת אפשר לחשוב עליו בתור משחק שבו מתחילים עם הנקודות \( \left(0,0\right) \) ו-\( \left(0,1\right) \) במישור ובונים מהן עוד ועוד נקודות על ידי בניית מעגלים וישרים על הנקודות הקיימות, ואז חיתוך שלהם - כלומר, פתרון משוואות מסויימות. אפשר לומר שאנחנו מתחילים עם אוסף של מספרים שכולל רק את 0 ואת 1 ואז מייצרים מהם מספרים חדשים בצורות שונות ומשונות שכולן מתורגמות בסופו של דבר לביצוע סדרה של פעולות חשבון והוצאות שורש על המספרים הללו.

בפוסט המקורי שלי על בניות בסרגל ומחוגה הסברתי איך אפשר בעזרת הכלים הללו לבצע בדיוק את פעולות החשבון - כלומר, אם כבר בניתי איכשהו את \( a,b \) (בתור נקודות על ציר \( x \) שהמרחק שלהן מראשית הצירים הוא \( a,b \) בהתאמה) אז אפשר לבנות את \( a+b,a-b,ab,\frac{a}{b} \) וגם את \( \sqrt{a} \) עבור \( a \) אי שלילי. זה אומר שאוסף המספרים שאפשר לקבל בעזרת בניות בסרגל ומחוגה הוא סגור לארבע פעולות החשבון ובנוסף לכך להוצאות שורש. בפרט, “סגירות לארבע פעולות החשבון” היא התכונה שמגדיר שדה. זה מעביר אותנו אל הנושא שבו עסקנו בפוסטים הקודמים - תורת השדות.

חלק שלישי, שבו תורת השדות כמעט ומסיימת את הסיפור

כדי שיהיה ברור לגמרי על מה אנחנו מדברים, נפתח בהגדרה: קבוצת המספרים הניתנים לבניה היא הקבוצה הקטנה ביותר שכוללת את 1 וסגורה לפעולות החיבור, החיסור, הכפל, החילוק והוצאת שורש ריבועי. מכך שהקבוצה סגורה לארבע פעולות החשבון נובע שהיא שדה; השדה הקטן ביותר שמכיל את 1 הוא \( \mathbb{Q} \), כך שאפשר לתאר את קבוצת המספרים הניתנים לבניה בתור שדה הרחבה של \( \mathbb{Q} \) (שדה הרחבה שמוכל ב-\( \mathbb{C} \), כי \( \mathbb{C} \) היא הרחבה של \( \mathbb{Q} \) שסגורה גם להוצאות שורש). איזו הרחבה זו? סופית? פשוטה? אלגברית? לא ניכנס לזה בכלל כי אין בכך צורך. תחת זאת, בואו נתמקד במספר אחד שניתן לבניה בכל עת.

נניח ש-\( \alpha\in\mathbb{C} \) הוא מספר הניתן לבניה. אפשר לרשום את סדרת המספרים שנבנתה החל מ-1 ועד אליו. זו תהיה סדרה סופית של מספרים (כי מגיעים ל-\( \alpha \) במספר סופי של צעדי בניה). בואו נסמן במפורש את אברי הסדרה הזו: \( \alpha_{1},\alpha_{2},\dots,\alpha_{n} \) כך ש-\( \alpha=\alpha_{n} \). נגדיר עכשיו סדרה מתאימה של שדות הרחבה: \( F_{0}=\mathbb{Q} \) ואילו \( F_{k}=F_{k-1}\left(\alpha_{k}\right) \). אנחנו יודעים שכל \( \alpha_{k} \) התקבל בצורה כלשהי מאברי \( F_{k-1} \) בעזרת פעולות השדה ואולי גם הוצאת שורש. זה אומר שאפשר למצוא פולינום ריבועי שמאפס את \( \alpha_{k} \) מעל \( F_{k-1} \), מה שמראה שמתקיים \( \left[F_{k}:F_{k-1}\right]=1 \) או \( \left[F_{k}:F_{k-1}\right]=2 \), ואין אפשרויות אחרות. אפשר לסמן את זה \( \left[F_{k}:F_{k-1}\right]=2^{a_{k}} \) כאשר \( a_{k}\in\left\{ 0,1\right\} \). עכשיו אנחנו מקבלים:

\( \left[F_{n}:\mathbb{Q}\right]=\left[F_{n}:F_{n-1}\right]\cdots\left[F_{1}:F_{0}\right]=2^{a_{n}}\cdot2^{a_{n-1}}\cdots2^{a_{1}}=2^{\sum a_{i}} \)

כלומר, הדרגה של \( F_{n} \) מעל \( \mathbb{Q} \) היא חזקה של 2. זה מלמד אותנו משהו על הדרגה של \( \alpha \) לבדו: יש לנו את מגדל ההרחבות \( \mathbb{Q}\subseteq\mathbb{Q}\left(\alpha\right)\subseteq F_{n} \), ולכן \( \left[\mathbb{Q}\left(\alpha\right):\mathbb{Q}\right] \) מחלקת את \( \left[F_{n}:\mathbb{Q}\right] \) ולכן היא חייבת להיות בעצמה חזקה של 2.

עכשיו אפשר לטפל בכל שלוש הבעיות של היוונים כמעט בבת אחת.

נתחיל עם הכפלת הקוביה. אם יש לנו קוביה בעלת נפח 1, כדי לקבל קוביה עם נפח כפול, 2, נצטרך לבנות את אורך הצלע \( \alpha=\sqrt[3]{2} \). הפולינום המינימלי של \( \alpha \) מעל \( \mathbb{Q} \) הוא \( p\left(x\right)=x^{3}-2 \) - הוא אי פריק על פי אייזנשטיין, למשל. מכאן ש-\( \left[\mathbb{Q}\left(\alpha\right):\mathbb{Q}\right]=3 \) אבל \( 3 \) אינה חזקה של 2 ולכן זה בלתי אפשרי. הופס! נפתרה בעיה בת אלפי שנים. זה יעבוד לכל קוביה, לא רק כזו עם נפח 1; אם יש לנו קוביה שאורך הצלע שלה הוא מספר ניתן לבניה \( \beta \), אז כדי לבנות קוביה עם נפח כפול נצטרך לבנות את אורך הצלע \( \sqrt[3]{2}\beta \), והפולינום המינימלי של היצור הזה מעל השדה שמכיל את \( \beta \) הוא \( p\left(x\right)=x^{3}-2\beta^{3} \), כך ששוב, אורך הצלע יחיה בהרחבה ממימד 3 מעל הרחבה ממימד שהוא חזקה של 2 של \( \mathbb{Q} \) - ולכן המימד של ההרחבה כולה מעל \( \mathbb{Q} \) לא יהיה חזקה של 2.

עבור חלוקת זווית לשלושה חלקים הסיטואציה טיפה פחות פשוטה, כי בוודאי שלפעמים כן אפשר לחלק זווית לשלושה חלקים. למשל, עם סרגל ומחוגה אפשר לבנות משולש עם זוויות \( 90^{\circ},60^{\circ},30^{\circ} \) כך שאת הזווית \( 90^{\circ} \) אפשר לחלק לשלושה חלקים, כלומר לבנות את \( 30^{\circ} \). מצד שני, אנחנו רואים ש-\( 60^{\circ} \) היא זווית שניתנת לבניה; בואו נשתכנע ש-\( 20^{\circ} \) אינה ניתנת לבניה, כלומר \( 60^{\circ} \) היא זווית ניתנת לבניה שלא ניתן לחלק.

מה זה אומר “לבנות זווית”? הרי אנחנו בונים מספרים, לא זוויות. ובכן, לבנות זווית \( \alpha \) שקול לבניה של משולש ישר זווית שבו אורך היתר הוא 1 ואורך אחת מהצלעות היא \( \cos\alpha \), ואז הזווית הלא ישרה שנוגעת בצלע הזו תהיה \( \alpha \). עכשיו בואו ניזכר בקצת טריגונומטריה: הנוסחה לקוסינוס של זווית משולשת היא:

\( \cos3x=4\cos^{3}x-3\cos x \)

בעצם, שיקרתי. אין במה “להיזכר” פה, אני לא זוכר שלמדתי את זה אי פעם - אבל זה לא כזה קשה להוכיח את הנוסחה הזו. איך זה מועיל לנו? ובכן, אנחנו יודעים ש-\( \cos60^{\circ}=\frac{1}{2} \), ולכן אם אסמן \( \alpha=\cos20^{\circ} \) בעצם קיבלנו פה את המשוואה

\( 4\alpha^{3}-3\alpha-\frac{1}{2}=0 \)

אפשר לפשט את זה עוד טיפה: אם כופלים ב-2 מקבלים \( 8\alpha^{3}-6\alpha-1=0 \), ומכיוון שאני רוצה לקבל פולינום מתוקן ואני זוכר ש-\( 8=2^{3} \) אני מנצל את ההזדמנות, מגדיר \( \beta=2\alpha \) ומקבל את המשוואה \( \beta^{3}-3\beta-1=0 \). אם זווית של \( 20^{\circ} \) ניתנת לבניה, אז גם \( \beta \) ניתן לבניה. כעת, ראינו ש-\( \beta \) מאפסת את הפולינום \( x^{3}-3x-1 \); זה פולינום שהזכרתי גם בפוסט הקודם; אמרתי שם שהוא אי פריק וניתן לראות זאת עם משפט הניחוש האינטליגנטי. זה מסיים את העניין - מכיוון שזה פולינום אי פריק, הוא הפולינום המינימלי של \( \beta \), ולכן \( \left[\mathbb{Q}\left(\beta\right):\mathbb{Q}\right]=3 \) ולכן \( \beta \) לא ניתן לבניה בדיוק כמו קודם.

מה שמשאיר רק את בעיית ריבוע המעגל. בהינתן מעגל עם רדיוס \( R \) כך ש-\( R \) ניתן לבניה, השטח שלו הוא \( \pi R^{2} \). השטח של ריבוע עם צלע \( \alpha \) הוא \( \alpha^{2} \), כך שכדי לבנות ריבוע ששטחו שווה לשטח המעגל צריך לבנות את \( \alpha=\sqrt{\pi}R \). כמקודם, נשאלת השאלה מהו \( \left[\mathbb{Q}\left(\alpha\right):\mathbb{Q}\right] \). התשובה היא שבמקרה זה המימד הוא אינסופי כי \( \alpha \) הוא בכלל לא אלגברי מעל \( \mathbb{Q} \). אם \( \alpha \) היה אלגברי, אז גם \( \pi=\frac{\alpha^{2}}{R^{2}} \) היה אלגברי (ראינו בפוסט הקודם שמספרים אלגבריים סגורים לכפל וחילוק), אבל “ידוע” ש-\( \pi \) אינו אלגברי. רגע, מי יודע את זה?

מה שמעביר אותנו לדיון על הקרדיטים. הראשון שהוכיח שלא ניתן להכפיל את הקוביה או לחלק זווית לשלושה היה המתמטיקאי הצרפתי פייר ונצל, ב-1837 (ונצל הוכיח עוד כמה דברים מרהיבים שנראה בהמשך), אבל הוא לא הוכיח שלא ניתן לרבע את המעגל למרות שזו בדיוק אותה טכניקה, מהטעם הפשוט שבתקופתו אף אחד לא ידע עדיין האם \( \pi \) אלגברי או לא. רק ב-1882 הוכיח פרדיננד לינדמן משפט מתוחכם למדי שאיפשר להראות עבור מחלקה גדולה של מספרים, כולל \( \pi \), שהם לא אלגבריים מעל \( \mathbb{Q} \); רק אז הקיץ הקץ על בעיית ריבוע העיגול. במובן זה הפוסט הזה אינו שלם; אני לא יכול להציג בו את המשפט של לינדמן, רק לספר על קיומו.

בכך בא לסופו סיפורן בן אלפי השנים של הבעיות הגאומטריות הללו (למעט, כמובן, העובדה שאנשים עדיין טוענים שהם מסוגלים לפתור אותן, על פי רוב בלי להבין בכלל מה “כללי המשחק”) אבל הסיפור של תורת השדות? הוא עדיין בקושי התחיל.


נהניתם? התעניינתם? אם תרצו, אתם מוזמנים לתת טיפ:

Buy Me a Coffee at ko-fi.com