אז מה זה בעצם המספרים הממשיים? (חלק ב': השדה הסדור השלם)

מבוא

בפוסט הקודם התחלתי לדבר על המספרים הממשיים ומה הם בכלל. הראיתי את ההגדרה הנפוצה, שרובנו מכירים עוד מבית הספר, של מספר ממשי בתור משהו שיש לו פיתוח עשרוני, נאמר \( 3.14159\ldots \). ההגדרה הזו בעצם מגדירה את המספרים הממשיים על ידי כך שהיא מדברת על האופן שבו מספר ממשי קונקרטי בנוי; אין כאן ממש התייחסות לקבוצה של כל המספרים הממשיים.

חוץ מזה, אמרתי שההגדרה בעייתית כי את רוב המספרים הממשיים אי אפשר ממש לתאר בעולם האמיתי בעזרת פיתוח עשרוני כי לרובם המכריע אין פיתוח עשרוני שיש לנו דרך לחשב את הספרות שלו, או אפילו לתת להם הגדרה קונקרטית כלשהי - הממשיים היא קבוצה “גדולה מדי” בשביל זה. זה נותן מוטיבציה כלשהי לחיפוש אחרי הגדרה שמדברת לא על הממשי הקונקרטי אלא על המכלול שלהם, כל הקבוצה, מה בעצם הקטע שלה.

ועוד משהו בעייתי בהגדרה הזו היא שלא אמרתי בעצם מה אפשר לעשות עם המספרים הללו. מספרים הם משהו שקיים כדי שנוכל לעשות איתו דברים, ובפרט שנוכל לעשות דברים עם שני מספרים: לחבר, לחסר, להכפיל, לחלק, להשוות… אפשר לתת את ההגדרות הללו גם כשמגדירים ממשיים דרך פיתוח עשרוני, אבל זה מאלץ אותנו לנטוש את האינטואיציה הבית ספרית, ואני לא אעשה את זה כרגע.

במקום להמשיך בכיוון הזה, אני ארצה בפוסט הזה להציג את ההגדרה שאני אישית אוהב: המספרים הממשיים הם השדה הסדור השלם. כרגע אין סיבה שתבינו מה אף אחת מהמילים בהגדרה הזו אומרות, מתמטית; עד סוף הפוסט אני מקווה שנבין את כולן. אבל לפני שנתחיל צריך לתת הבהרה קטנה מה בעצם הולך בהגדרה הזו.

במתמטיקה, יש שתי דרכים מקובלות להגדיר אובייקט. דרך אחת היא לתאר במדויק מהו, כמו שעשיתי במקרה של הפיתוח העשרוני (“סדרה אינסופית של ספרות שכוללת נקודה ויכולה לכלול בהתחלה סימן מינוס”). דרך אחרת היא לתאר את האובייקט אקסיומטית. בצורה הזו לא אומרים במפורש מה האובייקט, אלא נותנים רשימה של תכונות שאנחנו מצפים שהאובייקט יקיים. התכונות הללו נקראות אקסיומות, אבל זה שונה מהשימוש במילה “אקסיומה” שהיוונים הקדמונים עשו או שאנחנו עושים בחיי היום יום. “אקסיומה” במובן היומיומי היא “משהו שאנחנו מניחים שהוא נכון בלי הוכחה”. במובן המתמטי שלנו, אקסיומה היא תכונה שיכולה להתקיים עבור אובייקטים מסויימים ולא להתקיים עבור אחרים - אנחנו נראה לזה הרבה דוגמאות עוד מעט.

מרגע שיש לנו אוסף של אקסיומות, אנחנו יכולים לדבר על האובייקטים שמקיימים את כל האקסיומות. ייתכן שיש המון כאלו, ייתכן שיש רק אובייקט אחד, וייתכן שאין בכלל. במקרה של הממשיים אפשר להראות שיש לכל היותר אובייקט אחד כזה, אבל זה בפני עצמו לא אומר שהוא קיים; בנוסף להגדרה האקסיומטית נצטרך גם לתת בניה קונקרטית של הממשיים. אי אפשר להתחמק מזה. אז למה אני אוהב את ההגדרה האקסיומטית? כי היא לטעמי מה שהכי עוזר לנו להבין מה זה בעצם הממשיים, ומה התכונות שלהם. בואו נתחיל ואני מקווה שזה יתבהר בהמשך.

שדה

חזרה לבית הספר היסודי

“שדה” זה השם המפוצץ שהמתמטיקה העניקה לקבוצה שמקיימת את מה שלמדנו בבית הספר היסודי שמספרים מקיימים: יש פעולות חיבור, חיסור, כפל וחילוק ויש את חוק הקיבוץ, חוק החילוף וחוק הפילוג. את כללי החשבון אני מניח שאנחנו זוכרים (אבל יש לי סדרת פוסטים עליהם אם לא) אבל בואו נכתוב את החוקים במפורש:

  • \( \left(a+b\right)+c=a+\left(b+c\right) \) (חוק הקיבוץ לחיבור)
  • \( \left(a\cdot b\right)\cdot c=a\cdot\left(b\cdot c\right) \) (חוק הקיבוץ לכפל)
  • \( a+b=b+a \) (חוק החילוף לחיבור)
  • \( a\cdot b=b\cdot a \) (חוק החילוף לכפל)
  • \( a\cdot\left(b+c\right)=a\cdot b+a\cdot c \) (חוק הפילוג).

כל החוקים הללו מתקיימים יפה מאוד כבר על ידי קבוצת המספרים הטבעיים, שמסומנת ב-\( \mathbb{N} \). אבל \( \mathbb{N} \) לא נקראת “שדה” כי יש דברים שחסרים. ספציפית, חיסור. החיסור חסר. אין ב-\( \mathbb{N} \) חיסור. או, ליתר דיוק, בוודאי שיש ב-\( \mathbb{N} \) חיסור, אבל הוא לא מוגדר עד הסוף כי אמנם \( 5-2=3 \) אבל לא ממש ברור מה זה \( 2-5 \) כל עוד “העולם” שלנו כולל רק את המספרים הטבעיים. אז אנחנו מרחיבים את \( \mathbb{N} \) ומוסיפים פנימה את המספרים השליליים ואת 0 (או ש-0 כבר היה ב-\( \mathbb{N} \), תלוי את מי שואלים) ומקבלים את הקבוצה \( \mathbb{Z} \). מה שנחמד ב-\( \mathbb{Z} \) הוא שהיא מקיימת את כל החוקים שכבר ראינו - כלומר, ההרחבה לא “עלתה” לנו באובדן של מבנה קיים, אבל אפשר לנסח בצורה נחמדה עוד חוקים בעזרתה:

  • קיים איבר שמסומן ב-0 כך ש-\( a+0=a \) לכל \( a \)
  • לכל \( a \) קיים איבר שמסומן ב-\( -a \) ונקרא הנגדי של \( a \) כך ש-\( a+\left(-a\right)=0 \)

בעזרת המושג הזה של “הנגדי” אפשר להגדיר חיסור בעזרת פעולת החיבור שכבר מוכרת לנו: \( a-b \) זה בעצם \( a+\left(-b\right) \), כלומר מחברים ל-\( a \) את הנגדי של \( b \). ואם אני כבר בקטע של שמות, אז ל-0 קוראים אדיש חיבורי בהקשר הזה, כי הוא לא משפיע על מי שמתחבר איתו.

מה שנחמד בשלמים ומה שלא

אני הולך להגדיר מושג שנקרא שדה אבל שווה לעצור לרגע ולהעיר שהאקסיומות שכבר ראינו משמשות גם להגדרת מבנים אלגבריים אחרים ש-\( \mathbb{Z} \) הוא דוגמא מרכזית אליהם. למשל, המבנה חבורה שדורש רק קיום של פעולה אחת - חיבור - ורק את חוק הקיבוץ, קיום 0 וקיום נגדי. או המבנה חוג שדורש קיום של חיבור וכפל ואת חוקי הקיבוץ וחוק הפילוג ואת קיום 0 וקיום נגדי ואת חוק החילוף לחיבור אבל לא את חוק החילוף לכפל. אני לא אזדקק למושגים הללו בהמשך אבל שווה היה לפחות להזכיר אותם.

עכשיו, האם השלמים \( \mathbb{Z} \) הם האובייקט היחיד שמקיים את כל התכונות שראינו עד כה או שיש אחרים? התשובה היא שבהחלט יש אחרים, למשל פולינומים. הנה למשל פעולת הכפל של פולינומים: \( \left(x+3\right)\left(x+5\right)=x^{2}+8x+15 \). קל לראות שכל התכונות שתיארתי עד כה מתקיימות גם עבור פולינומים (והדמיון שלהם ל-\( \mathbb{Z} \) הוא למעשה גדול עד להפתיע אבל לא ניכנס לזה).

מה בכל זאת חסר ב-\( \mathbb{Z} \) שמדרבן אותנו להמשיך הלאה? חילוק. מכיוון שחילוק הוא סוג של הפעולה ההפוכה לכפל, אפשר לקוות להגדרה שלו שתהיה דומה למה שהלך במקרה של חיבור: קודם נגדיר “אדיש כפלי”, כזה שכפל בו לא משנה את התוצאה (מי זה כבר יכול להיות? נו, 1 כמובן). אחר כך נגדיר “נגדי כפלי” (אני פשוט אקרא לזה הופכי) שכפל בו מחזיר 1; ולבסוף, נגדיר חילוק במישהו בתור כפל בהופכי שלו. זה עובד לא רע, חוץ מבעיה קטנה אחת: אין ל-\( 0 \) הופכי כי לא יכול להיות איבר שמכפלה שלו ב-0 מחזירה את \( 1 \). הראיתי את זה ממש לא מזמן בפוסט שלי על כך שמותר לחלק באפס בכל מני סיטואציות; ובכן עכשיו זו לגמרי לא אחת מאותן סיטואציות.

בואו ניזכר איך ההוכחה הלכה. הסתכלתי על הביטוי \( a\cdot0 \) ואז השתמשתי בכך ש-\( 0=0+0 \) (כי הוא אדיש חיבורי) ולכן, על פי חוק הפילוג

\( a\cdot0=a\cdot\left(0+0\right)=a\cdot0+a\cdot0 \)

עכשיו חיסרתי את \( a\cdot0 \) משני האגפים - כלומר, חיברתי את הנגדי של \( a\cdot0 \) לשני האגפים (קיים כזה כי הנחנו שיש נגדי לכל איבר בקבוצה שלנו). כתוצאה מזה קיבלתי \( 0=a\cdot0 \), כלומר לא משנה באיזה איבר אני כופל את \( 0 \), אני אקבל 0. אבל הרי \( 0\ne1 \) ולכן לא קיים \( a \) כך ש-\( a\cdot0=1 \).

אלא אם כן באמת מתקיים \( 0=1 \). אבל אם היה מתקיים \( 0=1 \) אז על ידי כפל ב-\( a \) בשני האגפים היינו מקבלים \( 0=a \), כלומר הדרך היחידה שבה יתקיים \( 0=1 \) תהיה אם כל הקבוצה שלנו תהיה רק \( \left\{ 0\right\} \) ותו לא.

יודעים מה מעליב? שהקבוצה \( \left\{ 0\right\} \) באמת מקיימת את כל הדרישות שכתבתי עד כה. והיא תקיים גם את הבאות בתור אם אני לא אדרוש במפורש \( 0\ne1 \), אז אני אדרוש את זה במפורש, ופשוט אגדיר הופכי לכל מי שאיננו 0:

  • קיים איבר שמסומן ב-\( 1 \) כך ש-\( 0\ne1 \) ו-\( a\cdot1=a \) לכל \( a \)
  • לכל \( a\ne0 \) קיים איבר שמסומן ב-\( a^{-1} \) ונקרא ההופכי של \( a \) כך ש-\( a\cdot a^{-1}=1 \)

המספרים השלמים \( \mathbb{Z} \) אמנם מקיימים את הדרישה על 1, אבל הם לא מקיימים את הדרישה על קיום הופכי. שני המספרים היחידים ב-\( \mathbb{Z} \) שיש להם הופכי הם 1 ו-\( -1 \); אצל שניהם הם ההופכיים של עצמם אבל באופן כללי זה לא חייב להיות ככה, כמובן.

הרציונליים נכנסים לתמונה

כדי לקבל מ-\( \mathbb{Z} \) קבוצה שיש בה הופכי לכל מי ששונה מאפס, אנחנו מכניסים לתמונה שברים, מספרים מהצורה \( \frac{a}{b} \) כך ש-\( b\ne0 \), עם כללי חיבור וכפל שמכלילים את מה שאנחנו מכירים ממספרים שלמים:

  • \( \frac{a}{b}+\frac{c}{d}=\frac{ad+bc}{bd} \)
  • \( \frac{a}{b}\cdot\frac{c}{d}=\frac{ac}{bd} \)

זה לא לגמרי מובן מאליו שכל התכונות שכבר ראינו עדיין מתקיימות תחת הכללים החדשים הללו, אבל לא כזה קשה לבדוק את זה. התוצאה שמתקבלת מסומנת ב-\( \mathbb{Q} \) ואנחנו קוראים לה בדרך כל המספרים הרציונליים. אם אני רוצה לבנות פורמלית את \( \mathbb{Q} \) (מה שאני לא עושה כאן) אני צריך קצת להיזהר כי למשל \( \frac{1}{2}=\frac{2}{4} \); אבל בפוסט הזה הגישה שלי היא לא לבנות שום דבר אלא רק לדבר על האקסיומות, ולראות אילו אובייקטים מקיימים אותן. והאקסיומות שתיארתי עד כה הן סוף הדרך מבחינת ההגדרה של מה זה שדה, והמספרים הרציונליים הם סוג של השדה הכי פשוט שקיים (אבל חכו עוד שניה עם זה). כדי לחדד את ההגדרה, בואו נאסוף את מה שפיזרתי לאורך החלק הזה

שדה הוא קבוצה \( F \) עם שתי פעולות בינאריות “חיבור” \( + \) ו”כפל” \( \cdot \) (פעולה בינארית היא פונקציה שמקבלת זוג איברים מ-\( F \) ומחזירה איבר ב-\( F \)) שמקיימת את התכונות הבאות:

  • \( \left(a+b\right)+c=a+\left(b+c\right) \)
  • \( \left(a\cdot b\right)\cdot c=a\cdot\left(b\cdot c\right) \)
  • \( a+b=b+a \)
  • \( a\cdot b=b\cdot a \)
  • \( a\cdot\left(b+c\right)=a\cdot b+a\cdot c \)
  • קיים איבר שמסומן ב-0 כך ש-\( a+0=a \) לכל \( a \)
  • לכל \( a \) קיים איבר שמסומן ב-\( -a \) ונקרא הנגדי של \( a \) כך ש-\( a+\left(-a\right)=0 \)
  • קיים איבר שמסומן ב-\( 1 \) כך ש-\( 0\ne1 \) ו-\( a\cdot1=a \) לכל \( a \)
  • לכל \( a\ne0 \) קיים איבר שמסומן ב-\( a^{-1} \) ונקרא ההופכי של \( a \) כך ש-\( a\cdot a^{-1}=1 \)

תשע האקסיומות הללו הן כל מה שיש; מתוכן אפשר להסיק כללים אחרים שמוכרים לנו, כמו למשל הכלל שכפל של משהו ב-0 תמיד מחזיר 0.

בואו נוכיח עוד תכונה לדוגמא: שהאדיש החיבורי הוא יחיד. כלומר שאין איזה איבר \( 0^{\prime}\ne0 \) כך ש-\( a+0^{\prime}=a \) לכל \( a \). ההוכחה היא די טריוויאלית, כי אם נניח שיש \( 0^{\prime} \) כך ש-\( a+0^{\prime}=a \) לכל \( a \) אז זה בפרט נכון עבור \( a=0 \), ואז \( 0+0^{\prime}=0 \) (כי \( 0^{\prime} \) אדיש) אבל גם \( 0+0^{\prime}=0^{\prime} \) (כי \( 0 \) אדיש) וקיבלנו \( 0=0^{\prime} \).

הנה משהו יותר טריקי באותה רוח: אני רוצה להראות שלא סתם אין אדיש נוסף, אלא שאפילו אם נבחר איבר \( a \) ספציפי כלשהו, אין מישהו נוסף שמשמש כאדיש עבורו. כלומר, אם \( x \) הוא איבר כלשהו כך ש-\( a+x=a \) אז \( x=0 \). על פניו גם זה טריוויאלי: בואו פשוט נעביר את \( a \) אגף ונקבל \( x=0 \). אבל בואו נעשה את זה לאט, כדי שנבין באילו כללים אנחנו משתמשים:

\( a+x=a \) (זו נקודת המוצא שלנו)

\( -a+\left(a+x\right)=-a+a \) (חיברנו \( -a \) לשני האגפים; שימו לב ששמתי סוגריים על \( a+x \) מאגף שמאל כדי להדגיש שפעולת החיבור שלהם “מתבצעת קודם”)

\( \left(-a+a\right)+x=-a+a \) (על אגף שמאל השתמשתי בחוק הקיבוץ לחיבור)

\( \left(a+\left(-a\right)\right)+x=a+\left(-a\right) \) (על שני האגפים השתמשתי בחוק החילוף לחיבור)

\( 0+x=0 \) (השתמשתי בכך שאיבר ועוד הנגדי שלו זה 0)

\( x+0=0 \) (עוד שימוש בחוק החילוף לחיבור)

\( x=0 \) (סיימנו)

שימו לב לרמת הפדנטיות שלי: אני לא אומר \( 0+x=x \) ישירות, כי בניסוח שלי של מהו 0 אמרתי רק ש-\( a+0=a \) לכל \( a \). הסיבה לכך שהגדרתי 0 ככה היא שידעתי שיהיה לי את חוק החילוף; אם חוק החילוף לא היה מובטח לי, הייתי מגדיר את האדיש בתור מישהו שמקיים \( a+0=0+a=a \) (ואכן, אם תסכלו בהגדרות של תורת החבורות, איפה שכללי החילוף לא מובטחים, כך מגדירים).

הנה עוד משהו באותו רוח - לכל \( a \), הנגדי של \( a \) הוא יחיד. כלומר אם \( a+x=0 \) וגם \( a+y=0 \) אז \( x=y \). את זה קל למדי להראות: מכך ש-\( a+x=0=a+y \) נסיק \( a+x=a+y \) ועכשיו נחבר את \( -a \) לשני האגפים, נשתמש בחוק הקיבוץ ונקבל \( x=y \).

בעזרת יחידות הנגדי אני אוכיח עוד תכונה מעניינת במיוחד: \( \left(-a\right)\cdot\left(-b\right)=ab \), כלומר “מינוס כפול מינוס זה פלוס”. יש לי פוסט שמנסה להסביר את האינטואיציה מאחורי זה, אבל עכשיו אנחנו לא זקוקים לאינטואיציה - יש לנו אקסיומות ואפשר להוכיח מהן דברים.

ראשית, בואו נראה ש-\( -a=\left(-1\right)\cdot a \). במילים: הנגדי של \( a \) שווה לנגדי של 1 כפול \( a \). כדי להראות את זה בואו נסתכל על הסכום \( \left(-1\right)\cdot a+a \). נשתמש בחוק הפילוג ונקבל

\( \left(-1\right)\cdot a+a=\left(-1+1\right)\cdot a=0\cdot a=0 \)

ולכן קיבלנו ש-\( \left(-1\right)\cdot a \) הוא באמת הנגדי של \( a \), תוך שאנחנו משתמשים במובלע בזה שהנגדי הוא יחיד.

עוד דוגמאות לשדות ובפרט שדות סופיים

עכשיו בואו נדבר על עוד שדות. מבית הספר אנחנו מכירים את הממשיים \( \mathbb{R} \) שמכילים את \( \mathbb{Q} \), ואולי מכירים גם את המרוכבים \( \mathbb{C} \) שמכילים את \( \mathbb{R} \): כולם שדות, אבל מכיוון שאני מנסה בפוסטים הללו להגדיר את \( \mathbb{R} \) אולי לא נלך לכיוון של הדוגמאות האלו. האם יש עוד דברים? האמת היא שיש המון שדות. הנה דוגמא פשוטה: אנחנו יודעים ששורש 2 הוא לא מספר רציונלי, מה שמסומן ב-\( \sqrt{2}\notin\mathbb{Q} \) (יש לי הסבר כאן). אז אני יכול “לצרף” אותו ל-\( \mathbb{Q} \) במובן הבא: אני יוצר קבוצה \( \mathbb{Q}\left(\sqrt{2}\right)=\left\{ a+b\sqrt{2}\ |\ a,b\in\mathbb{Q}\right\} \). איברים טיפוסיים של הקבוצה הם \( \sqrt{2} \) ו-\( 3-5\sqrt{2} \) וגם \( 17 \). עכשיו, פעולות החיבור והכפל של איברים בקבוצה יתנהגו באופן המתבקש:

  • \( \left(a+b\sqrt{2}\right)+\left(c+d\sqrt{2}\right)=\left(a+c\right)+\left(b+d\right)\sqrt{2} \)
  • \( \left(a+b\sqrt{2}\right)\cdot\left(c+d\sqrt{2}\right)=\left(ac+2bd\right)+\left(bc+ad\right)\sqrt{2} \)

לא קשה לראות שתחת ההגדרות הללו, קיבלנו ש-\( \mathbb{Q}\left(\sqrt{2}\right) \) היא שדה. מכיוון שאפשר היה לעשות את המשחק הזה עם כל שורש של כל מספר רציונלי (וגם עם מספרים טיפה יותר מסובכים) אנחנו מקבלים פה בעצם עושר אדיר של שדות. יש תחום שלם - תורת השדות - שמתעסק בשדות הללו ובבלאגן העצום שלהם; זה התחום שבו מוכיחים שלבעיות הבניה בסרגל ומחוגה של היוונים הקדמונים אין פתרון, ושאין נוסחה לפתרון משוואה ממעלה חמישית ומעלה, אבל אני לא אדבר על זה כאן (והמתמטיקה המעורבת היא מסובכת יחסית, אם כי עדיין ברמה של תואר ראשון).

בואו נעבור לראות עוד שדות, פשוטים יותר. קודם ראינו שבאופן מעליב משהו, הקבוצה \( \left\{ 0\right\} \) היא כמעט שדה - הסיבה היחידה שהיא לא הייתה שדה היא הדרישה המפורשת שלנו ש-\( 0\ne1 \). אם כן, מה עם \( \left\{ 0,1\right\} \)? האם הקבוצה הזו היא כן שדה? לכאורה לא, כי פעולת החיבור מוציאה אותנו מגבולות השדה: \( 1+1=2 \). אבל נניח שהיינו רוצים שהקבוצה הזו תהיה שדה, איך היינו צריכים “לתקן” את פעולת החיבור? ובכן, אפשר להגדיר או \( 1+1=1 \) או \( 1+1=0 \). אבל ההגדרה הראשונה מובילה, אחרי העברת אגפים אל \( 1=0 \) שכבר אמרנו שאסור. לעומת זאת ההגדרה \( 1+1=0 \) היא מצוינת; היא לא גורמת לשום בעיות. עם ההגדרה הזו, \( \left\{ 0,1\right\} \) היא באמת שדה, שבדרך כלל מסומן בתור \( \mathbb{Z}_{2} \) או \( \mathbb{F}_{2} \) ותכף נבין את הניואנס שמבדיל בין הסימונים.

אם כן, \( \mathbb{F}_{2} \) הוא השדה הזעיר ביותר שקיים. בפרט יש בו מספר סופי של איברים, להבדיל מ-\( \mathbb{Q} \) האינסופי. האם יש עוד שדות שדומים ל-\( \mathbb{F}_{2} \)? נראה די מתבקש להסתכל על הקבוצה \( \mathbb{Z}_{3}=\left\{ 0,1,2\right\} \). ושוב, אנחנו נתקלים בבעיה כשאנחנו מסתכלים על \( 1+1+1 \) שלא יכול להיות שווה 3. הוא גם לא יכול להיות שווה 1 כי מ-\( 1+1+1=1 \) נקבל \( 2=0 \) ואז אין לנו שלושה איברים; והוא לא יכול להיות 2 כי אז \( 1+1+1=2 \) יגרור \( 1=0 \) כמו קודם; לכן אנחנו מגדירים \( 1+1+1=0 \).

מההגדרה הזו עולה גם מה אמור לצאת \( 2\cdot2 \), כי הרי \( 2=1+1 \) אז אפשר להשתמש בחוק הפילוג ולקבל \( 2\cdot2=\left(1+1\right)\left(1+1\right)=1+1+1+1=1 \). מה שקורה כאן בפועל הוא שב-\( \mathbb{Z}_{3} \) אנחנו נדחפים להגדיר את פעולות החיבור והכפל מודולו 3. כלומר - מבצעים חיבור או כפל רגילים, אבל אחר כך מחלקים את התוצאה ב-3 ולוקחים רק את השארית. בגלל ש-\( 1+1+1 \) מתחלק ב-3, השארית יוצאת 0 ולכן אנחנו מקבלים את השוויון \( 1+1+1=0 \) שממנו אפשר להסיק גם במקרה של \( 2\cdot2 \). עם ההגדרות הללו, \( \mathbb{Z}_{3} \) היא באמת שדה, שמסומן \( \mathbb{F}_{3} \).

את הרעיון הזה אפשר להכליל לכל מספר טבעי \( n \): מסמנים ב-\( \mathbb{Z}_{n} \) את הקבוצה \( \left\{ 0,1,2,\ldots,n-1\right\} \) של כל המספרים הטבעיים מאפס עד \( n-1 \); אם חושבים על זה רגע, זו קבוצת כל השאריות האפשריות שמתקבלות כשמחלקים מספר טבעי כלשהו ב-\( n \). פעולות החיבור והכפל מוגדרות על הקבוצה הזו כמו על מספרים טבעיים רגילים, אבל אחרי קבלת התוצאה מחלקים ב-\( n \) ולוקחים את השארית. לא קשה לראות ש-\( \mathbb{Z}_{n} \) הזו מקיימת את רוב התכונות היפות שדיברנו עליהן: חוקי הקיבוץ, החילוף והפילוג; קיום אדיש חיבורי (0) וקיום נגדי לכל איבר (הנגדי של \( a\ne0 \) הוא \( n-a \) והנגדי של 0 הוא 0); וקיום אדיש כפלי (1). אבל \( \mathbb{Z}_{n} \) הוא לא בהכרח שדה, והדוגמא הראשונה היא \( \mathbb{Z}_{4} \).

הבעיה הבסיסית ב-\( \mathbb{Z}_{4} \) היא ש-\( 2\cdot2=0 \), מה שמבטיח של-\( 2 \) לא יכול להיות הופכי, כי נניח שהיה \( x \) כלשהו כך ש-\( 2x=1 \), אז היינו כופלים את \( 2\cdot2=0 \) ב-\( x \) משני האגפים ומקבלים

\( 0=0\cdot x=2\cdot2x=2 \)

כלומר \( 0=2 \), מה שאנחנו מניחים שלא מתקיים. זו תוצאה שנכונה לא ל-2 אלא באופן כללי במבנה שקראתי לו חוג: אומרים ש-\( a,b \) הם מחלקי אפס אם \( ab=0 \) למרות ש-\( a\ne0 \) וגם \( b\ne0 \), ואפשר להוכיח בדיוק באותו אופן שראינו שמחלקי אפס לא יכולים להיות הפיכים.

כדי ש-\( \mathbb{Z}_{n} \) יהיה שדה, הכרחי שלא יהיו בו מחלקי אפס. מכיוון שאם יש \( a,b>0 \) כך ש-\( n=ab \) אז \( a,b \) כן יהיו מחלקי אפס, תנאי הכרחי לכך ש-\( \mathbb{Z}_{n} \) יהיה שדה הוא ש-\( n \) יהיה ראשוני. לא קשה להראות שזה גם תנאי מספיק, כלומר שאם \( p \) ראשוני אז \( \mathbb{Z}_{p} \) הוא שדה, ובמקרה הזה מסמנים את השדה ב-\( \mathbb{F}_{p} \). הנה הניואנס המדובר: \( \mathbb{Z}_{n} \) הוא סימון כללי עבור החוג שמשתמשים בו גם כשהחוג אינו שדה, אבל ב-\( \mathbb{F}_{n} \) משתמשים רק כשהוא שדה.

אם כן, קיבלנו עכשיו עושר של שדות חדשים: \( \mathbb{F}_{p} \) לכל אחד מאינסוף הראשוניים \( p \) הקיימים. בניגוד ל-\( \mathbb{Q} \) כל השדות הללו הם סופיים. האם אלו כל השדות הסופיים? ובכן, לא, אבל זו נקודת התחלה טובה. אפשר להוכיח שלכל מספר ראשוני \( p \) ולכל מספר טבעי \( n \) קיים שדה אחד ויחיד עם \( p^{n} \) איברים, שמסומן \( \mathbb{F}_{p^{n}} \), והשדה הזה מכיל את \( \mathbb{F}_{p} \) בתור תת-קבוצה.

איך בדיוק \( \mathbb{F}_{p^{n}} \) נראה? זה טיפה טריקי: אפשר לחשוב על אברי \( \mathbb{F}_{p^{n}} \) בתור פולינומים ממעלה קטנה מ-\( n \) שהמקדמים שלהם שייכים ל-\( \mathbb{F}_{p} \), למשל אפשר לחשוב על אברי \( \mathbb{F}_{7^{3}} \) בתור פולינומים כמו \( 2x+5 \) ו-\( 6x^{2}+2 \) ופעולת החיבור מוגדרת באופן הסטנדרטי עבור פולינומים, כך שבדוגמא שלי \( \left(6x^{2}+2\right)+\left(2x+5\right)=6x^{2}+2x+7=6x^{2}+2x \) (ה-\( 7 \) נעלם כי החיבור הוא מודולו 7 כי המקדמים של הפולינום הם איברים של \( \mathbb{F}_{7} \)). אבל כפל הוא לא כזה פשוט. הרעיון הוא שכופלים את הפולינומים, ואז מחלקים את התוצאה בפולינום ספציפי ממעלה \( n \) מעל \( \mathbb{F}_{p} \) שנבחר מראש. כדי שזה יעבוד ונקבל שדה הפולינום הזה צריך להיות אי פריק אבל אני גולש פה כבר לנושא לא קשור - הנה פוסט שלי שמתעסק בשדות סופיים ונכנס לפרטים הללו.

לסיום, בואו נעניק שם מפורש למושג המובלע שהשתמשנו בו בחלק הזה. אנחנו אומרים שהמציין של השדה \( \mathbb{F} \) הוא \( n \) אם לחבר את 1 לעצמו \( n \) פעמים מחזיר 0 אבל כל חיבור של 1 לעצמו מספר קטן יותר של פעמים הוא לא 0. למשל, המציין של \( \mathbb{F}_{7} \) הוא 7. כבר ראינו שהמציין של שדה חייב להיות מספר ראשוני, אם הוא קיים; אם לא משנה כמה פעמים נחבר את 1 לעצמו, תמיד נקבל משהו שונה מאפס, אומרים שהמציין של השדה הוא 0 (למשל, המציין של \( \mathbb{Q} \) הוא 0).

עכשיו כשאנחנו כבר מבינים פחות או יותר מה זה שדה, מה מפריד שדות מדברים דומים שאינם שדות, ויש לנו כמה דוגמאות קונקרטיות לשדות ובפרט \( \mathbb{Q} \) והשדות \( \mathbb{F}_{p} \), אפשר להתקדם הלאה ולעבור אל עוד אקסיומות שאפשר להוסיף לשדה והן פחות נפוצות באלגברה אבל סופר-שימושיות בחשבון דיפרנציאלי ואינטגרלי: אקסיומות סדר.

סדור

מה זה "מספר חיובי"?

כשאנחנו כותבים \( 3<5 \) אנחנו יודעים למה אנחנו מתכוונים: 5 גדול מ-3. הוא בא “אחריו” בסדר של המספרים. אנחנו הרי סופרים ככה: אחת, שתיים, שלוש, ארבע, חמש. שלוש בא קודם, חמש אחר כך, אז זה מסומן קומפקטית ב-\( 3<5 \). אז אינטואיציה יש, אבל איך מגדירים את זה פורמלית?

ההגדרה ה”סדרתית” לא תביא אותנו יותר מדי רחוק אם יש לנו שאיפות גדולות יותר מאשר לדבר על הטבעיים. אנחנו רוצים הגדרה שיהיה בה הגיון בהרבה שדות, למשל ב-\( \mathbb{Q} \). יש לנו את האינטואיציה לכך ש-\( \frac{1}{2}<\frac{3}{4} \), אבל איך זה מוגדר פורמלית? לנסות לסדר את השברים בסדרה כמו שעשינו עם הטבעיים זה כאב ראש שלא ייאמן (נסו!) אבל למרבה המזל יש לנו טריק פשוט מאוד: פשוט נסתכל על \( \frac{3}{4}-\frac{1}{2} \) ונשאל את עצמנו - האם זה מספר חיובי או שלילי?

כמובן, במבט ראשון לא פתרנו הרבה כי מה זה בכלל “מספר חיובי”? ההגדרה הפשוטה היא - מספר \( a \) הוא חיובי אם \( 0<a \), כלומר אני מגדיר חיוביים בעזרת הסימן \( < \) של “גדול מ-“. אבל היופי בעניין הוא שאני לא צריך את הסימן הזה כדי להגדיר חיובי. מלכתחילה אני קורא למספרים הטבעיים (בלי אפס) “החיוביים” ולנגדיים שלהם “השליליים”, אז אני יכול להתבסס על הדיכוטומיה הזו כדי להגדיר את \( < \) מלכתחילה.

זה נשמע קצת רעוע, אני מודה, אבל היופי פה שזה באמת עובד, וכדי לראות כמה טוב זה עובד אני אעשה את זה על שדה כללי, עם הגדרות אבסטרקטיות, ונראה כמה רחוק אפשר להגיע.

הרעיון הוא זה: נניח ש-\( \mathbb{F} \) הוא שדה כלשהו. עכשיו אנחנו מגדירים עליו מבנה חדש באמצעות קבוצה \( P\subseteq\mathbb{F} \) שאנחנו קוראים לאיברים שלה חיוביים. כדי שדברים יעבדו כמו שאנחנו מצפים, אנחנו דורשים שלוש אקסיומות מה”חיוביים” הללו:

  • לכל \( a\in\mathbb{F} \) בדיוק אחד מהבאים מתקיים: או ש-\( a\in P \), או ש-\( -a\in P \), או ש-\( a=0 \).
  • אם \( a,b\in P \) אז \( a+b\in P \)
  • אם \( a,b\in P \) אז \( a\cdot b\in P \)

זה הכל! האקסיומה הראשונה אומרת “כל איבר שונה מאפס הוא או חיובי או שלילי”. שתי האחרות אומרות “סכום ומכפלה של חיוביים הוא חיובי”. אלו בבירור תכונות שאנחנו מצפים מחיוביים לקיים ומתקיימות עבור \( \mathbb{N} \); מה שנראה קצת הזוי פה הוא שזה מספיק כדי להגדיר את יחס הסדר \( < \) ולהסיק את כל התכונות שלו, אבל למרבה השמחה זה בדיוק מה שקורה, ואנחנו קוראים בשם שדה סדור לשדה \( \mathbb{F} \) עם תת-קבוצה \( P \) שמקיימת את האקסיומות הללו.

בתור התחלה, בואו נשים לב ש-\( 1 \) הוא תמיד חיובי, לא משנה כמה מוזר ננסה ש-\( P \) תהיה. מכיוון ש-\( 0\ne1 \) יש ל-1 בדיוק שתי ברירות: או ש-\( 1\in P \) או ש-\( -1\in P \). אבל זכרו שראינו שמינוס כפול מינוס הוא פלוס (ואת זה ראינו עוד לפני שהתחלנו לדבר על חיוביים ושליליים!) אז אם \( -1\in P \), מהאקסיומה על כפל נקבל ש-\( 1=\left(-1\right)\cdot\left(-1\right)\in P \), בסתירה להנחה ש-\( -1\in P \). אז המסקנה שלנו היא ש-\( 1\in P \) ואילו \( -1\notin P \), כלומר 1 הוא תמיד חיובי ו-\( -1 \) הוא תמיד שלילי. עכשיו אפשר להשתמש בסגירות של \( P \) לחיבור כדי לקבל שבכל שדה סדור, כל האיברים מהצורה \( n \) (חיבור של \( 1 \) לעצמו \( n \) פעמים) הם חיוביים וכל האיברים מהצורה \( -n \) הם שליליים. במילים אחרות, כל שדה סדור ממציין 0 מכיל עותק של \( \mathbb{Z} \) ששומר על המשמעות המקורית של “חיוביים” ו”שליליים” ב-\( \mathbb{Z} \).

ההגדרה של \( P \) השתמשה בצורה מהותית באיברים נגדיים, אבל מה עם איברים הופכיים? אם \( a\in P \), האם גם \( a^{-1}\in P \)? התשובה חיובית. ראשית שימו לב ש-\( a^{-1} \) בכלל מוגדר; אם היה מתקיים \( a=0 \) הוא לא היה מוגדר, אבל \( a\in P \) ולכן \( a\ne0 \). שנית, בגלל ש-\( a^{-1}\ne0 \) מאותו נימוק, אז או ש-\( a^{-1}\in P \) או ש-\( -a^{-1}\in P \). בואו נניח בשלילה שדווקא המקרה השני מתקיים, אז בגלל שגם \( a\in P \) נקבל \( -1=\left(-a^{-1}\right)\cdot a\in P \) וזו סתירה, לכן \( a^{-1}\in P \).

התוצאה שזה עתה ראיתי מאפשרת לי לדבר על \( \mathbb{Q} \). כזכור, כל שדה ממציין 0 מכיל יותר מאשר עותק של \( \mathbb{Z} \) - הוא מכיל עותק של \( \mathbb{Q} \); האם גם בו נשמרת המשמעות המקורית של “חיוביים” ו”שליליים”? כל מספר רציונלי ניתן לכתיבה בתור \( \frac{a}{b} \), שזו דרך אחרת לכתוב את הביטוי \( a\cdot b^{-1} \) שמשתמש ישירות באקסיומות השדה. כך ש-\( b\ne0 \). אם \( a=0 \) אז \( \frac{a}{b}=0 \). אחרת, אם \( a\in P \) וגם \( b\in P \) אז \( b^{-1}\in P \) ממה שראינו ולכן \( ab^{-1}\in P \). באופן דומה, אם \( -a,-b\in P \) נקבל שוב \( \frac{a}{b}\in P \) ואילו אם \( a,-b\in P \) או \( -a,b\in P \) נקבל ש-\( -ab^{-1}\in P \) . זה תואם את המשמעות הרגילה של חיוביים והשליליים עבור הרציונליים.

מה עם שדות שהם לא ממציין 0, למשל \( \mathbb{F}_{5} \)? באופן די מובהק פשוט לא ניתן להגדיר עליהם סדר. כי אם \( \mathbb{F} \) הוא שדה ממציין \( n \), אז מצד אחד \( 1,n-1 \) שניהם חיוביים ממה שכבר ראינו, אבל אז גם \( 1+\left(n-1\right) \) צריך להיות חיובי - אבל הוא יוצא 0, ו-0 הוא לא חיובי. אז מלכתחילה כשאנחנו מדברים על “שדה סדור” אנחנו מתכוונים לשדה ממציין 0 (ובפרט, אין שדה סדור סופי).

איך מגדירים סדר וערך מוחלט בעזרת החיוביים

עכשיו בואו נשתמש בחיוביים והשליליים כדי להגדיר יחס סדר \( < \), ונעשה את זה על פי הרעיון האינטואיטיבי שכבר ראינו קודם: נאמר ש-\( a<b \) אם \( b-a\in P \). ונרחיב את הסימון כך ש-\( a\le b \) אם \( a<b \) או \( a=b \).

אנחנו רגילים לחשוב על \( \le \) בתור יחס סדר, כלומר משהו שמקיים שלוש אקסיומות משל עצמו:

  • \( a\le a \) לכל \( a \) ("רפלקסיביות")
  • אם \( a\le b \) וגם \( b\le a \) אז \( a=b \) ("אנטיסימטריות")
  • אם \( a\le b \) וגם \( b\le c \) אז \( a\le c \) ("טרנזיטיביות")

אפשר להוכיח ש-\( \le \) שלנו מקיים את שלוש התכונות הללו.

רפלקסיביות זה פשוט על פי הגדרה: אמרנו שאם \( a=b \) אז \( a\le b \) אז ברור שלכל \( a \) מתקיים \( a\le a \).

אנטיסימטריות זה גם כן די פשוט. אם \( a=b \) סיימנו, אחרת נניח ש-\( a\ne b \) ולכן ההנחות שלנו הן ש-\( a<b \) וגם \( b<a \), כלומר על פי ההגדרה שלנו \( b-a\in P \) וגם \( a-b\in P \). עכשיו, שימו לב ש-\( a-b=-\left(b-a\right) \) (צריך להוכיח את זה מאקסיומות השדה אבל זה קל) אז הגענו לסתירה: מצאנו איבר שגם הוא וגם הנגדי שלו שייכים שניהם ל-\( P \), בסתירה לאקסיומה שאומרת שבדיוק אחד משניהם שייך ל-\( P \). המסקנה היא שההנחה ש-\( a\ne b \) לא הייתה נכונה ולכן \( a=b \), שזה מה שרצינו.

עבור הטרנזיטיביות, הנתון שלנו הוא \( a\le b \) וגם \( b\le c \). אם \( a=b \) אז מ-\( b\le c \) ברור ש-\( a\le c \) (פשוט כותבים \( a \) במקום \( b \)) ובדומה אם \( b=c \) אז מ-\( a\le b \) ברור ש-\( a\le c \). לכן נשאר לנו להוכיח רק שאם \( a<b \) וגם \( b<c \) אז \( a\le c \). משתי ההנחות הללו אנחנו מקבלים \( b-a\in P \) וגם \( c-b\in P \) ועל פי הסגירות של \( P \) לחיבור נקבל ש-\( c-a=\left(c-b\right)+\left(b-a\right)\in P \), כמו שרצינו.

בתורת הקבוצות כשמדברים על יחסי סדר, שלוש האקסיומות למעלה מגדירות את מה שנקרא סדר חלקי. בסדר חלקי, ייתכן שיהיו איברים שבכלל אי אפשר להשוות ביניהם, וזה יכול לסבך מאוד דברים. אצלנו, ביחס הסדר של שדה סדור, זה פשוט לא יכול לקרות ויחס הסדר יהיה מה שנקרא מלא, כלומר לכל \( a,b\in\mathbb{F} \) או שמתקיים \( a<b \) או שמתקיים \( b<a \) או שמתקיים \( a=b \). זה נובע ישירות מכך ש-\( b-a\in P \) או ש-\( -\left(b-a\right)\in P \) או ש-\( b-a=0 \), כלומר מהאקסיומה הראשונה שהייתה לנו על \( P \).

הוכחנו כאן ש-\( \le \) הוא יחס סדר כמו שלומדים בקורס בתורת הקבוצות, אבל למה לעצור כאן? בואו נוכיח את הטענות שראינו בבית הספר! למשל, שאם \( x<y \) ובנוסף \( a>0 \) אז \( ax<ay \). כדי להוכיח את זה, נסתכל על \( ay-ax=a\left(y-x\right) \). מכך ש-\( x<y \) אנחנו מקבלים ש-\( y-x\in P \) ומכך ש-\( a>0 \) אנחנו מקבלים ש-\( a\in P \) (כי \( a=a-0\in P \)) ולכן המכפלה שלהם גם שייכת ל-\( P \) וקיבלנו את מה שרצינו.

עוד דבר שראינו בבית הספר הוא שכפל במספר שלילי הופך את כיוון אי השוויון, כלומר אם \( x<y \) ו-\( a<0 \) אז \( ax>ay \). כדי להוכיח את זה, בואו נסתכל על \( ax-ay=a\left(x-y\right)=-a\left(y-x\right) \). מכיוון ש-\( x<y \) אז \( y-x\in P \) ומכיוון ש-\( a<0 \) אז \( -a\in P \) ולכן שוב קיבלנו מכפלה ששייכת ל-\( P \), כפי שרצינו.

ועוד דבר שראינו בבית הספר הוא שגם לקחת הופכי לשני האגפים של אי שוויון במספרים חיוביים הופך את כיוון אי השוויון. כלומר, אם \( 0<x<y \) אז \( x^{-1}>y^{-1} \). כדי לראות את זה, פשוט נכפול את שני האגפים של \( x<y \) ב-\( x^{-1} \) מצד שמאל ואז נכפול את שני האגפים ב-\( y^{-1} \) מצד ימין ונקבל \( y^{-1}<x^{-1} \). הכל מסתדר מאוד נחמד.

עוד משהו נחמד הוא שעכשיו אנחנו יכולים להגדיר ערך מוחלט. זו פונקציה קטנה ותמימה למראה שהופכת לקריטית ממש כשמתחילים לדבר על חשבון דיפרנציאלי ואינטגרלי, וקל להגדיר אותה בכל שדה סדור (אפשר להגדיר אותה גם בשדות לא סדורים אבל זה סיפור אחר). לכל \( x \) נגדיר

\( \left|x\right|=\begin{cases} x & x\ge0\\ -x & x<0 \end{cases} \)

ומה שנחמד לראות הוא שכבר בהגדרה האבסטרקטית הזו, מתקיימות התכונות הבסיסיות שאנחנו רגילים אליהן מערך מוחלט “רגיל” ואפשר להוכיח אותן מהכמות הבאמת זעומה של אקסיומות שעליהן הסתמכנו.

ראשית, אם \( x\ne0 \), אז גם \( \left|x\right|\ne0 \), פשוט כי אם \( x\ne0 \) אז \( \left|x\right| \) הוא או \( x \) או \( -x \) ושניהם שונים מאפס.

שנית, לכל \( x,y\in\mathbb{F} \) מתקיים \( \left|xy\right|=\left|x\right|\cdot\left|y\right| \), כלומר פונקציית הערך המוחלט היא כפלית. את זה אפשר לראות למשל על ידי בדיקה מפורשת של כל: למשל, אם \( x,y\ge0 \) אז \( \left|x\right|=x,\left|y\right|=y \) וכמו כן \( xy\ge0 \) ולכן \( \left|xy\right|=xy=\left|x\right|\left|y\right| \). והנה דוגמא טיפה יותר מסובכת: אם \( x\ge0 \) אבל \( y<0 \) אז \( xy\le0 \) ולכן נצטרך לחלק פה למקרים: אם \( x=0 \) אז \( xy=0=0\cdot\left|y\right|=\left|x\right|\cdot\left|y\right| \) . לעומת זאת אם \( x>0 \) אז \( xy<0 \) ולכן \( \left|xy\right|=-xy=x\left(-y\right)=\left|x\right|\left|y\right| \), וכן הלאה.

התכונה השלישית היא המעניינת מכולן: אי-שוויון המשולש, שאפילו שמו מגיע לו מגאומטריה שפשוט לא קיימת כאן, בעולם של ההגדרות האלגבריות הטהורות:

\( \left|x+y\right|\le\left|x\right|+\left|y\right| \)

הטריק בהוכחה הוא לשים לב שלכל \( a\in\mathbb{F} \) מתקיים \( \left|a\right|^{2}=a^{2} \) פשוט כי אם \( a\ge0 \) זה ברור ואם \( a<0 \) אז \( \left|a\right|^{2}=\left(-a\right)\left(-a\right)=a^{2} \) כי מינוס כפול מינוס זה פלוס, כמו שראינו. אז אפשר לכתוב:

\( \left|x+y\right|^{2}=\left(x+y\right)^{2}=x^{2}+2xy+y^{2}\le \)

\( \left|x\right|^{2}+2\left|xy\right|+\left|y\right|^{2}=\left|x\right|^{2}+2\left|x\right|\left|y\right|+\left|y\right|^{2}=\left(\left|x\right|+\left|y\right|\right)^{2} \)

כאן השתמשנו בכך ש-\( xy\le\left|xy\right| \), שקל להוכיח באופן כללי כי אם \( a\ge0 \) אז \( a=\left|a\right| \) ואם \( a<0 \) אז \( -a>0 \) ואז \( -a-a=-2a>0 \) כך ש-\( a<-a=\left|a\right| \).

הגענו אל המסקנה \( \left|x+y\right|^{2}\le\left(\left|x\right|+\left|y\right|\right)^{2} \). מה שאנחנו באמת רוצים לעשות הוא “להוציא שורש” משני האגפים. כלומר, להראות שאם \( a,b\ge0 \) שניהם וגם \( a^{2}\le b^{2} \) אז \( a\le b \). הנה דרך אחת להראות את זה: אם \( a^{2}\le b^{2} \) אז \( b^{2}-a^{2}\ge0 \) אבל \( b^{2}-a^{2}=\left(b-a\right)\left(b+a\right) \). עכשיו, הנחנו ש-\( a,b\ge0 \) ולכן \( b+a\ge0 \). מכאן שאם לא היה מתקיים \( a\le b \) אז היה מתקיים \( b-a<0 \) מה שהיה גורר ש-\( b^{2}-a^{2}<0 \), בסתירה להנחה המקורית שלנו. זה מסיים את ההוכחה של אי שוויון המשולש.

ארכימדיות

אני רוצה לתת עכשיו עוד הגדרה די מהותית, שתהפוך להיות חשובה מאוד בהמשך: ארכימדיות של שדה סדור (מארכימדס, המתמטיקאי היווני). דרך אחת לנסח את תכונת הארכימדיות של שדה סדור \( \mathbb{F} \) היא שלכל \( a\in\mathbb{F} \) קיים \( n\in\mathbb{Z} \) כך ש-\( a<n \) . כאן צריך לחדד שב-\( \mathbb{Z} \) הכוונה שלי היא לתת-הקבוצה של \( \mathbb{F} \) שנוצרת על ידי חיבור/חיסור של \( 1 \) לעצמו (זכרו שמקבלים את \( \mathbb{Z} \) רק אם השדה ממציין 0, אבל אם הוא לא ממציין 0 הוא בפרט לא סדור). במילים אחרות, האיברים של השדה אף פעם לא “בורחים” מבחינת גודלם למספרים הטבעיים.

יש עוד כמה דרכים לראות את זה. ראשית, ארכימדיות הוגדרה בתור “קיים \( n \) גדול יותר” אבל מזה נובע מייד גם “קיים \( n \) קטן יותר”, כלומר לכל \( a\in\mathbb{F} \) קיים \( n\in\mathbb{Z} \) כך ש-\( n<a \). כדי לראות את זה, פשוט נפעיל ארכימדיות “רגילה” על \( -a \), נקבל שקיים \( n^{\prime} \) כך ש-\( -a<n^{\prime} \), נכפול את שני האגפים ב-\( -1 \), מה שכבר ראינו שהופך את הסדר, נסמן \( n=-n^{\prime} \) ונקבל \( n<a \).

שנית, “קיים מספר טבעי גדול כרצוננו” זה אותו הדבר כמו “קיים מספר רציונלי חיובי קטן כרצוננו”. כלומר, לכל \( a>0 \) קיים \( n\in\mathbb{Z} \) כך ש-\( \frac{1}{n}<a \) - כדי לראות את זה, ניקח \( n \) כך ש-\( a^{-1}<n \) ואז ניקח הופכי לשני האגפים ונקבל \( \frac{1}{n}<a \).

עוד דרך לחשוב על זה, שאני אוהב במיוחד, היא זו: בואו ניקח \( \varepsilon>0 \) כלשהו, כשהאינטואיציה היא לחשוב על \( \varepsilon \) בתור משהו ממש ממש קטן (זה השימוש הסטנדרטי של האות הזו בחדו”א). בואו ניקח גם \( M>0 \) כלשהו, כשהאינטואיציה היא לחשוב עליו בתור מספר ממש ממש ענק. אז ארכימדיות פירושה שקיים \( n \) כך ש-\( n>\frac{M}{\varepsilon} \), או במילים אחרות \( n\varepsilon>M \). זה אומר שלא משנה עד כמה משהו קטן - אם אנחנו בשדה ארכימדי, לחבר אותו מספר פעמים לעצמו יגרום לו לעבור בגודלו כל מספר כולל ענקיים.

כמובן, שאלה מתבקשת עכשיו היא אילו שדות סדורים הם לא ארכימדיים. התשובה היא שיש כאלו, אבל להציג אותם קונקרטית יהיה מתוסבך מדי אם אני רוצה לסיים מהר את החלק הזה. עדיין, בואו נחשוב מה המשמעות של קיום שלהם. יש למשל שדה לא ארכימדי שמרחיב את הממשיים, \( \mathbb{R} \) (שדה ה”היפר-ממשיים”). בשדה כזה יהיה איבר \( \omega \) כך ש-\( n<\omega \) לכל \( n \) טבעי; על \( \omega \) הזה אפשר לחשוב בתור איבר מגודל “אינסופי”. מכיוון שאנחנו בשדה קיים לו הופכי, \( \omega^{-1} \); אי השוויון \( n<\omega \) מלמד אותנו ש-\( \omega^{-1}<\frac{1}{n} \). כלומר נקבל ש-\( \omega^{-1} \) קטן מכל מספר ממשי (כי לכל מספר ממשי קיים \( \frac{1}{n} \) שקטן ממנו); \( \omega^{-1} \) הוא מה שמכונה במתמטיקה מודרנית “אינפיניטסימל” (מושג שהייתה לו משמעות הרבה יותר רופפת בימי התהוות החדו”א).

הקיום של שדות לא ארכימדיים שמכלילים את הממשיים הוא מבחינתי תמרור אזהרה עצום להגדרה של הממשיים בתור “כל המספרים על ציר המספרים”. הגישה הזו מניחה שהאינפיניטסימל \( \omega^{-1} \) בכלל לא נמצא על ציר המספרים. עוד הייתי יכול להבין טענות ש-\( \omega \) לא נמצא עליו כי הוא אי שם הרחק באינסוף רחוק רחוק - אבל לטעון ש-\( \omega^{-1} \) הוא לא על ציר המספרים, בהינתן כמה שהוא קרוב לאפס - זה כבר מוזר. אני אישית לא מצליח לחשוב על דרך טובה לנמק למה אסור למה שאנחנו קוראים לו “ציר המספרים” לכלול את \( \omega^{-1} \) בלי פשוט לומר “אנחנו מגדירים את ציר המספרים להיות \( \mathbb{R} \)” וחסל (זו הגישה שלי), מה שכמובן מונע מאיתנו להגדיר את \( \mathbb{R} \) בתור ציר המספרים.

צפיפות

לפני שנמשיך לחלק הבא, יש עוד תכונה סופר-חשובה אחת שתהיה סופר-שימושית בהמשך שכבר אפשר לדבר עליה. מה ההבדל העקרוני בין \( \mathbb{Z} \) ובין \( \mathbb{Q} \) בתור חוגים סדורים? ובכן, \( \mathbb{Q} \) הוא לא סתם חוג אלא שדה וזה באמת הבדל מהותי, אבל אני חושב יותר על הבדל שקשור ליחס הסדר עצמו. ב-\( \mathbb{Z} \), מתקיים למשל אי השוויון \( 3<4 \), ויוצא שבין שני המספרים הללו אין עוד איבר נוסף - אני יכול “לדלג בצעד אחד” מ-\( 3 \) אל \( 4 \). לעומת זאת ב-\( \mathbb{Q} \) אין דבר כזה: לכל \( a,b\in\mathbb{Q} \) כך ש-\( a<b \) קיים \( c\in\mathbb{Q} \) כך ש-\( a<c<b \). התכונה הזו, של קיום איבר בין כל זוג איברים שונים זה מזה נקרא צפיפות ובאמת שהוא חשוב בצורה בלתי רגילה. אז ההבדל בין \( \mathbb{Z} \) ובין \( \mathbb{Q} \) שרציתי לדבר עליו: יחס הסדר של \( \mathbb{Z} \) לא צפוף אבל של \( \mathbb{Q} \) כן.

המקרה של \( \mathbb{Z} \) מראה לנו שקיימים חוגים סדורים שאינם צפופים. אבל האם כל שדה סדור הוא צפוף? ובכן, כן, בצורה לא מעניינת: יהיו \( a<b \) איברים כלשהם של שדה סדור \( \mathbb{F} \), אז \( a=\frac{a+a}{2}<\frac{a+b}{2}<\frac{b+b}{2}=b \) ולכן \( \frac{a+b}{2} \) הוא איבר שנמצא בין \( a \) לבין \( b \). בגלל שזה היה פשוט מדי, אנחנו יכולים לחפש תכונת צפיפות עוד יותר יעילה. מה שהוכחתי הוא שבכל שדה סדור \( \mathbb{F} \), לכל זוג איברים \( a,b\in\mathbb{F} \) קיים \( c\in\mathbb{F} \) כך ש-\( a<c<b \). עכשיו, בגלל ש-\( \mathbb{F} \) שדה סדור הוא ממציין 0 ולכן מכיל עותק של \( \mathbb{Q} \), ואני יכול להראות שהעותק הזה של \( \mathbb{Q} \) צפוף בתוך \( \mathbb{F} \) במובן הזה שאת ה-\( c \) שנמצא בין כל \( a,b\in\mathbb{F} \) אני יכול לבחור מתוך \( \mathbb{Q} \). למה ההוכחה הנוכחית לא עובדת? כי אני בונה את \( c \) שלי בתור הסכום \( \frac{a+b}{2} \), מה שנותן לי משהו שאנחנו רק יודעים עליו שהוא איבר כללי ב-\( \mathbb{F} \) ולכן לא חייב להיות רציונלי. ובאמת, עבור \( \mathbb{F} \) לא ארכימדי אני לא אוכל לקבל צפיפות של \( \mathbb{Q} \) בתוך \( \mathbb{F} \). אבל אם \( \mathbb{F} \) ארכימדי, אפשר להוכיח את זה.

הנקודה המרכזית היא שאם \( b-a>1 \), אז קל למצוא איבר רציונלי ביניהם, ולא סתם רציונלי אלא ממש מספר שלם. למה? ובכן, התכונה הארכימדית אומרת לנו שקיים \( m \) שלם כך ש-\( a<m \). יש הרבה \( m \)-ים כאלו, אבל אני יכול לבחור מתוכם את המינימלי. זה דורש נימוק בפני עצמו, אבל הנה נימוק זריז: ראשית, מכיוון שהשדה ארכימדי קיים \( n_{1} \) כך ש-\( n_{1}<a \) וגם קיים \( n_{2} \) כך ש-\( a<n_{2} \). עכשיו אפשר להסתכל על הקבוצה \( \left\{ n\in\mathbb{Z}\ |n_{1}\le n\le n_{2},a<n\right\} \). זו קבוצה סופית כי יש רק מספר סופי של שלמים בין \( n_{1} \) ל-\( n_{2} \) - בדיוק \( n_{2}-n_{1}+1 \) כאלו. כמו כן זו לא קבוצה ריקה, כי לפחות עבור \( n_{2} \) אנחנו יודעים ש-\( a<n_{2} \). לכן קיים לה איבר מינימלי \( m \) (אני עוד מעט אדבר על איברים מינימליים יותר בפירוט, למי שעדיין חשדנים). ה-\( m \) הזה יקיים ש-\( a<m \) אבל \( m-1<a \).

עכשיו, נתון לי ש-\( b-a>1 \), כלומר \( a+1<b \). ניקח את \( m-1<a \), נחבר 1 לשני האגפים, ונקבל \( m<a+1<b \); קיבלנו ש-\( a<m<b \), כמו שרצינו.

זה מסיים את הוכחת הצפיפות למקרה של \( b-a>1 \). באופן כללי, אם \( a<b \) אז \( b-a>0 \) ולכן ארכימדיות נותנת לנו שקיים \( n>0 \) שלם כך ש-\( \frac{1}{b-a}<n \). נכפול את שני האגפים ב-\( b-a \) ונקבל \( 1<bn-an \), ועכשיו אני יכול להשתמש במה שהוכחתי לפני רגע ולהראות שקיים \( m \) שלם כך ש-\( an<m<bn \). לסיום אני אחלק את כל האגפים ב-\( n \) ואקבל \( a<\frac{m}{n}<b \), וסיימנו! זה לא היה קל במיוחד אבל זו תוצאה שימושית ביותר.

שלם

מה בעצם חסר?

בשלב הזה אנחנו יודעים מה זה שדה סדור, וגם יש לנו דוגמא טובה לשדה סדור שכזה: \( \mathbb{Q} \). אז מה עוד אנחנו צריכים?

ובכן, ראשית אנחנו צריכים מספרים. חסרים לנו מספרים. לא יעלה על הדעת שנסתפק במספרים שיש ב-\( \mathbb{Q} \). אם אני מצייר ריבוע עם אורך צלע 1 ומותח בו אלכסון, האורך של האלכסון הזה יהיה \( \sqrt{2} \) (נובע ממשפט פיתגורס). אבל \( \sqrt{2}\notin\mathbb{Q} \), אז חסרים לי מספרים. אני רוצה לפחות את כל השורשים \( \sqrt{n} \) לכל \( n\ge0 \). ולמה לא גם את השורשים השלישיים, \( \sqrt[3]{n} \)? ובעצם שיהיה \( \sqrt[k]{n} \) לכל \( n\ge0 \) ו-\( k>0 \). אפשר אפילו להגדיל ולומר שאני רוצה את כל המספרים האלגבריים, כלומר כל המספרים שאני יכול לקבל בתור שורשים של פולינום עם מקדמים רציונליים, אבל אני מעדיף לא ללכת לכיוון של טענות כאלו כי הן שוב מניחות שאני כבר מכיר את “העולם הרחב” של המספרים ופשוט גוזר מתוכו תת-קבוצה מעניינת, וכרגע אני רק רוצה להצביע על מספרים קונקרטיים שברור שחסרים לי. גם \( \pi \) חסר. גם \( e \) חסר. בקיצור, \( \mathbb{Q} \) ממש לא מספיק.

העניין הוא שאם אני אוסיף את כל המספרים הללו, הכל הולך ממש להסתבך. ראיתי למשל שאם אני מוסיף את \( \sqrt{2} \) ל-\( \mathbb{Q} \) ו”סוגר” את הקבוצה כך שעדיין אקבל שדה, אני אצטרך להוסיף את כל האיברים מהצורה \( a+b\sqrt{2} \) כך ש-\( a,b\in\mathbb{Q} \). אם אני אוסיף את \( \pi \) זה יהיה יותר בעייתי - אני אצטרך להוסיף את כל האיברים מהצורה \( a_{0}+a_{1}\pi+a_{2}\pi^{2}+a_{3}\pi^{3}+\ldots+a_{k}\pi^{k} \). אבל אפילו זה לא מספיק, כי מכיוון ש-\( \pi>1 \) אז \( 0<\pi^{-1}<1 \) ולכן אני יכול לקחת סכומים אינסופיים של חזקות שליליות של \( \pi \) ולצפות שזה יתכנס למשהו, ובעצם אני מכניס לתמונה המון שיקולים של חדו”א למרות שעדיין לא פיתחתי את החדו"א כי אין לי איפה כי החדו”א הרי מתחיל מזה שמדברים על השדה שבו האקשן הולך להתרחש. בקיצור, כל הגישה הזו של “בואו נרחיב את \( \mathbb{Q} \) עם איברים קונקרטיים” היא קצת מבורחשת, ואני לא רוצה לנקוט בה בכלל (וגם הבניות הקונקרטיות של \( \mathbb{R} \) שאראה בהמשך לא עושות את זה).

מה שאני אעשה, כמו קודם, הוא לשאול את עצמי - איזו אקסיומה חסרה לי? איזו תכונה נוספת של השדה הסדור שאני בונה תיתן לי את מה שאני צריך? וכאן מגיעות בשורות טובות נחמדות מאוד: יש אקסיומה אחת, פשוטה יחסית לניסוח מילולי ודי אינטואיטיבית מבחינת מה שהיא עושה, שהיא כל מה שחסר לי. מרגע שאוסיף אותה אקבל את \( \sqrt{2} \) ואת \( \pi \) ואת \( e \) ואת כל המספרים שחסרים לי, והשדה שאני בונה יהפוך להיות מקום ממש נחמד שבו אפשר להוכיח את כל משפטי הבסיס של החדו”א (שלא אציג בפוסט הזה אבל נראה בהמשך למה הם צריכים דווקא את האקסיומה הזו). האקסיומה המושלמת הזו נקראת אקסיומת השלמות (באנגלית משחק המילים הדלוח הזה לא עובד; היא נקראת Axiom of Completeness). הנה הניסוח שלה, ותכף אסביר מה הוא אומר: לכל קבוצה לא ריקה וחסומה מלעיל קיים חסם עליון.

מה זו קבוצה אנחנו יודעים. בהקשר שלנו יש לנו שדה \( \mathbb{F} \) ו”קבוצה” היא בסך הכל אוסף של איברים מתוכו, מה שמסומן ב-\( A\subseteq\mathbb{F} \). הקבוצה הריקה מסומנת ב-\( \emptyset \) אז כדי להגיד שקבוצה לא ריקה אנחנו כותבים \( A\ne\emptyset \). החלק הבאמת מעניין בהגדרה הוא זה שמערב את המילה “חסם” להטיותיה השונות.

חסמים

קבוצה חסומה זה כבר עניין של הכנסת יחס הסדר \( \le \) לתמונה. אנחנו אומרים ש-\( A \) חסומה מלעיל (“חסומה מלמעלה”) אם קיים \( b\in\mathbb{F} \) כך שלכל \( a\in A \) מתקיים \( a\le b \). יש כמובן גם הגדרה מקבילה עבור חסם מלמטה: אומרים ש-\( A \) חסומה מלרע אם קיים \( b\in\mathbb{F} \) כך שלכל \( a\in A \) מתקיים \( b\le a \), ואנחנו אומרים ש-\( A \) חסומה אם היא חסומה גם מלעיל וגם מלרע (למרות שבטח לפעמים יתפקשש לי סתם “חסומה” גם על קבוצה שחסומה רק מכיוון אחד). הנה כמה דוגמאות פשוטות עבור המקרה של \( \mathbb{F}=\mathbb{Q} \): הקבוצה \( A=\mathbb{N} \) היא חסומה מלרע (על ידי 0, למשל) אבל לא חסומה מלעיל. לעומת זאת הקבוצה \( \left\{ \frac{1}{n}\ |\ n\in\mathbb{N}^{+}\right\} \) (\( \mathbb{N}^{+} \) פירושו הטבעיים פרט ל-0, ולא משנה אם בהגדרה שלנו הטבעיים כוללים את 0 או לא) חסומה גם מלרע (על ידי 0 שוב) וגם מלעיל (על ידי 1). שימו לב להבדל בין שני החסמים: בעוד ש-1 הוא איבר של הקבוצה (\( 1=\frac{1}{1} \)), 0 הוא לא איבר של הקבוצה. על 1 אנחנו אומרים שהוא גם איבר מקסימלי של הקבוצה, אבל מה נגיד על 0? ובכן, נגיד שהוא חסם תחתון, אבל אני מקדים את המאוחר.

ראשית בואו נדבר על מינימום ומקסימום. אם \( A \) קבוצה, וקיים \( a\in A \) כך ש-\( b\le a \) לכל \( b\in A \) אז אומרים ש-\( a \) הוא המקסימום של \( A \) ומסמנים \( a=\max A \). באופן דומה, אם קיים \( a\in A \) כך ש-\( a\le b \) לכל \( b\in A \) אז אומרים ש-\( a \) הוא המינימום של \( A \) ומסמנים \( a=\min A \). לקבוצה יכול להיות רק מקסימום יחיד, כי אם \( a,a^{\prime} \) שניהם מקיימים את ההגדרה אז בגלל ששניהם איברים בקבוצה, מתקיים גם \( a\le a^{\prime} \) וגם \( a^{\prime}\le a \) ומאנטיסימטריות נובע ש-\( a=a^{\prime} \), ובאופן דומה גם המינימום הוא יחיד, אם הוא קיים. אבל הוא לא חייב להיות קיים, ובואו נראה מה יכול להשתבש.

ראשית, אם \( A=\emptyset \) אז לא יכול להיות בה מקסימום מהטעם הפשוט שמקסימום חייב להיות איבר בקבוצה וזה קצת קשה עבור קבוצה בלי איברים. שנית, אם \( A \) לא חסומה מלעיל אז מן הסתם לא יהיה לה מקסימום, כי אם אין בכלל מישהו שגדול או שווה לכל אברי הקבוצה, ברור שלא יהיה מישהו שהוא גם בקבוצה וגם גדול או שווה לכל איבריה. אבל גם בלי שתי הבעיות הברורות האלו, עדיין יכולות להיות קבוצות שהן לא ריקות, חסומות מלעיל ואין להן מקסימום. הנה דוגמא - הקבוצה

\( \left\{ 0.9,0.99,0.999,\ldots\right\} \)

אפשר לחשוב על האיברים בקבוצה הזו כאילו הם עולים ועולים, \( 0.9<0.99<0.999<\ldots \), אבל הם אף פעם לא עוברים את 1. מצד שני, הם גם לא מגיעים אל 1, כי כל איבר בקבוצה הזו הוא מהצורה \( 1-\frac{1}{10^{n}} \) עבור \( n\ge1 \), ולכן תמיד קטן מ-1. אם הייתי מוסיף את 1 לקבוצה, אז הוא היה האיבר המקסימלי שלה; אבל הוא לא שם.

שימו לב שהסיטואציה הזו דרשה ממני קבוצה עם אינסוף איברים. אם יש קבוצה לא ריקה עם מספר סופי של איברים, תמיד קיים לה מקסימום. הנה הוכחה פשוטה: לקבוצה בת איבר אחד יש מקסימום - האיבר האחד הזה. נניח באינדוקציה שלקבוצה בת \( n \) איברים יש תמיד מקסימום; תהא \( A=\left\{ a_{1},\ldots,a_{n},a_{n+1}\right\} \) קבוצה עם \( n+1 \) איברים. אז לקבוצה \( A^{\prime}=\left\{ a_{1},\ldots,a_{n}\right\} \) יש מקסימום, \( b=\max A^{\prime} \). עכשיו, אם \( a_{n+1}>b \) אז קל לראות ש-\( \max A=a_{n+1} \) ואחרת קל לראות ש-\( \max A=b \). זה מוכיח פורמלית את הטיעון שהשתמשתי בו קודם, כשהוכחתי ש-\( \mathbb{Q} \) היא קבוצה צפופה ב-\( \mathbb{F} \).

עכשיו אפשר סוף סוף לסיים את הגדרת אקסיומת השלמות. כזכור, היא אומרת “לכל קבוצה לא ריקה וחסומה מלעיל קיים חסם עליון” אז רק נשאר להסביר מה זה חסם עליון, וזה קל: זה החסם מלעיל המינימלי של הקבוצה אם הוא קיים. באופן דומה מגדירים חסם תחתון בתור החסם מלרע המקסימלי, אם הוא קיים. לשני אלו יש שמות שאני מחבב קצת יותר מאשר “חסם עליון” (שלטעמי הוא תרגום לא טוב של least upper bound כי החלק של ה-least התפספס) - סופרמום לחסם עליון ואינפימום לחסם תחתון. והם מוגדרים פורמלית כך:

\( \sup A=\min\left\{ b\in\mathbb{F}\ |\ \forall a\in A:a\le b\right\} \)

\( \inf A=\max\left\{ b\in\mathbb{F}\ |\ \forall a\in A:b\le a\right\} \)

בואו נדבר על ההגדרה של סופרמום (הדיון על אינפימום יהיה זהה, אבל מעצבן להתייחס לשניהם בבת אחת). ההגדרה של סופרמום דורשת לקחת מינימום על קבוצת כל החסמים העליונים של \( A \). ראינו כבר שלקיחת מינימום היא פעולה “מסוכנת” כי הוא עשוי לא להיות קיים, וראינו שלוש בעיות אפשריות: ראשית, אם הקבוצה שעליה לוקחים מינימום היא ריקה - במקרה שלנו זה אומר שאין ל-\( A \) חסמים מלעיל, כלומר שהיא לא חסומה. אז אוקיי, \( \sup A \) לא מוגדר אם \( A \) לא חסומה מלעיל, נשמע הגיוני.

הבעיה השניה היא אם הקבוצה שעליה לוקחים מינימום היא לא חסומה מלרע. זה אומר שלכל \( b \), לא משנה כמה קטן, עדיין תתקיים התכונה שלכל \( a\in A \) מתקיים \( a\le b \). זה לא ממש הגיוני, כי אם ניקח \( b=a-1 \) עבור \( a\in A \) כלשהו נקבל מישהו שהוא כבר לא חסם מלעיל של כל \( A \). כלומר, סיטואציה כזו יכולה לצוץ רק אם \( A \) ריקה. כש-\( A \) ריקה, התנאי “לכל \( a\in A \) מתקיים \( a\le b \)” מתקיים תמיד, לכל \( b \); זה מה שנקרא במתמטיקה “נכון באופן ריק” (כדי לראות למה זה ככה, שווה לחשוב על הטענה השקולה לוגית: “לא קיים \( a\in A \) כך ש-\( b<a \)”; ברור שאם \( A \) ריקה אז באמת לא קיים כזה). אז אוקיי, \( \sup A \) לא מוגדר אם \( A \) ריקה, נשמע הגיוני.

מה שאקסיומת השלמות אומרת הוא שאלו שתי הבעיות היחידות שיכולות להיווצר, ושבכל מקרה אחר, יהיה ל-\( A \) סופרמום. כדי להבין למה זה כל כך חזק, ואיך זה פותר לנו בעיות ו”יוצר” לנו מספרים כמו \( \sqrt{2} \), בואו נראה את הדוגמא הקלאסית - הקבוצה \( A=\left\{ q\in\mathbb{Q}\ |\ q^{2}\le2\right\} \).

האם הקבוצה הזו לא ריקה? בוודאי, \( 0\in A \). האם הקבוצה הזו חסומה מלעיל? בוודאי, \( 2\in A \) כי אם \( q>2 \) אז \( q^{2}>4 \) ומן הסתם לא מתקיים \( q^{2}<2 \). מכאן שקיים לקבוצה הזו סופרמום. מי הוא יהיה? ובכן, אם ניקח את אברי \( q \) ונגדיל אותם עוד ועוד עד שיהיה שוויון, \( q^{2}=2 \), אז נקבל \( q=\sqrt{2} \) ולכן האינטואיציה היא ש-\( \sup A=\sqrt{2} \), אבל צריך להיזהר מאוד כאן: \( \sqrt{2} \) הוא לא מספר רציונלי, ולכן הוא לא איבר של \( A \), אז עדיין צריך לשלול את האפשרות שיש חסם מלעיל קטן יותר ל-\( A \). למרבה השמחה, קל לשלול את זה. ניקח \( r \) כלשהו כך ש-\( r<\sqrt{2} \). עכשיו אפשר להשתמש בתכונת הצפיפות של הרציונליים שהוכחתי קודם ולקבל שקיים \( q\in\mathbb{Q} \) כך ש-\( r<q<\sqrt{2} \). בפרט \( q^{2}<2 \) ולכן \( q\in A \), ולכן \( r \) לא יכול להיות חסם מלעיל של \( A \), וזה לכל \( r<\sqrt{2} \). בנוסף, ברור ש-\( \sqrt{2} \) עצמו הוא חסם מלעיל שכזה, כי אם \( q>\sqrt{2} \) אז \( q^{2}>2 \) ולכן \( q\notin A \). זה מוכיח ש-\( \sup A=\sqrt{2} \).

דוגמא בעזרת שורש 2

עכשיו אני רוצה לסבך עוד יותר את העניינים, ואלו שאין להם כוח לנקודה העדינה שאני מתעקש עליה כאן מוזמנים לדלג. ההוכחה שהראיתי עכשיו חייתה “בתוך” \( \mathbb{R} \). היא הניחה ש-\( \sqrt{2} \) קיים ואפשר להשתמש בצפיפות הרציונליים יחד איתו. אבל בואו נניח עכשיו שאנחנו עוברים לחיות ביקום \( \mathbb{Q} \) ולא יודעים על שום דבר מחוצה לו, ובפרט \( \sqrt{2} \) לא קיים מבחינתנו. האם יש דרך להוכיח שלקבוצה \( A \) במקרה הזה פשוט לא יהיה סופרמום? אחרת \( A \) היא לא דוגמא מעניינת כל כך - היא לא מראה לנו בעיה שיש ב”סתם” שדה סדור ושדה סדור שלם פותר.

אז בואו נוכיח שאין ל-\( A \) סופרמום ב-\( \mathbb{Q} \), עם הוכחה שמשתמשת רק ב-\( \mathbb{Q} \). ראשית, בואו ניקח \( 0<r\in\mathbb{Q} \) כך ש-\( r^{2}>2 \) ונראה שלא ייתכן ש-\( r=\sup A \); נעשה את זה על ידי מציאת \( d<r \) שהוא חסם מלעיל של \( A \) - ובשביל זה מספיק למצוא \( d<r \) כך ש-\( d^{2}>2 \) כי אז לכל \( q\in A \) שמקיים \( q>0 \) יתקיים \( q^{2}<d^{2} \) וראינו שאפשר להסיק מזה \( q<d \) (אני לא טורח לטפל ב-\( r \) שלילי כי אם \( r<0 \) הוא בוודאי לא חסם מלעיל של \( A \) שכוללת את 0).

איך אני אמצא את \( d \) ואעשה את זה בצורה שלא תהיה טכנית ויבשה? ובכן, בואו נחשוב על הסיטואציה בתור נסיון לקרב את \( \sqrt{2} \) באמצעות שיטת הקירוב היפהפיה של הרון מאלכסנדריה. הרעיון של השיטה הוא זה: נניח שאנחנו רוצים למצוא שורש למספר \( N \). בואו נבנה סדרה \( a_{1},a_{2},a_{3},\ldots \) של קירובים לשורש הזה. נתחיל עם מספר כלשהו \( a_{1} \) שיהיה קירוב גס כלשהו של שורש \( N \). למשל, עבור \( N=2 \) אפשר לקחת \( a_{1}=4 \). עכשיו נתחיל לשפר את הקירוב על ידי הפעלה נשנית של הכלל הבא:

\( a_{n+1}=\frac{1}{2}\left(a_{n}+\frac{N}{a_{n}}\right) \)

הרעיון פה: ניקח את הקירוב הנוכחי שלנו, ונחלק את \( N \) בו. אם הקירוב הנוכחי היה יוצא בדיוק \( \sqrt{N} \) אז החלוקה של \( N \) בקירוב הייתה יוצאת \( \sqrt{N} \) בעצמה. אחרת, יצא לנו מספר קצת שונה - אם למשל \( a_{n} \) הוא גדול מדי מכדי להיות השורש, אז \( \frac{N}{a_{n}} \) ייצא קטן מדי מכדי להיות השורש. ועכשיו אומר הרון - אוקיי, בואו ניקח ממוצע חשבוני של שני המספרים הללו - נראה לי שהוא יהיה קרוב יותר לשורש. עבור הדוגמא שלנו עם \( N=2 \) ו-\( a_{1}=4 \) נקבל \( a_{2}=\frac{1}{2}\left(4+\frac{1}{2}\right)=\frac{9}{4}=2.25 \) וזה יותר טוב! אם נמשיך את הסדרה, נקבל התכנסות מהירה בצורה מפתיעה אל \( \sqrt{2} \):

\( 4,2.25,1.569444\ldots,1.42189\ldots,1.414234\ldots \)

אפשר לחשוב על השיטה הזו בתור מקרה פרטי של אלגוריתם ניוטון-רפסון והזכרתי אותה פה בעבר בפוסט על המעשה המופלא בקבוע המסתורי 0x5f3759df, אבל נראה לי שכבר סטיתי מספיק מהעניין. הפואנטה שלי: אני רוצה בהינתן \( 0<r\in\mathbb{Q} \) כך ש-\( r^{2}>2 \) לקבל \( d<r \) כך שעדיין \( 2<d^{2} \) - זה בדיוק מה ששיטת הרון תיתן לי. אני אגדיר

\( d=\frac{1}{2}\left(r+\frac{2}{r}\right)=\frac{r}{2}+\frac{1}{r} \)

ואקבל \( d \) רציונלי כי \( r \) היה רציונלי. בואו נראה שהוא עובד.

דבר ראשון, קל לראות ש-\( d<r \), כי מכיוון ש-\( 2<r^{2} \) אז נחלק ב-\( 2r \) ונקבל \( \frac{1}{r}<\frac{r}{2} \) ולכן

\( d=\frac{r}{2}+\frac{1}{r}<\frac{r}{2}+\frac{r}{2}=r \)

שנית,

\( d^{2}=\left(\frac{r}{2}+\frac{1}{r}\right)^{2}=\frac{r^{2}}{4}+1+\frac{1}{r^{2}} \)

אנחנו רוצים להראות ש-\( d^{2}>2 \), אז מספיק להראות שאם \( r^{2}>2 \) אז \( \frac{r^{2}}{4}+\frac{1}{r^{2}}>1 \). קל לראות את זה בשיטות של תיכון אם מסמנים \( x=r^{2} \), מקבלים את אי השוויון \( \frac{x}{4}+\frac{1}{x}>1 \) שעבור \( x>0 \) מתורגם לאי השוויון \( x^{2}-4x+4>0 \). אגף שמאל הוא פרבולה “צוחקת” שנקודת החיתוך הימנית שלה עם ציר \( x \) היא \( x=2 \) ולכן היא חיובית לכל \( x>2 \), שזה מה שרצינו.

כל הזוועה הזו הראתה לנו ש-\( r \) הוא לא חסם עליון של \( A \) כי אפשר למצוא חסם מלעיל קטן יותר, \( d \), אבל התחלנו מההנחה ש-\( r^{2}>2 \). אולי בכלל החסם הטוב ביותר מקיים \( r^{2}<2 \)? כלומר, הוא איבר של \( A \) בעצמו? אולי יש ב-\( A \) איבר מקסימלי?

במקרה הזה לנסות להשתמש בנוסחת הרון לא עובד (אם אני אגדיר \( d=\frac{r}{2}+\frac{1}{r} \) אני אקבל \( d^{2}>2 \)) וכבר אין לי רעיונות לדברים נחמדים להראות אז בואו נעשה את זה בכוח: נגדיר \( d=r+\varepsilon \) כשהרעיון הוא שנקבע את \( \varepsilon \) להיות מספר חיובי קטן ותכף נראה כמה קטן. אז

\( d^{2}=r^{2}+2r\varepsilon+\varepsilon^{2} \)

ולכן כדי שיתקיים \( d^{2}<2 \) צריך שיתקיים \( \left(2r+\varepsilon\right)\varepsilon<2-r^{2} \). אם אני אוודא ש-\( \varepsilon<r \) אז מספיק לי אפילו למצוא \( \varepsilon \) שעבורו \( \left(2r+\varepsilon\right)\varepsilon<3r\varepsilon<2-r^{2} \). עכשיו, \( 2-r^{2} \) הוא מספר קבוע וגם \( 3r \) הוא מספר קבוע, אז אפשר להשתמש בארכימדיות של \( \mathbb{Q} \) כדי למצוא \( \varepsilon \) מתאים.

סיום זריז לפני הגרנד פינאלה

אם לסכם את מה שראינו בדוגמא - ב-\( \mathbb{Q} \) יש קבוצות לא ריקות וחסומות בלי חסם עליון, אבל כאלו שיוצרות אצלנו תחושה חזקה שאמור להיות להן חסם עליון. שאפילו בלי להכיר את \( \mathbb{R} \), יש איזה איבר קונקרטי אחד שאנחנו מצפים שיהיה החסם העליון שלהן, וזה שאין כזה - זה מרגיש לנו כמו “חור” בציר המספרים, שתכונת השלמות באה לסתום.

זו אינטואיציה טובה; היא תוביל לאחת משתי הבניות הפורמליות של הממשיים שאני הולך להציג, זו של חתכי דדקינד. כרגע, כזכור, אני עדיין לא בונה שום דבר - אני רק שואל את עצמי אילו תכונות אני רוצה שיהיו לממשיים. זה מעביר אותנו ישירות אל החלק הבא והאחרון.

ה

מה אני רוצה עכשיו?

ההגדרה שלי בתחילת הפוסט הייתה כזכור “השדה הסדור השלם”. מה זה שדה - ראינו. מה זה שדה סדור - ראינו. מה זה שדה סדור שלם - ראינו. מה שעדיין לא ברור הוא התפקיד של האות ה’ בביטוי הזה. אות קטנה, משמעות גדולה: כשאני מדבר על “השדה הסדור השלם” הכוונה היא שקיים שדה כזה והוא יחיד. כלומר, כשאני משתמש בהגדרה הזו אני טוען טענת קיום ויחידות, שהיא משהו שצריך להוכיח. במובן הזה ההגדרה שלי היא יותר מסתם הגדרה - היא גם הבטחה.

מצד שני, זה מרגיש שאני קצת מרמה כי אני לא באמת מסביר עד הסוף איך אפשר לקבל לידיים את האובייקט שאני מגדיר. כאמור, זה דבר די סטנדרטי במתמטיקה; אנחנו צריכים להבדיל בין הגדרה אקסיומטית שמתארת תכונות רלוונטיות של אובייקטים שאחר כך אפשר להשתמש בהן כדי להוכיח תכונות נוספות של האובייקטים, וההוכחה תהיה תקפה לכל אובייקט שמקיים את התכונות - ובין מה שאני מעדיף לקרוא לו בנייה שמתאר איך מייצרים את האובייקט מתוך אובייקטים פשוטים יותר.

ראינו סוג של בניה בפוסט הקודם, עם הייצוגים העשרוניים; זו לא הייתה בניה מלאה כי הגדרתי את האובייקטים של הקבוצה אבל לא את פעולות החיבור והכפל ולא את האופן שבו מוגדר יחס הסדר (כל אלו לא טריוויאליים). אני אראה בפוסט הבא שתי בניות נוספות, שאותן אציג עד הסוף. יותר מזה - שתי הבניות לא הולכות לבנות את אותו הדבר, במובן זה שאחת מהן תיצור לנו אוסף של קבוצות של רציונליים, ואילו השניה תיצור אוסף של מחלקות שקילות של סדרות של רציונליים. אלו שני אובייקטים שונים, מה שמעלה את השאלה - מי מביניהם יהיה \( \mathbb{R} \) “האמיתי”? התשובה היא ששניהם הם \( \mathbb{R} \) האמיתי, במובן זה ששניהם מקיימים את התכונות המהותיות שאנחנו מצפים להן מ-\( \mathbb{R} \) - שניהם יהיו שדה סדור שלם ויותר מכך - שביחס לתכונות הללו הם יהיו בדיוק אותו אובייקט עד כדי שינוי שמות האיברים. זו המהות של טיעון ה”יחידות”, ואותו אני אוכל להוכיח כאן, אפילו לפני שאני מציג בניות אלו ואחרות. פורמלית, אני אוכיח שאם \( \mathbb{F}_{1},\mathbb{F}_{2} \) הם שני שדות סדורים שלמים, אז הם איזומורפיים, עם ההגדרה הבאה של איזומורפיזם:

\( f:\mathbb{F}_{1}\to\mathbb{F}_{2} \) הוא איזומורפיזם של שדות סדורים אם \( f \) פונקציה חד-חד-ערכית ועל ומתקיים

  • \( f\left(x+y\right)=f\left(x\right)+f\left(y\right) \)
  • \( f\left(x\cdot y\right)=f\left(x\right)\cdot f\left(y\right) \)
  • \( x<y \) אם ורק אם \( f\left(x\right)<f\left(y\right) \)

אני אזכיר מה “חד-חד-ערכית” ו”על” אומרים (ויש לי גם פוסט): \( f:A\to B \) היא חח”ע אם \( f\left(x\right)=f\left(y\right) \) גורר \( x=y \), כלומר אם קלטים שונים מתמפים לפלטים שונים. \( f:A\to B \) היא על אם לכל \( b\in B \) קיים \( a\in A \) כך ש-\( f\left(a\right)=b \), כלומר כל איבר של \( B \) מתקבל כפלט של \( f \) על משהו מ-\( A \). זה שפונקציה היא גם חח”ע וגם על אומר שאפשר לחשוב עליה כאילו היא מסדרת את אברי \( A \) ו-\( B \) בזוגות-זוגות - לכל איבר של \( a \) יש בן זוג אחד ויחיד מ-\( b \), וההפך. זה מאפשר לנו לדמיין ש-\( B \) היא פשוט “אברי \( A \) עם שמות אחרים”: לוקחים את \( A \), מחליפים את השם של כל איבר \( a\in A \) ב-\( f\left(a\right) \), מקבלים את \( B \).

אם על \( A,B \) יש עוד מבנה מלבד סתם איברים, האשליה הזו של שינוי השם עשוי להתנפץ. למשל, אם \( A=\mathbb{N} \) ו-\( B=\mathbb{Z} \) אז פונקציה חח”ע ועל \( f:A\to B \) היא \( f\left(n\right)=\begin{cases} \frac{n}{2} & n\equiv_{2}0\\ -\frac{n+1}{2} & n\equiv_{2}1 \end{cases} \). מה ש-\( f \) עושה הוא להעביר את סדרת הטבעיים \( 0,1,2,3,\ldots \) אל סדרת השלמים \( 0,-1,1,-2,2,\ldots \). זו התאמה חח”ע ועל, אבל היא ממש לא מתנהגת יפה עם המבנה הנוסף שיש לנו על \( \mathbb{N} \). למשל, \( 1+1=2 \) ולכן אם \( f \) היא בסך הכל שינוי שם היינו מצפים שיתקיים \( f\left(1\right)+f\left(1\right)=f\left(2\right) \). אבל \( f\left(2\right)=1 \) ואילו \( f\left(1\right)=-1 \) ולכן \( f\left(1\right)+f\left(1\right)=-2=f\left(3\right)\ne f\left(2\right) \), כך שהאשליה שיש כאן שינוי שמות ותו לא מתנפצת ברגע שבו אנחנו מצפים משינוי השמות לשחק יפה עם המבנה הנוסף שיש על הקבוצות.

מה הולכים להוכיח ואיך

על שדה סדור יש שלושה מבנים: פעולת החיבור, פעולת הכפל ויחס הסדר \( < \) (או באופן שקול, הקבוצה \( P \); במקום הדרישה השלישית היינו יכולים לדרוש \( f\left(P_{1}\right)=P_{2} \)). האתגר שלי יהיה להציג פונקציה שמשחקת יפה עם כולם.

הנה בגדול הרעיון:

  • ראשית נראה שכל שדה סדור מכיל עותק של \( \mathbb{Q} \) וששני העותקים הללו איזומורפיים.
  • אחר כך נראה שכל שדה סדור שלם הוא ארכימדי.
  • המסקנה מזה תהיה שאפשר להציג כל איבר בשדה בתור \( \sup \) של קבוצה של רציונליים, וזה יאפשר לנו להרחיב את האיזומורפיזם של הרציונליים לאיזומורפיזם של כל השדה.

בעצם, בואו נתחיל מזה שכל שדה סדור שלם הוא ארכימדי, זו תוצאה קלילה להוכחה וככה היא לא תקטע את הרצף של מה שנעשה אחר כך. ניקח שדה סדור שלם \( \mathbb{F} \) כלשהו. כבר ראינו שבגלל שהשדה סדור, הוא חייב להיות ממציין 0, כלומר כל האיברים \( 1,1+1,1+1+1,\ldots \) קיימים ושונים זה מזה - במילים אחרות, יש בתוך \( \mathbb{F} \) עותק של \( \mathbb{Z} \). עכשיו, אם \( \mathbb{F} \) לא ארכימדי, מה זה אומר? ארכימדיות פירושה שלכל \( a\in\mathbb{F} \) קיים \( n\in\mathbb{Z} \) כך ש-\( a<n \).

אם ניקח את השלילה של הטענה הזו נקבל שקיים \( a\in\mathbb{F} \) כך שלכל \( n\in\mathbb{Z} \) מתקיים \( n\le a \). במילים אחרות, \( a \) הוא חסם מלעיל של \( \mathbb{Z} \), והשלמות של \( \mathbb{F} \) אומרת ש-\( d=\sup\mathbb{Z} \) קיים. עכשיו, בואו ניקח \( n\in\mathbb{Z} \) כלשהו. מכיוון שגם \( n+1\in\mathbb{Z} \), אנחנו יודעים ש-\( n+1<d \), כלומר \( n<d-1 \), וזה נכון לכל \( n\in\mathbb{Z} \) ולכן גם \( d-1 \) חסם מלעיל של \( \mathbb{Z} \), בסתירה למינימליות של \( d \). כלומר - בשדה סדור, או ש-\( \mathbb{Z} \) לא חסומה (כלומר, השדה ארכימדי) או שהשדה לא שלם, אין עוד אפשרויות.

עכשיו בואו נדבר על \( \mathbb{Q} \). ראינו כבר במהלך הפוסט שיש ב-\( \mathbb{F} \) קבוצה שזהה ל-\( \mathbb{Q} \), אבל בואו נעשה את זה שוב, הכי מסודר שאפשר. מה שאקסיומות השדה נותנות לנו הוא קיום של איברים \( 0,1\in\mathbb{F} \). שימו לב שהאיברים הללו הם לא המספרים 0,1; הם סתם שני איברים של \( \mathbb{F} \) שזכו לסימון מיוחד. אז בואו כרגע ניתן להם סימון אחר: את האדיש החיבורי אסמן ב-\( \mathcal{O} \) ואת האדיש הכפלי אסמן ב-\( \mathcal{I} \). מה שאני יודע לומר הוא שלכל \( a\in\mathbb{F} \) מתקיים \( a+\mathcal{O}=a \) ו-\( a\cdot\mathcal{I}=a \). עכשיו בואו נבנה מזה את \( \mathbb{Q} \).

בונים את הרציונליים (מתוך השדה הקיים)

ראשית, לכל מספר טבעי \( n\in\mathbb{N} \) בואו נגדיר איבר \( \mathcal{Z}_{n}\in\mathbb{F} \). נעשה את זה רקורסיבית: \( \mathcal{Z}_{0}=\mathcal{O} \) ואם \( \mathcal{Z}_{n} \) כבר הוגדר, נגדיר \( \mathcal{Z}_{n+1}=\mathcal{Z}_{n}+\mathcal{I} \).

עכשיו אני רוצה לטעון ש-\( \mathcal{Z}_{k}+\mathcal{Z}_{n}=\mathcal{Z}_{k+n} \). ההוכחה תכה אותנו בכזה הלם של טרחנות שנוותר על המשך ההוכחות בסגנון, כי זה הכל אותו דבר (מי שמכירים את ההגדרות הפורמליות של טבעיים ירגישו בוודאי בבית עם ההוכחה הזו). אני אוכיח את הטענה באינדוקציה על \( n \). אם \( n=0 \) אז על פי הגדרה, \( \mathcal{Z}_{0}=\mathcal{O} \) ולכן

\( \mathcal{Z}_{k}+\mathcal{Z}_{0}=\mathcal{Z}_{k}+\mathcal{O}=\mathcal{Z}_{k}=\mathcal{Z}_{k+0} \)

ואם הטענה כבר הוכחה עבור \( n \) ואנחנו רוצים להוכיח אותה עבור \( n+1 \), נשתמש בכך ש-\( \mathcal{Z}_{n+1}=\mathcal{Z}_{n}+\mathcal{I} \) ונקבל

\( \mathcal{Z}_{k}+\mathcal{Z}_{n+1}=\mathcal{Z}_{k}+\left(\mathcal{Z}_{n}+\mathcal{I}\right)=\left(\mathcal{Z}_{k}+\mathcal{Z}_{n}\right)+\mathcal{I}= \)

\( =\mathcal{Z}_{k+n}+\mathcal{I}=\mathcal{Z}_{\left(k+n\right)+1}=\mathcal{Z}_{k+\left(n+1\right)} \)

אני לא חושב שקיימת אפשרות להיות יותר פדנט מזה, אבל לא הכל נורא! עכשיו אנחנו רואים יפה וברור שבהוכחה הזו משתמשים באסוציאטיביות החיבור (“חוק הקיבוץ”) גם ב-\( \mathbb{F} \) וגם ב-\( \mathbb{N} \). בלי אסוציאטיביות, שום דבר לא היה עובד! אנחנו לא תמיד מעריכים עד כמה היקום היה קורס בלי אסוציאטיביות.

בכל מקרה, עכשיו אני ארשה לעצמי לנופף ידיים בפראות בהמשך. לא קשה להוכיח גם ש-\( \mathcal{Z}_{k}\cdot\mathcal{Z}_{n}=\mathcal{Z}_{k\cdot n} \) ולא קשה גם להוכיח ש-\( \mathcal{Z}_{k}<\mathcal{Z}_{n} \) אם ורק אם \( k<n \), הכל עם אינדוקציות מזעזעות. לכן מה שעשיתי כאן בעצם היה להגדיר פונקציה \( f:\mathbb{N}\to\mathbb{F} \) על ידי \( f\left(n\right)=\mathcal{Z}_{n} \), והפונקציה הזו מקיימת את שלוש הדרישות שלי:

  • \( f\left(n+k\right)=f\left(n\right)+f\left(k\right) \)
  • \( f\left(n\cdot k\right)=f\left(n\right)\cdot f\left(k\right) \)
  • \( n<k \) אם ורק אם \( f\left(n\right)<f\left(k\right) \)

בנוסף, זו פונקציה חח”ע, כי אם \( \mathcal{Z}_{n}=\mathcal{Z}_{k} \) עבור \( k<n \) אז נשתמש בטענה הנכונה תמיד \( \mathcal{Z}_{k}+\mathcal{Z}_{n-k}=\mathcal{Z}_{n} \), נעביר את \( \mathcal{Z}_{k} \) אגף, נשתמש ב-\( \mathcal{Z}_{n}=\mathcal{Z}_{k} \) ונקבל \( \mathcal{Z}_{n-k}=\mathcal{O} \), ומכיוון ש-\( n-k>0 \) המסקנה היא שקיבלנו סכום של \( \mathcal{I} \)-ים שמסתכם לאפס - זאת בסתירה למה שכבר ראינו, שהשדה הוא ממציין 0.

המסקנה היא ש-\( f \) היא פונקציית “אותו הדבר רק בסימון אחר” מצויינת, ולכן אפשר לנטוש את כל פיאסקו הכתיבה של דברים בתור \( \mathcal{Z}_{n} \) וכאלו ופשוט לכתוב \( 0,1,2\ldots,n,\ldots \) עבור האיברים שהגדרתי פה ולהתייחס אליהם כאילו הם “באמת” הטבעיים.

מרגע שיש לנו את זה, אפשר להרחיב את הגדרת \( f \). ראשית, נגדיר אותה על כל \( \mathbb{Z} \), כלומר צריך להסביר איך היא מתנהגת גם על השליליים, איברים מהצורה \( -n \) כך ש-\( n\in\mathbb{N} \): \( f\left(-n\right)=-n \). זו נראית הגדרה כמעט ריקה, אבל העיקרון לא טריוויאלי: אנחנו מזמנים את \( \mathcal{Z}_{n} \), ואז מפעילים את האקסיומה של \( \mathbb{F} \) שאומרת שקיים לו נגדי, שמסומן \( -\mathcal{Z}_{n} \), וזה מה ש-\( f \) תחזיר - רק שכאמור, כבר הפסקתי עם השטות של כתיבת \( \mathcal{Z}_{n} \) ואני כותב \( n \) וזהו.

גם על ההגדרה הזו צריך להוכיח שהיא מקיימת את שלוש התכונות שלמעלה. זה עובד. תסמכו עלי. בואו נרוץ אל הרחבת \( f \) לכל \( \mathbb{Q} \). מה שמדגדג לומר הוא שנגדיר לכל \( a,b\in\mathbb{Z} \) כך ש-\( b\ne0 \) את ההגדרה הבאה:

\( f\left(\frac{a}{b}\right)=a\cdot b^{-1} \)

כלומר, אנחנו לוקחים את האיבר ב-\( \mathbb{F} \) שמתאים ל-\( a \) והאיבר ב-\( \mathbb{F} \) שמתאים ל-\( b \), משתמשים בזה שהאיבר שמתאים ל-\( b \) יהיה שונה מ-0 כי \( b \) שונה מאפס ו-\( f \) חח”ע, משתמשים באקסיומות השדה כדי למצוא הופכי ל-\( b \) הזה וכופלים אותו ב-\( a \). אין שום בעיה בהגדרה הזו אבל צריך לוודא שהיא מה שנקרא מוגדרת היטב כי קיימת הסכמה שאותו מספר רציונלי יניב פלטים שונים של \( f \), כתלות בייצוג שלו. כלומר, אני רוצה להראות למשל ש-\( f\left(\frac{1}{2}\right)=f\left(\frac{2}{4}\right) \). זה לא לגמרי מובן מאליו כי באגף ימין של ההגדרה אין מספרים אלא יש איברים של \( \mathbb{F} \) ולכו תדעו איזה מוזרויות יש להם, אבל למרבה המזל ההוכחה די פשוטה.

נניח שברציונליים, \( \frac{a}{b}=\frac{c}{d} \). כלומר, \( ad=bc \). זו משוואה של מספרים ב-\( \mathbb{Z} \), ולכן היא נכונה גם בתוך \( \mathbb{F} \). לכן אפשר לקחת את \( ad=bc \) בתוך \( \mathbb{F} \) ולכפול את שני האגפים ב-\( b^{-1} \) וב-\( d^{-1} \) ולקבל \( ab^{-1}=cd^{-1} \), כלומר \( f\left(\frac{a}{b}\right)=ab^{-1}=cd^{-1}=f\left(\frac{c}{d}\right) \), שזה מה שרצינו. אנחנו עדיין צריכים להוכיח ששאר התכונות של \( f \) מתקיימות - זה כאמור תרגיל טוב שאני לא הולך לעשות כאן. קיבלנו \( f:\mathbb{Q}\to\mathbb{F} \) שהיא חח”ע ומכבדת את המבנה של השדה. במתמטית קוראים לזה שיכון (להבדיל מאיזומורפיזם; כי כאן \( f \) לא על כל \( \mathbb{F} \)). מכאן ואילך אני יכול להתייחס ל-\( \mathbb{F} \) כאילו יש עותק של \( \mathbb{Q} \) שיושב בתוכה, כמו שבעצם עשיתי גם קודם.

עכשיו הגענו סוף סוף אל הפאנץ’ האחרון: יש לי שני שדות סדורים שלמים \( \mathbb{F}_{1},\mathbb{F}_{2} \). אני רוצה להגדיר \( g:\mathbb{F}_{1}\to\mathbb{F}_{2} \) שהיא חח”ע, על ומכבדת את המבנה של השדה הסדור. איך אני אעשה את זה? התשובה היא שכל אחד ואחד מהאיברים של השדות הללו הוא חסם עליון של קבוצה של רציונליים ואני הולך לבנות את \( g \) כך שהיא מעבירה את החסם העליון של קבוצה ב-\( \mathbb{F}_{1} \) אל החסם העליון של אותה קבוצה ב-\( \mathbb{F}_{2} \).

בואו ננסח את זה פורמלית. אנחנו יודעים שיש תת-שדות \( \mathbb{Q}_{1}\subseteq\mathbb{F}_{1} \) ו-\( \mathbb{Q}_{2}\subseteq\mathbb{F}_{2} \) שאיזומורפים לרציונליים ובפרט איזומורפים זה לזה, עם פונקציה \( f:\mathbb{Q}_{1}\to\mathbb{Q}_{2} \) שהיא איזומורפיזם. אני הולך להרחיב את \( f \) הזו כדי להגדיר איזומורפיזם \( f:\mathbb{F}_{1}\to\mathbb{F}_{2} \) באופן הבא: לכל \( x\in\mathbb{F}_{1} \) נגדיר קבוצה \( A_{x}\subseteq\mathbb{F}_{2} \) (כלומר, של איברים בשדה השני) על ידי

\( A_{x}=\left\{ f\left(q\right)\ |\ q\in\mathbb{Q}_{1}\wedge q<x\right\} \)

עכשיו אני אגדיר \( f\left(x\right)=\sup A_{x} \). זהו, זו כל ההגדרה - ועכשיו תגיע המהומה הגדולה מכולן, להראות שההגדרה הזו עובדת.

המהומה הגדולה מכולן

מה זה אומר, להראות שההגדרה עובדת? צריך להוכיח את כל הדברים הבאים:

  • \( f \) מוגדרת היטב (לכל קלט קיים פלט יחיד)
  • \( f \) חד-חד-ערכית
  • \( f \) על
  • \( f\left(x+y\right)=f\left(x\right)+f\left(y\right) \)
  • \( f\left(x\cdot y\right)=f\left(x\right)\cdot f\left(y\right) \)
  • \( x<y \) אם ורק אם \( f\left(x\right)<f\left(y\right) \)

ראשית צריך להראות ש-\( f \) מוגדרת היטב. יש כאן שתי סכנות: גם סכנה של הגדרה כפולה, וגם סכנה שיהיו קלטים שעבורם \( f \) לא מוגדרת. נתחיל עם ההגדרה הכפולה: הרי לקחתי פונקציה קיימת \( f:\mathbb{Q}_{1}\to\mathbb{Q}_{2} \) והגדרתי באמצעותה פונקציה חדשה \( f:\mathbb{F}_{1}\to\mathbb{F}_{2} \). אני רוצה להראות שאם \( x\in\mathbb{Q}_{1} \) אז שתי ההגדרות מסכימות זו עם זו על \( x \), כלומר ש-\( f\left(x\right)=\sup A_{x} \) (אגף שמאל הוא ההגדרה “המקורית”, אגף ימין הוא ההגדרה החדשה). אפשר ובצדק לשאול למה לא פשוט להגדיר פונקציה חדשה בעזרת \( f \) אבל לקרוא לפונקציה החדשה הזו \( g \) ואז לדלג על השלב הזה; התשובה היא שאני אסתמך על כך שהפונקציה שבניתי מרחיבה את \( f \) המקורית בהמשך ההוכחה, כשנצטרך להוכיח שהפונקציה החדשה היא על.

נתחיל עם להראות ש-\( \sup A_{x}\le f\left(x\right) \) עבור \( x\in\mathbb{Q}_{1} \). בשביל זה מספיק להראות ש-\( f\left(x\right) \) הוא חסם מלעיל של \( A_{x} \) כי הסופרמום של \( A_{x} \) קטן או שווה לכל חסם מלעיל שלה. אז ניקח איבר כללי ב-\( A_{x} \), כלומר איבר \( f\left(q\right) \) כך ש-\( q<x \), ועכשיו נשתמש בכך ש-\( f \) היא איזומורפיזם, כלומר משמרת סדר, כלומר \( f\left(q\right)<f\left(x\right) \), שהוא מה שרצינו. עכשיו, בואו נראה שלא ייתכן ש-\( \sup A_{x}<f\left(x\right) \): במקרה הזה, הצפיפות של \( \mathbb{Q}_{2} \) ב-\( \mathbb{F}_{2} \) נותנת לנו איבר \( p^{\prime}\in\mathbb{Q}_{2} \) כך ש-\( \sup A_{x}<p^{\prime}<f\left(x\right) \). במקום לעבוד עם \( p^{\prime} \) ישירות, יהיה לי כאן ובהמשך יותר קל לדבר עליו בתור \( f\left(p\right) \) עבור \( p\in\mathbb{Q}_{1} \) - אני יודע ש-\( p \) כזה קיים כי \( f \) היא איזומורפיזם ולכן פשוט \( p=f^{-1}\left(p^{\prime}\right) \).

אם כן, נתון לי \( \sup A_{x}<f\left(p\right)<f\left(x\right) \). אי השוויון \( f\left(p\right)<f\left(x\right) \) פירושו \( p<x \) (שוב, כי \( f \) איזומורפיזם ובפרט משמרת סדר), כלומר \( f\left(p\right)\in A_{x} \) על פי הגדרת \( A_{x} \) ולכן \( f\left(p\right)\le\sup A_{x} \) - סתירה לנתון \( \sup A_{x}<f\left(p\right) \). זה מראה לנו ש-\( \sup A_{x}=f\left(x\right) \).

זה עדיין לא מסיים את ההוכחה ש-\( f \) מוגדרת היטב כי יש עוד סכנה: שעבור \( x \) כלשהו, \( A_{x} \) תהיה קבוצה נטולת סופרמום. אני כמובן משתמש פה חזק בכך ש-\( \mathbb{F}_{2} \) מקיים את אקסיומת השלמות (ומתי אשתמש בה עבור \( \mathbb{F}_{1} \)?) אבל גם עם אקסיומת השלמות אני עדיין צריך להשתכנע ש-\( A_{x} \) לא ריקה (הארכימידיות של \( \mathbb{F}_{2} \) נותנת את זה מיד) וש-\( A_{x} \) חסומה. החסימות נובעת מהארכימידית של \( \mathbb{F}_{1} \), שנותנת לנו \( n \) כך ש-\( x<n \). אז \( f\left(n\right) \) הוא חסם מלעיל של \( A_{x} \), כי אם ניקח איבר כלשהו ב-\( A_{x} \) הוא מהצורה \( f\left(q\right) \) כך ש-\( q<x \) ולכן מטרנזיטיביות יחס הסדר, \( q<n \) ומכך ש-\( f \) היא איזומורפיזם נקבל \( f\left(q\right)<f\left(n\right) \). זה מסיים את הטענה ש-\( g \) מוגדרת היטב, כי ראינו שאכן \( \sup A_{x} \) קיים.

כדי לראות ש-\( f \) חח”ע, בואו ניקח \( x\ne y\in\mathbb{F}_{1} \) כלשהם ונראה ש-\( f\left(x\right)\ne f\left(y\right) \). בלי הגבלת הכלליות אני אניח ש-\( x<y \), ומהצפיפות של הרציונליים קיימים \( p_{1},p_{2}\in\mathbb{Q}_{1} \) כך ש-\( x<p_{1}<p_{2}<y \). עכשיו, \( f\left(p_{1}\right) \) הוא חסם מלעיל של \( A_{x} \), כי אם \( q<x \) אז בפרט \( q<x<p_{1} \) ולכן \( f\left(q\right)<f\left(p_{1}\right) \) (כבר ראינו לפני רגע את אותו טיעון) ולכן \( \sup A_{x}\le f\left(p_{1}\right) \) (כי הסופרמום הוא החסם מלעיל הקטן ביותר). בנוסף, \( p_{2}<y \) פירושו על פי הגדרה \( f\left(p_{2}\right)\in A_{y} \) ולכן \( f\left(p_{2}\right)\le\sup A_{y} \) ולכן

\( f\left(x\right)=\sup A_{x}\le f\left(q\right)<f\left(p\right)\le\sup A_{y}=f\left(y\right) \)

כלומר \( f\left(x\right)<f\left(y\right) \) ובפרט \( f\left(x\right)\ne f\left(y\right) \). שימו לב שבעצם הוכחנו כבר חצי מהתכונה האחרונה: הראינו שאם \( x<y \) אז \( f\left(x\right)<f\left(y\right) \). אבל למעשה, זה נותן לנו גם את החצי השני: אם \( f\left(x\right)<f\left(y\right) \) אבל \( y\le x \) אז \( f\left(y\right)\le f\left(x\right) \) וקיבלנו סתירה (כאן אנחנו מסתמכים על כך שיחס הסדר הוא מלא; עבור יחס סדר כללי לא מקבלים את שני הכיוונים ביחד).

כדי לראות ש-\( f \) על, בואו ניקח \( y\in\mathbb{F}_{2} \) כלשהו ונמצא \( x\in\mathbb{F}_{1} \) כך ש-\( f\left(x\right)=y \). לצורך כך, בואו נסתכל על הקבוצה \( B_{y}=\left\{ q\in\mathbb{Q}_{1}\ |\ f\left(q\right)<y\right\} \) - זו הגדרה שמזכירה את זו של \( A_{x} \) ולא במקרה - זה כאילו אני מנסה להגדיר פונקציה בכיוון ההפוך, מ-\( \mathbb{F}_{2} \) אל \( \mathbb{F}_{1} \), אז גם ברור מה יהיה הצעד הבא: אני ארצה להגדיר \( x=\sup B_{y} \). בשביל זה אצטרך לראות ש-\( B_{y} \) לא ריקה וחסומה. בשביל שני אלו אני אשתמש בכך ש-\( f \) היא איזומורפיזם, כלומר \( f^{-1} \) קיימת: אני אשתמש בארכימדיות של \( \mathbb{F}_{2} \) כדי לקבל איברים \( f\left(q_{1}\right)<y<f\left(q_{2}\right) \) כך ש-\( q_{1},q_{2}\in\mathbb{Q}_{1} \), ואז \( q_{1}\in B_{y} \) ולכן זו לא קבוצה ריקה, ו-\( f\left(q_{2}\right) \) יהיה חסם מלעיל של \( B_{y} \), כי אם \( q\in B_{y} \) אז \( f\left(q\right)<y<f\left(q_{2}\right) \) ולכן בגלל ש-\( f \) משמרת סדר \( f\left(q\right)<f\left(q_{2}\right) \) ייתן לנו \( q<q_{2} \).

הגדרתי את \( x \) אבל עדיין צריך להראות ש-\( f\left(x\right)=y \). האם ייתכן ש-\( f\left(x\right)<y \)? במקרה כזה, צפיפות הרציונליים תיתן לנו \( p\in\mathbb{Q}_{1} \) כך ש-\( f\left(x\right)<f\left(p\right)<y \), אבל מכיוון ש-\( f\left(p\right)<y \) הרי ש-\( p\in B_{y} \), ולכן מכיוון ש-\( x=\sup B_{y} \) אז \( p\le x \) ולכן \( f\left(p\right)\le f\left(x\right) \) (זה נובע מכך שכבר הוכחנו שאם \( a<b \) אז \( f\left(a\right)<f\left(b\right) \)) וזו סתירה לכך ש-\( f\left(x\right)<f\left(p\right) \). נשאר רק להראות שלא ייתכן \( y<f\left(x\right) \). אם זה כן היה מתקיים, אז היינו מקבלים \( f^{-1}\left(y\right)<x \), אבל \( f^{-1}\left(y\right) \) הוא בעצמו חסם מלעיל של \( B_{y} \) (כי אם \( f\left(q\right)<y \) אז \( q<f^{-1}\left(y\right) \)) ולכן \( f^{-1}\left(y\right)<x \) סותר את ההגדרה \( x=\sup B_{y} \). זה מסיים את החלק הזה של ההוכחה.

עכשיו צריך להוכיח ש-\( f\left(x+y\right)=f\left(x\right)+f\left(y\right) \). כרגיל כבר, אנחנו מניחים שזה לא המצב ולכן אפשר לכתוב \( f\left(x+y\right)<f\left(x\right)+f\left(y\right) \) או \( f\left(x+y\right)>f\left(x\right)+f\left(y\right) \) ולהתעלל בכל אחד מהמקרים הללו לחוד עם כל מני רציונליים שנדחפים בין האיברים. במקרה \( f\left(x+y\right)<f\left(x\right)+f\left(y\right) \) אני אמצא \( p\in\mathbb{Q}_{1} \) כך ש-\( f\left(x+y\right)<f\left(p\right)<f\left(x\right)+f\left(y\right) \) .

בואו נסתכל על \( f\left(x+y\right)<f\left(p\right) \). בגלל ש-\( f \) משמרת סדר, \( x+y<p \), ועכשיו נשתמש בטריק יפה. נמצא \( q_{x},q_{y}\in\mathbb{Q}_{1} \) כך ש-\( p=q_{x}+q_{y} \) ו-\( x<q_{x} \) ו-\( y<q_{y} \), באופן הבא: מכיוון ש-\( x+y<p \) אז \( x<p-y \), ולכן ניתן לבחור רציונלי \( q_{x} \) כך ש-\( x<q_{x}<p-y \). עכשיו נגדיר \( q_{y}=p-q_{x} \); \( q_{y} \) יהיה רציונלי כי \( p \) ו-\( q_{x} \) שניהם רציונליים. בנוסף, \( q_{y}=p-q_{x}>p-\left(p-y\right)=y \), כלומר קיבלתי \( x<q_{x} \) וגם \( y<q_{y} \), כמו שרציתי.

עכשיו נשתמש במספרים הללו:

\( f\left(p\right)=f\left(q_{x}+q_{y}\right)=f\left(q_{x}\right)+f\left(q_{y}\right)>f\left(x\right)+f\left(y\right) \)

וקיבלנו סתירה ל-\( f\left(p\right)<f\left(x\right)+f\left(y\right) \). המעבר השני מתבסס על כך ש-\( f \) בגרסה המצומצמת שלה היא איזומורפיזם של \( \mathbb{Q}_{1} \) ו-\( \mathbb{Q}_{2} \).

במקרה השני, \( f\left(x\right)+f\left(y\right)<f\left(x+y\right) \), עושים משהו דומה - זה מה שנקרא “תרגיל טוב” כדי לוודא שהבנו את הרעיון.

נשאר לנו רק להראות \( f\left(x\cdot y\right)=f\left(x\right)\cdot f\left(y\right) \). ראשית נוכיח את זה עבור ערכים חיוביים, \( 0<x,y \), כי כאן נמצא עיקר הרעיון. כמו קודם, אני אניח שאין שוויון ואטפל במקרה \( f\left(xy\right)<f\left(x\right)f\left(y\right) \) והמקרה השני יהיה “תרגיל טוב”. אני אמצא \( p\in\mathbb{Q}_{1} \) כך ש-\( f\left(xy\right)<f\left(p\right)<f\left(x\right)f\left(y\right) \) ואז אמצא \( q_{x},q_{y}\in\mathbb{Q}_{1} \) כך ש-\( x<q_{x},y<q_{y} \) ו-\( q_{x}q_{y}=p \) , כך שאני אקבל

\( f\left(p\right)=f\left(q_{x}q_{y}\right)=f\left(q_{x}\right)f\left(q_{y}\right)>f\left(x\right)f\left(y\right) \)

וזו סתירה ל-\( f\left(p\right)<f\left(x\right)f\left(y\right) \).

נשאר רק למצוא את \( q_{x},q_{y} \) הללו. \( xy<p \) ולכן \( x<\frac{p}{y} \) - אבל שימו לב שכאן נזקקתי להנחה ש-\( 0<y \) אחרת זה לא היה עובד (הנחה שלא הייתי צריך במקרה של חיבור, כשאמרתי ש-\( x<p-y \)). עכשיו אפשר רציונלי \( q_{x} \) כך ש-\( x<q_{x}<\frac{p}{y} \) ואגדיר \( q_{y}=\frac{p}{q_{x}} \) (ושוב, בלי \( 0<x \) הייתי מסתכן כאן בחלוקה באפס). עם ההגדרה הזו, \( q_{x}q_{y}=p \) וכמו כן \( q_{y} \) רציונלי כי הוא מנה של שני רציונליים. אנחנו יודעים ש-\( x<q_{x} \) על פי האופן שבו \( q_{x} \) נבחר. בנוסף, מכיוון ש-\( q_{x}<\frac{p}{y} \) ושני המספרים הללו חיוביים, אנחנו מקבלים \( \frac{1}{q_{x}}>\frac{y}{p} \) ולכן \( q_{y}=\frac{p}{q_{x}}>p\cdot\frac{y}{p}=y \) וקיבלנו גם את \( q_{y}>y \) שהיינו צריכים.

הראינו את \( f\left(xy\right)=f\left(x\right)f\left(y\right) \) למקרה שבו \( 0<x,y \), אבל מה עם המקרים האחרים? ראשית, אם \( x=0 \) אז קל לראות ש-\( f\left(0\right)=0 \), פשוט כי \( f\left(0\right)=f\left(0+0\right)=f\left(0\right)+f\left(0\right) \), אז השוויון בוודאי יתקיים כי

\( f\left(xy\right)=f\left(0\cdot y\right)=f\left(0\right)=0=0\cdot f\left(y\right)=f\left(0\right)\cdot f\left(y\right)=f\left(x\right)f\left(y\right) \)

ובדומה גם אם \( y=0 \). שימו לב שכאן לא השתמשנו במה שהוכחנו כבר על כפל, אבל כן במה שהוכחנו כבר על חיבור (טוב, ליתר דיוק רק על \( f\left(0+0\right)=f\left(0\right)+f\left(0\right) \) שנבע מכך ש-\( f \) המקורית על הרציונליים הייתה איזומורפיזם).

עכשיו, מה אם \( x<0 \) אבל \( y>0 \)? במקרה הזה \( -x>0 \) אז אפשר להשתמש עליו במה שכבר הוכחנו. לפני כן, בואו נראה שמתקיים הדבר המתבקש \( f\left(-x\right)=-f\left(x\right) \), מה שמזמין שוב שימוש במה שהוכחנו על חיבור:

\( f\left(-x\right)+f\left(x\right)=f\left(-x+x\right)=f\left(0\right)=0 \)

ולכן אחרי העברת אגפים נקבל \( f\left(-x\right)=-f\left(x\right) \). ועכשיו אפשר לחזור אל הכפל:

\( f\left(xy\right)=-f\left(-xy\right)=-f\left(-x\right)f\left(y\right)=f\left(x\right)f\left(y\right) \)

ובאופן דומה מטפלים במקרה שבו \( x>0 \) ו-\( y<0 \). ואם \( x,y<0 \) שניהם? זה הכי קל:

\( f\left(xy\right)=f\left(\left(-x\right)\left(-y\right)\right)=f\left(-x\right)f\left(-y\right)=\left(-1\right)^{2}f\left(x\right)f\left(y\right)=f\left(x\right)f\left(y\right) \)

וסיימנו את כל ההוכחה!

סיכום זריז

זה היה פוסט ארוך במיוחד ומחולק להרבה חלקים כי רציתי שכל הדברים הרלוונטיים זה לזה ישבו באותו מקום. יש משהו קצת אירוני שעבור ההגדרה המאוד פשוטה “הממשיים הם השדה הסדור השלם” הייתי צריך לכתוב כל כך הרבה, ועוד יותר אירוני שבעצם לא בנינו את הממשיים בכלל כאן. קיבלנו מושג מאוד ברור של מה הממשיים אמורים להיות: מה זה שדה, מה זה סדור, מה זה שלם. ראינו גם שאם בכלל קיימת קבוצה שמקיימת את התכונות הללו שאנחנו דורשים מהממשיים, אז היא יחידה במובן זה שכל קבוצה אחרת שמקיימת את התכונות הללו איזומורפית אליה. אבל עדיין לא בניתי שום קבוצה כזו - את זה אני אעשה בהמשך, עם שתי הבניות הסטנדרטיות של הממשיים: זו שמשתמשת בחתכי דדקינד וזו שמשתמשת בסדרות קושי. ההגדרה של חתכי דדקינד מגיעה באופן כמעט ישיר מאקסיומת השלמות שדיברנו עליה בפוסט הזה; אבל ההגדרה עם סדרות קושי (שאני אישית אוהב טיפה יותר למרות ששתי ההגדרות נהדרות) תדרוש עוד קצת עבודת הכנה תיאורטית, שבה יעסוק הפוסט הבא.


נהניתם? התעניינתם? אם תרצו, אתם מוזמנים לתת טיפ:

Buy Me a Coffee at ko-fi.com