אז מה זה בעצם המספרים הממשיים? (חלק ג': על שתי שלמויות)

מבוא

היה זה הטוב בזמנים, היה זה הרע בזמנים. ספציפית, השנה הייתה 1872, והמתמטיקה הייתה בשיאו של תהליך של בניית עצמה מחדש אחרי שהגאומטריה ההיפרבולית שמטה את הבסיס שעליו היא ניצבה במשך אלפי שנים. אני לא אכנס לסיפור הזה כאן (והוא מסופר היטב ב”משפטי גדל ובעיית היסודות של המתמטיקה” של ארנון אברון, למשל) אבל השורה התחתונה שלו הייתה שמאמץ כביר של שלל מתמטיקאים במאה ה-19 הוביל ליצירת החשבון הדיפרנציאלי והאינטגרלי בגרסה המודרנית שלו שבה אנחנו משתמשים גם היום, מה שנתן למתמטיקה בסיס יציב (וחייבים להשחיל פנימה את המילה האהובה “ריגורוזי”) ואז הגיע גאורג קנטור והעמיד את הבסיס היציב הזה על הבסיס היציב עוד יותר של תורת הקבוצות. אז אם הכל כל כך טוב, מה היה רע? שמעבר לאופק כבר הציצו הפרדוקסים שיתגלו בתורת הקבוצות הנאיבית ובפרט הפרדוקס של ראסל, ויגרמו לכך שהמתמטיקה תצטרך לבנות את עצמה מחדש פעם נוספת בתחילת המאה ה-20 והבניה הזו תסתיים בצורה שלא לגמרי עונה על השאיפות המלאות של העוסקים בה.

אבל זה כאמור סיפור לפעם אחרת. כרגע אנחנו בשנת 1872 (שנה לפני שקנטור יתחיל לפרסם מאמרים על תורת הקבוצות) ובשנה הזו מתפרסמים שני מאמרים, אחד של ריכארד דדקינד (“Stetigkeit und irrationale Zahlen”, “רציפות ומספרים אי רציונליים”) והשני של גאורג קנטור (“Ueber die Ausdehnung eines Satzes aus der Theorie der trigonometrischen Reihen “, “על הכללה של משפט מהתורה של טורים טריגונומטריים”), ובמאמרים הללו מופיעות בניות פורמליות של המספרים הממשיים שהן כל כך מוצלחות שעד היום הן הבניות המפורסמות ביותר (יש עוד, אבל זה באמת כבר יחכה לפעם אחרת). בשני המקרים, הבניות מופיעות לא כי התחשק למחברים שלהם להמציא את המתמטיקה מחדש, אלא כי הם גילו שהמתמטיקה הקיימת פשוט לא מספיק פורמלית בשביל שהם יצליחו להוכיח טענות פשוטות יחסית בצורה משביעת רצון; היה צורך בהגדרות פורמליות של הממשיים כדי שאפשר יהיה להוכיח פורמלית דברים שהיו סטנדרטיים בחשבון הדיפרנציאלי והאינטגרלי של זמנם. זה גם לא ממש מקרי ששתי ההגדרות צצו באותה בשנה - קנטור ודדקינד היו מיודדים והתכתבו, ודדקינד ספציפית קיבל מוטיבציה לפרסם את הרעיונות שלו (שהיו לו כבר שנים קודם לכן) אחרי שראה את המאמר של קנטור. אבל למרות סמיכות הזמנים והקשר בין המחברים, שתי הבניות הן שונות למדי באופיין והמוטיבציה שלהן שונה, מה שהופך את שתיהן למעניינות (ואת שתיהן לניתנות להכללה בדרכים שונות גם לדברים שאינם הממשיים), כך שלדעתי שווה לדבר על שתיהן.

דבר אחד שאני לא הולך לעשות בפוסט הוא להציג את הבניות בצורה פורמלית, להוכיח שהן עובדות כמו שצריך וכדומה; את זה אשאיר לפוסט הבא. מה שמעניין אותי כרגע הוא הרעיון הכללי של הבניות, אילו בעיות הן מנסות לפתור ולאילו תוצאות תיאורטיות הן מתקשרות. אז למרות שהפוסט הזה בהחלט ייכנס לפרטים טכניים, הם לא יהיו של הבניות עצמן אלא של ה”מסביב”. ספציפית, אנחנו נראה שכל אחת מהבניות באה ללכוד את מושג ה”שלמות” של \( \mathbb{R} \) והן עושות את זה בצורה די שונה - אפילו שונה מהותית, כמו שנראה בסוף.

לפני שאני נכנס לעובי הקורה, הנה בגדול שתי הבניות:

  • דדקינד מגדיר חתך בתור פירוק של \( \mathbb{Q} \) לשתי קבוצות \( A_{1},A_{2} \) כך שכל איבר של \( A_{1} \) קטן מכל איבר של \( A_{2} \). עכשיו דדקינד מגדיר את המספרים הממשיים בתור אוסף כל החתכים, כשהרעיון הוא שהמספר שחתך מייצג הוא המספר שנמצא "באמצע" בין \( A_{1} \) ו-\( A_{2} \).
  • קנטור מסתכל על סדרות קושי של מספרים רציונליים ומגדיר את המספרים הממשיים בתור אוסף כל סדרות הקושי הללו כשהוא מזהה שתי סדרות קושי ש"שואפות אחת לשניה" בתור אותו מספר. הרעיון הוא שהמספר הממשי שסדרת קושי מייצגת הוא המספר שהסדרה "שואפת" אליו.

ההגדרה של דדקינד אמורה להיות ברורה יחסית אפילו ברמה הפורמלית כבר בשלב הזה למי שעקבו אחרי סדרת הפוסטים הזו, כי ראינו בפוסט הקודם את המושג של “קטן מ-“. לעומת זאת ההגדרה של קנטור משתמשת במושגים שהם אמנם בסיסיים למדי בחשבון דיפרנציאלי ואינטגרלי אבל לא דיברתי עליהם בסדרת הפוסטים הזו בכלל - סדרות קושי ו”שאיפה”. אלו הדברים הראשונים שארצה להבהיר בפוסט הזה ולא אניח שאנחנו כבר מכירים אותם ממקום אחר. יותר מכך - יש חשיבות בהצגה שלהם מאפס מהטעם הפשוט שבדרך כלל רואים אותם בחדו”א שעושים במסגרת \( \mathbb{R} \) - כלומר, הלימודים מתחילים קודם כל עם זה ש-\( \mathbb{R} \) קיים ואז הצגת מושגים כמו שאיפה וסדרות קושי באמצעותו. הפעם אני לא אעשה את זה בכלל. אז יאללה, לעבודה.

הגדרת הגבול

השינוי הגדול שעבר החדו”א במאה ה-19 היה ויתור על גישה לא פורמלית ואינטואיטיבית (שהובילה בסך הכל לתורה שעובדת מצויין אבל יש לה גם פינות אפלות שגויות) לטובת פורמליות שכמותה לא נראתה עד אז במתמטיקה. זה אמר להפסיק להסתמך על האינטואיציה הגאומטרית לגבי מהי “רציפות” ולנסות להגדיר אותה במפורש, וזה אמר גם להפסיק להשתמש באינפיניטסימלים ולהשתמש במושג בסיסי אחר, מדויק יותר, שנקרא גבול. זה לא מושג פשוט או קל לעיכול (ואחת הסיבות שחדו”א הוא תחום ידוע לשמצה בקושי שלו למי שמתחילים ללמוד מתמטיקה היא בדיוק ההסתמכות שלו על מושג לא קל שכזה), אבל ההגדרה שלו חזקה להפתיע. יש לי פוסט על גבולות, אז כאן אני ארשה לעצמי לפרט פחות.

בשביל להגדיר גבול צריך קודם כל להגדיר מרחק, וזה למרבה השמחה משהו שקל לנו להגדיר על \( \mathbb{Q} \) בזכות פונקציית הערך המוחלט שראינו בפוסט הקודם שאפשר להגדיר ישירות מתוך הסדר שיש על \( \mathbb{Q} \). אפשר לחשוב על \( \left|q\right| \) בתור “המרחק של \( q \) מ-0” ואז להכליל את זה ולומר שהמרחק של \( a \) מ-\( b \) הוא \( d\left(a,b\right)=\left|a-b\right| \). עכשיו, בואו נראה אילו תכונות של פונקציית המרחק \( d \) אפשר להסיק מתוך התכונות של הערך המוחלט. בפוסט הקודם ראינו ש:

  • אם \( x\ne0 \) אז \( \left|x\right|\ne0 \) ו-\( \left|0\right|=0 \).
  • \( \left|xy\right|=\left|x\right|\cdot\left|y\right| \) ו-\( \left|-1\right|=1 \)
  • \( \left|x+y\right|\le\left|x\right|+\left|y\right| \)

את שלוש התכונות הללו אפשר לתרגם לשלוש תכונות של פונקציית המרחק, \( d \):

  • \( d\left(a,b\right)=0 \) אם ורק אם \( a=b \).
  • \( d\left(a,b\right)=d\left(b,a\right) \) לכל \( a,b \).
  • \( d\left(a,c\right)\le d\left(a,b\right)+d\left(b,c\right) \) לכל \( a,b,c \).

בואו נוכיח את זה:

  • \( d\left(a,b\right)=0 \) אם ורק אם \( \left|a-b\right|=0 \) כלומר אם ורק אם \( a-b=0 \) כלומר אם ורק אם \( a=b \).
  • \( d\left(a,b\right)=\left|a-b\right|=\left|\left(-1\right)\left(b-a\right)\right|=\left|-1\right|\left|b-a\right|=d\left(b,a\right) \)
  • \( d\left(a,c\right)=\left|a-c\right|=\left|\left(a-b\right)+\left(b-c\right)\right|\le\left|a-b\right|+\left|b-c\right|=d\left(a,b\right)+d\left(b,c\right) \)

עכשיו שיש לנו פונקציית מרחק, אפשר לנסח את מושג הגבול באמצעותה. בדרך כלל כשמלמדים חדו”א לא טורחים לעשות את זה ופשוט עובדים ישירות עם ערך מוחלט, אבל יש יתרון גם בגישה הכללית יותר - מה שאנחנו מנסחים בלשון של פונקציית המרחק תקף בכל מרחב מטרי שהוא בסך הכל קבוצה שמוגדרת עליה פונקציית מרחק שכזו. גם פונקציית מרחק מוזרות על \( \mathbb{Q} \) כמו זו שבה \( d\left(a,b\right) \) הוא \( \frac{1}{2^{n}} \) כש-\( 2^{n} \) היא החזקה הגדולה ביותר של 2 שמחלקת את \( a-b \) (אלא אם \( a=b \) ואז \( d\left(a,b\right)=0 \)). המטריקה המוזרה הזו נקראת “המטריקה ה-2-אדית” והיא מרתקת בפני עצמה אבל אני לא ארחיב עליה יותר מדי כאן (יש לי פוסט על זה).

אפשר להגדיר גבול על שני אובייקטים: סדרות, ופונקציות. על סדרה \( a_{0},a_{1},a_{2},\ldots \) אפשר לחשוב בעצם בתור פונקציה \( g:\mathbb{N}\to\mathbb{Q} \) כך ש-\( g\left(i\right)=a_{i} \), אז המרחק בין זה ובין גבולות של פונקציות \( f:\mathbb{Q}\to\mathbb{Q} \) הוא באמת לא כזה גדול, אבל אני עדיין אתחיל עם ניסוח ספציפי עבור סדרות כי הוא פשוט יותר.

  • בהינתן סדרה \( \left\{ a_{n}\right\} _{n=0}^{\infty} \) אני אומר שהיא שואפת אל \( L \) ומסמן את זה \( \lim_{n\to\infty}a_{n}=L \) או \( a_{n}\to L \) אם לכל \( \varepsilon>0 \) קיים \( N \) טבעי כך שלכל \( n>N \) מתקיים \( d\left(a_{n},L\right)<\varepsilon \).

במילים: לכל רמת קרבה גדולה מאפס, קיים מקום בסדרה שהחל ממנו כל אברי הסדרה נמצאים ברמת הקרבה הזו אל \( L \). בלי שום יוצאים מן הכלל. בלי שהסדרה פתאום “תקפוץ” למקום אחר ואז תחזור. החל משלב מסויים בסדרה, זהו, נגמר - הסדרה קרובה כולה עד כדי \( \varepsilon \) אל \( L \), וזה נכון לכל \( \varepsilon \) חיובי, לא משנה כמה קטן. הדבר היחיד שאני לא דורש בשום צורה הוא שהסדרה תגיע אל \( L \). אפילו לא איבר אחד שלה צריך להיות שווה אל \( L \).

ההגדרה עבור פונקציה קצת יותר מסובכת, כי בניגוד לטבעיים שהם דיסקרטיים, הרציונליים הם צפופים ולכן לכל נקודה אפשר “להתקרב” עם סדרה של רציונליים, כך שאם יש לי פונקציה שמוגדרת על כל הרציונליים ואני רוצה להגיד שהיא שואפת למשהו, עולה השאלה איפה היא שואפת אל המשהו הזה - לאילו ערך הקלטים שלה צריכים להתקרב כדי שאפשר יהיה להגיד שהפלטים שלה מתקרבים אל משהו. אז הנה הפורמליזם:

  • בהינתן פונקציה \( f:\mathbb{Q}\to\mathbb{Q} \) אני אומר שהיא שואפת אל \( L \) בנקודה \( x_{0} \) ומסמן את זה \( \lim_{x\to x_{0}}f\left(x\right)=L \) או \( f\left(x\right)\underset{x\to x_{0}}{\to}L \) אם לכל \( \varepsilon>0 \) קיים \( \delta>0 \) כך שלכל \( x \) עבורו \( 0<d\left(x,x_{0}\right)<\delta \) מתקיים \( d\left(f\left(x\right),L\right)<\varepsilon \)

ההבדל הבולט בין ההגדרות הוא שבהגדרה עבור סדרות לא היה \( \delta \) אלא היה \( N \) והסתכלנו על כל ה”קלטים” \( n \) שגדולים מ-\( N \), ואילו כאן אנחנו מסתכלים על כל ה-\( x \)-ים שקרובים אל \( x_{0} \) עד כדי \( \delta \). כאמור, יש דרך לאגד את שתי ההגדרות הללו ביחד אבל נעזוב את זה.

עוד נקודה שכדאי לשים לב אליה היא \( 0<d\left(x,x_{0}\right) \). אי השוויון הזה אומר שאני לא מניח ש-\( x_{0} \) עצמה הפונקציה קרובה ל-\( L \). הפונקציה אפילו לא חייבת להיות מוגדרת ב-\( L \). אם כן הייתי דורש שהקרבה ל-\( L \) תתקיים גם ב-\( x_{0} \), זו הייתה דרישה חזקה יותר מ-\( f \), וזו דרישה חשובה כל כך שיש לה שם מיוחד: אומרים ש-\( f \) רציפה ב-\( x_{0} \) אם הדרישה הזו מתקיימת - מה ששקול לטענה ש-\( \lim_{x\to x_{0}}f\left(x\right)=f\left(x_{0}\right) \).

סדרות מונוטוניות מתכנסות

עכשיו, כשיש לנו את מושג הגבול אפשר להתחיל לראות את מה שהיה חסר לדדקינד וקנטור והוביל אותם להגדרה פורמלית של הממשיים, \( \mathbb{R} \), כשכאן “הממשיים” פירושם “הקבוצה שבה מתרחשת החדו”א” ולכן כל המשפטים שאתאר יעסקו בה. דדקינד מדבר על במפורש במאמר שלו על מה שהפריע לו. הוא מתאר איך ב-1858, כשלימד קורס חדו”א, התעורר בו תסכול מחוסר הפורמליות של ההוכחות הבסיסיות. הפריע לו שבסופו של דבר, ההוכחות הללו פונות לטיעונים גאומטריים או לכל הפחות “בהשראה” גאומטרית, ומשתמשים בצורה עמומה במושג ה”רציפות” של המספרים הממשיים. לא חייתי בזמנו של דדקינד ואני לא יודע איך נראתה הוראת המתמטיקה אז, אבל אני יכול להבין אותו; הייתה לי תחושה דומה בשעתו עם ההוכחה ש-\( \lim_{x\to0}\frac{\sin x}{x}=1 \). על הטענה הזו נבנה כל החדו”א של פונקציות טריגונומטריות, אבל רוב ספרי החדו”א שמוכיחים אותה קופצים על שלב או שניים, ולרוב יש להם איזה “קל לראות” גאומטרי לגמרי באופיו. זה לא מפריע בדרך כלל (והמשפט כמובן נכון ויש לו הוכחות פורמליות עד הסוף וכבר דיברתי על זה בבלוג), אבל מה שלא מפריע לך בתור סטודנט בהחלט יכול להתחיל להציק כשאתה בא ללמד את הנושא (או לכתוב עליו פוסט בבלוג…) ומגלה שיש איזה משהו שם שלא לגמרי עובד עד הסוף.

לדעתי (ושוב, לא הייתי בסביבה בזמנו של דדקינד) חוסר הפורמליות הזה לא בהכרח היה האופי הכללי של לימודי החדו”א; אני בטוח שרוב ההוכחות היו פורמליות וסבבה. הסיבה לכך היא שמרגע שמוכיחים טענה ספציפית שדורשת הסתמכות על ההגדרה הפורמלית של המספרים הממשיים, אפשר להוכיח טענות אחרות בעזרתה, בצורה פורמלית מלאה, כך שהמחסור בפורמליות מתבטא רק בהוכחה אחת ספציפית (בדיוק כמו עם ה-\( \lim_{x\to0}\frac{\sin x}{x}=1 \)) שלי. דדקינד מביא כדוגמא משפט אחד ספציפי, שהוא אכן “קרש קפיצה” כזה שממנו אפשר להוכיח את יתר הדברים:

  • כל סדרה מונוטונית עולה וחסומה מלעיל היא מתכנסת.

צריך להסביר את המונחים הללו. סדרה היא מתכנסת אם היא שואפת לגבול כלשהו (גבול סופי, לא אינסוף, אבל לא הגדרתי פה שאיפה לאינסוף בכל מקרה). סדרה היא מונוטונית עולה אם \( a_{n}\le a_{n+1} \) לכל \( n \), כלומר האיברים שלה יכולים רק לגדול, לא לקטון. וסדרה היא חסומה מלעיל אם קיים \( M \) כך ש-\( a_{n}\le M \) לכל \( n \) (על זה דיברתי בפוסט הקודם). זו אולי נראית כמו טענה פשוטה ותמימה יחסית, אבל למעשה היא הרבה יותר ערמומית מזה - זו סדרה שמבטיחה קיום של מספר מסוים - מספר שמהווה גבול של הסדרה - והמספר הזה יכול להיות אי-רציונלי. כל אי רציונלי. כי בואו נראה דוגמא עבור \( \sqrt{2}=1.4142\ldots \):

\( 1,1.4,1.41,1.414,1.4142,\ldots \)

מה עשיתי פה? כתבתי סדרת מספרים שנבנית מהפיתוח העשרוני של \( \sqrt{2} \), כשבכל פעם אני מוסיף איבר נוסף אחרי הנקודה העשרונית ולכן מגדיל את המספר שבניתי ולכן זו סדרה מונוטונית עולה. היא בוודאי חסומה, למשל על ידי 2, ולכן על פי הטענה של דדקינד היא מתכנסת - ומן הסתם אנחנו מבינים שהגבול שלה יהיה חייב להיות \( \sqrt{2} \). כלומר הטענה הזו מבטיחה את קיום \( \sqrt{2} \), ואת קיום \( \pi \) וכל מספר ממשי אחר שנרצה ואנחנו יודעים איך לתאר בעצם, וכמובן שהטענה הזו לא נכונה ב-\( \mathbb{Q} \). אבל איך מוכיחים אותה פורמלית עבור \( \mathbb{R} \)?

טרם בניתי את \( \mathbb{R} \) פורמלית, אבל בשביל להוכיח משפטים במסגרת \( \mathbb{R} \) אני לא צריך לבנות אותו פורמלית, למעשה; אני אוכיח משפטים עבור השדה הסדור השלם, שזה מושג שהצגתי בפוסט הקודם, ולכן בהמשך כשאתן בניה פורמלית ל-\( \mathbb{R} \) שאכן תניב שדה סדור שלם, ההוכחה שלי תעבוד עליה אוטומטית. אז למרות שזה לא מה שדדקינד עשה, בואו נראה איך מוכיחים את המשפט הזה עם האקסיומות של שדה סדור שלם, ומה עוד אני יכול להוכיח כשזו נקודת המוצא שלי.

למרבה השמחה ההוכחה קלה למדי. נסתכל על הקבוצה \( A=\left\{ a_{n}\ |\ n\in\mathbb{N}\right\} \) של אברי הסדרה. זו בוודאי קבוצה לא ריקה (אפילו אם הסדרה קבועה, עדיין יהיה ב-\( A \) איבר אחד לפחות) ועל פי ההנחה שהסדרה חסומה מלעיל, \( A \) חסומה מלעיל. לכן על פי אקסיומת השלמות, יש \( L=\sup A \). מה שאני ארצה להוכיח הוא ש-\( a_{n}\to L \) הזה.

יהא \( \varepsilon>0 \) כלשהו. מכיוון ש-\( L=\sup A \), קיים \( N \) כך ש-\( d\left(a_{N},L\right)<\varepsilon \). זה דורש הסבר; אם לא היה אף איבר שקרוב ל-\( L \) עד כדי \( \varepsilon \), היה נובע מכך ש-\( L^{\prime}=L-\varepsilon \) הוא בעצמו חסם מלעיל של \( A \), בסתירה לכך ש-\( L \) הוא החסם העליון שלה. \( L^{\prime} \) היה חסם מלעיל כזה כי בואו ניקח \( a\in A \) כלשהו. אני יודע ש-\( d\left(a,L\right)\ge\varepsilon \), כלומר \( \left|a-L\right|\ge\varepsilon \). אני גם יודע ש-\( a\le L \) (כי \( L \) הוא חסם מלעיל של \( A \)) כלומר \( \left|a-L\right|=L-a \). קיבלתי ש-\( L-a\ge\varepsilon \), כלומר \( a\le L-\varepsilon=L^{\prime} \) וזה לכל \( a\in A \).

אם כן, קיים \( N \) כך ש-\( d\left(a_{N},L\right)<\varepsilon \). עכשיו בואו נסתכל על \( n>N \) כלשהו: מצד אחד, \( a_{N}\le a_{n} \) (כי הסדרה מונוטונית עולה) ומצד שני \( a_{n}\le L \) (כי \( L \) הוא חסם מלעיל) ולכן

\( d\left(a_{n},L\right)=L-a_{n}\le L-a_{N}<\varepsilon \) (כאן אני משתמש בתכונות שכבר ראינו של ערך מוחלט ואי שוויונים).

זה מסיים את ההוכחה ומראה לנו את השימושיות הרבה של אקסיומת השלמות ואת חוסר השימושיות הבולט של הסימון \( d\left(a,b\right) \) שלי במקום להשתמש פשוט בערך מוחלט - ההוכחה שלי מסתמכת חזק מאוד על תכונות של ערך מוחלט, ולדבר על מטריקה כללית לא עוזר לי פה בכלל. המשפט מנוסח מלכתחילה על קבוצה סדורה ולא לגמרי ברור מה המשמעות שלו בסיטואציות כלליות יותר - אפילו במשהו כמו \( \mathbb{R}^{2} \) עם פונקציית המרחק הסטנדרטית \( d\left(\left(x_{1},y_{1}\right),\left(x_{2},y_{2}\right)\right)=\sqrt{\left(x_{1}-x_{2}\right)^{2}+\left(y_{1}-y_{2}\right)^{2}} \).

לכאורה המשפט סובל מחוסר סימטריה מוזר - הוא מדבר על סדרה מונוטונית עולה וחסומה מלעיל. אבל מה עם סדרות מונוטוניות יורדות וחסומות מלרע? להן לא מגיע להתכנס? ובכן, אם \( \left\{ a_{n}\right\} _{n=0}^{\infty} \) סדרה מונוטונית יורדת (\( a_{n}\ge a_{n+1} \)) וחסומה מלרע (קיים \( M \) כך ש-\( a_{n}\ge M \) לכל \( n \)) אז הסדרה \( \left\{ b_{n}\right\} _{n=0}^{\infty} \) שמוגדרת על ידי \( b_{n}=-a_{n} \) היא מונוטונית עולה (כי \( -a_{n}\le-a_{n+1} \)) וחסומה מלעיל (כי \( -M \) מקיים \( -a_{n}\le-M \) לכל \( n \)) ולכן היא מתכנסת לגבול \( L \) וזה עכשיו עניין של משחק קליל עם ההגדרה כדי להראות ש-\( a_{n} \) מתכנסת אל \( -L \).

בולצאנו-ויירשטראס

סיימנו עם המשפט על הסדרות המונוטוניות. העניין הוא שהמשפט הזה הוא מעין הקדמה למשפט מרכזי מאין כמוהו - משפט בולצאנו-ויירשטראס, שהוא כנראה המשפט שמבטא בצורה הכי ברורה את תחושת ה”רציפות” של \( \mathbb{R} \) בכל הנוגע לסדרות:

  • (בולצאנו-ויירשטראס): לכל סדרה חסומה קיימת תת-סדרה מתכנסת.

גם פה צריך לתת הסבר: “תת-סדרה” היא פשוט סדרה אינסופית שמתקבלת מסדרה קיימת על ידי בחירה של חלק מהאיברים שלה, על פי הסדר שלהם בתוך הסדרה המקורית. פורמלית (וזה כואב לכתוב את זה פורמלית) אם יש לנו סדרה \( \left\{ a_{n}\right\} _{n=0}^{\infty} \) אז תת-סדרה שלה היא סדרה \( \left\{ b_{k}\right\} _{k=0}^{\infty} \) כך ש-\( b_{k}=a_{n_{k}} \) עבור \( n_{0}<n_{1}<n_{2}<\ldots \), כלומר עבור סדרה מונוטונית עולה ממש של אינדקסים. עוד דבר שכדאי להזכיר הוא ש”חסומה” אומר שקיימים גם חסם מלעיל וגם חסם מלרע.

אפשר לנסח את בולצאנו-ויירשטראס גם באופן שקול, שיהיה רלוונטי כשנדבר על קנטור: לכל קבוצה \( A \) שהיא אינסופית וחסומה קיימת נקודת הצטברות. כש”נקודת הצטברות” היא נקודה \( b\in\mathbb{R} \) (לאו דווקא כזו ששייכת ל-\( A \)) כך שלכל \( \varepsilon>0 \) קיימת \( a\in A \) כך ש-\( d\left(b,a\right)<\varepsilon \) (לא קשה להראות שבאופן שקול זה אומר שלכל \( \varepsilon>0 \) יש אינסוף נקודות \( a\in A \) כך ש-\( d\left(b,a\right)<\varepsilon \)). זה תרגיל נחמד להוכיח ששני הניסוחים שקולים, אז לא אעשה את זה בעצמי פה.

יש לי בבלוג פוסט שמרפרף על ההוכחה של בולצאנו-ויירשטראס, אבל הפעם אכנס יותר לפרטים. למעשה, אני רוצה להראות שתי הוכחות, כל אחת עם היתרונות שלה. נתחיל מהפשוטה יותר, שתשתמש במה שראינו על התכנסות של סדרות מונוטוניות וחסומות. נתונה לי הסדרה \( \left\{ a_{n}\right\} _{n=0}^{\infty} \), ואני אגיד שאיבר כלשהו בסדרה הוא פסגה אם הוא גדול מכל האיברים שבאים אחריו. כלומר \( a_{n} \) הוא פסגה אם לכל \( n<m \) מתקיים \( a_{m}<a_{n} \). עכשיו, יש שתי אפשרויות: או שבסדרה יש אינסוף פסגות, או שיש מספר סופי. נטפל בכל מקרה בנפרד.

במקרה שבו יש אינסוף פסגות, אני אבנה את תת-הסדרה המתכנסת \( \left\{ b_{k}\right\} _{k=0}^{\infty} \) ככה: ראשית \( b_{0} \) תהיה הפסגה הראשונה בסדרה. שנית, בואו נניח שכבר בניתי את \( b_{k} \) והוא פסגה בסדרה המקורית (זה נכון עבור \( b_{0} \) ואני אבנה את \( b_{k+1} \) כדי שזה ימשיך להיות נכון). מכיוון שבסדרה המקורית יש אינסוף פסגות, נבחר את \( b_{k+1} \) להיות פסגה כלשהי בסדרה המקורית שמגיעה אחרי \( b_{k} \). עכשיו, שימו לב שבגלל ש-\( b_{k} \) היא פסגה היא גדולה מכל איבר שבה אחריה, כלומר \( b_{k+1}<b_{k} \). במילים אחרות, בנינו פה תת-סדרה מונוטונית יורדת \( b_{0}>b_{1}>b_{2}>\ldots \) והיא חסומה בגלל שהסדרה \( \left\{ a_{n}\right\} _{n=0}^{\infty} \) חסומה (זו ההנחה של משפט בולצאנו-ויירשטראס). לכן סדרת ה-\( b_{k} \)-ים מתכנסת.

עכשיו נניח שדווקא אין אינסוף פסגות. אז קיים \( N \) כך ש-\( a_{N} \) הוא הפסגה האחרונה בסדרה. נגדיר \( b_{0}=a_{N+1} \), כלומר \( b_{0} \) אינה פסגה. נניח עכשיו באופן כללי שכבר בנינו את \( b_{k} \) והיא אינה פסגה, אז מכיוון שהיא אינה פסגה קיים איבר שמופיע אחרי \( b_{k} \) וגדול ממנו: נבחר את האיבר הזה להיות \( b_{k+1} \), ונשים לב שגם הוא לא יהיה פסגה כי אין יותר פסגות בסדרה המקורית. לכן \( b_{k}<b_{k+1} \) ואפשר להמשיך ככה ולקבל סדרה מונוטונית עולה \( b_{0}<b_{1}<b_{2}<\ldots \) ולכן מתכנסת. זה מסיים את ההוכחה הזו ומראה את השימושיות היפה של הטענה על סדרות מונוטוניות מתכנסות.

אבל אני רוצה, כאמור, להראות עוד הוכחה, כי היא תיתן לי מוטיבציה לעוד משפט שימושי שאני רוצה להציג. זו ההוכחה שהצגתי ברפרוף בפוסט הקודם ומשתמשת ברעיון שאוהבים לקרוא לו אריה במדבר בהתאם ל”בדיחה” הזו: איך תופסים אריה במדבר? קודם כל מקיפים את המדבר בגדר. עכשיו מעבירים גדר באמצע המדבר. האריה נמצא באחד משני החצאים, אז הולכים לחצי שבו האריה נמצא ומעבירים גדר באמצע שלו וכן הלאה. בסופו של דבר האריה מוגבל לשטח של מטר על מטר - תפסנו אותו!

מה שנחמד בדימוי הזה, כשמקזזים את ההתעללות בבעלי חיים ואת העובדה שאין אריות במדבר, הוא שאנחנו אוטומטית כבר מקבלים הצצה אל איך זה יכול לעבוד בדו-מימד, או במספר כלשהו של ממדים, וזאת להבדיל מההוכחה הקודמת שהייתה מאוד חד ממדית באופי שלה. עדיין, אני מתעסק כאן רק עם \( \mathbb{R} \) אז אני אנסח את ההוכחה רק עבור המקרה החד ממדי, מה שיוביל לכך שהיא תהיה טיפה יותר מסורבלת מהקודמת - אבל כאמור, הרווח הוא שקל להכליל אותה (גם את ההוכחה השניה אפשר להכליל עם לא יותר מדי מאמץ, אבל לטעמי זה פחות מיידי).

אז יש לנו את הסדרה \( \left\{ a_{n}\right\} _{n=0}^{\infty} \) שאני רוצה למצוא לה תת-סדרה מתכנסת ואני יודע שהיא חסומה, כלומר קיים \( M>0 \) כך ש-\( \left|a_{n}\right|\le M \) לכל \( n \). זו ה”גדר” שבה מקיפים את כל המדבר. עכשיו אני הולך להגדיר סדרה של קטעים, \( C_{n}=\left[\alpha_{n},\beta_{n}\right] \). ההגדרה של קטע כזה, למי שלא זוכרים, היא \( \left[\alpha,\beta\right]\triangleq\left\{ x\in\mathbb{R}\ |\ \alpha\le x\le\beta\right\} \). זה מה שנקרא קטע סגור כי הוא כולל את נקודות הקצה שלו: זה יהיה חשוב בהמשך.

את סדרת הקטעים אני הולך לבנות ככה שמתקיימים הדברים הבאים:

  1. בכל קטע \( C_{n} \) יש אינסוף איברים של הסדרה \( \left\{ a_{n}\right\} _{n=0}^{\infty} \) (זו המקבילה לכך ש"האריה נמצא בתוך הקטע").
  2. \( \left|C_{n}\right|=\beta_{n}-\alpha_{n}=\frac{M}{2^{n-1}} \), כלומר האורך של \( C_{n} \) לא סתם ידוע לנו אלא הוא שואף לאפס כש-\( n \) שואף לאינסוף (זה כל מה שנזדקק לו, האורך המדויק לא חשוב).
  3. \( C_{n-1}\supseteq C_{n} \), כלומר כל קטע מוכל בקטע שקודם לו.

הקטע הראשון בסדרה יהיה \( C_{0}=\left[-M,M\right] \) והוא בוודאי מקיים את תכונות 1 ו-2. תכונה 3 מתקיימת “באופן ריק” כי אין קטע שקודם לו. עכשיו, בואו נניח שבנינו כבר את \( C_{n} \) והוא אכן מקיים את תכונות 1-3 ונבנה את \( C_{n+1} \). מה שנעשה הוא לקחת את \( C_{n}=\left[\alpha_{n},\beta_{n}\right] \) ולחצות אותו לשניים (זו המקבילה לכך ש”מעבירים גדר באמצע המדבר”), כלומר נסתכל על הקטעים \( \left[\alpha_{n},\frac{\alpha_{n}+\beta_{n}}{2}\right] \) ו-\( \left[\frac{\alpha_{n}+\beta_{n}}{2},\beta_{n}\right] \).

האיחוד של שני הקטעים הללו הוא בדיוק \( C_{n} \) ולכן הוא מכיל אינסוף איברים של הסדרה; לכן אחד משני החצאים חייב להכיל אינסוף איברים של הסדרה כי אם בשני החצאים היה רק מספר סופי של איברים, גם באיחוד שלהם היה רק מספר סופי של איברים. נבחר את \( C_{n+1} \) להיות החצי שיש בו אינסוף איברים (“החצי עם האריה”). עם ההגדרה הזו של \( C_{n+1} \) מקבלים מייד את תכונות 2-3 (תוכיחו אותן לעצמכם!)

עכשיו אני רוצה לבנות את תת-הסדרה שלי, \( \left\{ b_{k}\right\} _{k=0}^{\infty} \). נניח שכבר בניתי את כל האיברים עד \( b_{k} \) ונראה איך בונים אותו: בקטע \( C_{k} \) יש אינסוף איברים של הסדרה המקורית, ובתת-הסדרה שבניתי עד כה יש רק מספר סופי של איברים, אז אני אבחר את \( b_{k} \) להיות איבר של הסדרה המקורית עם אינדקס גדול משל כל האיברים שמופיעים בתת-הסדרה שבניתי עד עכשיו. זה מסיים את הבניה, ורק נשאר להוכיח שתת-הסדרה הזו מתכנסת.

אינטואיטיבית, תת-הסדרה הזו נמצא באיזורים שהולכים וקטנים כל הזמן, ולכן יש הרגשה שהיא “חייבת להתכנס”, אבל ההרגשה הזו (שבהמשך אתן לה שם פורמלי: סדרת קושי) לא נותנת לי איבר ספציפי שאליו הולכים להתכנס - ואכן, אם אנחנו עובדים מעל \( \mathbb{Q} \) כל תהליך הבניה שתיארתי עד כה עובד מושלם אבל תת-הסדרה לא תהיה חייבת להתכנס. אני חייב להכניס פה לתמונה משפט שמשתמש בתכונת השלמות של הממשיים, והמשפט שאני רוצה להשתמש בו הוא מה שאני הולך עוד מעט לתאר: משפט החיתוך של קנטור.

הנה ניסוח פורמלי של המשפט: אם \( \left\{ C_{n}\right\} _{n=0}^{\infty} \) היא סדרה של קטעים סגורים כך ש-\( C_{n}\supseteq C_{n+1} \) ו-\( \lim_{n\to\infty}\left|C_{n}\right|=0 \) אז קיים \( c\in\mathbb{R} \) יחיד כך ש-\( c\in\bigcap_{n=0}^{\infty}C_{n} \). במילים: קיימת נקודה יחידה שנמצאת בכל הקטעים בסדרה. זה הקיום שאנחנו זקוקים לו.

אם כן, יש לנו נקודה \( c \) והייתי רוצה להראות שתת-הסדרה שבניתי מתכנסת אליה, כלומר \( \lim_{k\to\infty}b_{k}=c \). זו הוכחה סטנדרטית: מתחילים עם “יהא \( \varepsilon>0 \)” ואז לוקחים \( N \) כך שאם \( k>N \) אז \( \left|C_{k}\right|<\varepsilon \) (קיים כזה, כי \( \lim_{n\to\infty}\left|C_{n}\right|=0 \)). עכשיו, \( c\in C_{k} \) (על פי משפט החיתוך של קנטור) וגם \( b_{k}\in C_{k} \) (על פי הבניה של \( b_{k} \)) ולכן אני יכול להסיק ש-\( d\left(b_{k},c\right)<\varepsilon \) ונגמר הסיפור. אני אסביר עכשיו איך אני מסיק את זה במקרה של \( \mathbb{R} \), מה שכמובן מוסיף סרבול להוכחה; אני אגלה שבאופן כללי, משפט החיתוך של קנטור לא דורש שמה שיישאף לאפס הוא האורך של קטע, אלא הקוטר של קבוצה במרחב מטרי, כש”הקוטר” הוא המרחק המקסימלי בין זוג איברים מהקבוצה - כלומר, במקרה הכללי המסקנה ש-\( d\left(b_{k},c\right)<\varepsilon \) מגיעה בחינם.

במקרה שלנו, נניח בלי הגבלת הכלליות ש-\( b_{k}<c \), כלומר

\( d\left(b_{k},c\right)=\left|b_{k}-c\right|=c-b_{k} \)

עכשיו שימו לב ש-\( b_{k},c\in\left[\alpha_{k},\beta_{k}\right] \) ולכן בפרט \( c\le\beta_{k} \) וגם \( b_{k}\ge\alpha_{k} \), כלומר \( -b_{k}\le-\alpha_{k} \), ולכן

\( c-b_{k}\le\beta_{k}-\alpha_{k}=\left|C_{k}\right|<\varepsilon \)

מה שמסיים את ההוכחה. השגנו את בולצאנו-ויירשטראס וקיבלנו מוטיבציה להוכיח את משפט החיתוך של קנטור, אבל לפני שאני אעשה את זה - בואו נראה מה בכלל עושים עם בולצאנו-ויירשטראס ועם משפט החיתוך של קנטור שבגללו אנחנו כל כך אוהבים אותם.

משפט ערך הביניים ומשפטי ויירשטראס

הדבר המרכזי שבו מתעסקים בחדו”א הוא פונקציות ממשיות, \( f:\mathbb{R}\to\mathbb{R} \). בואו ניזכר מה ראינו קודם לגבי מושג הגבול עבור פונקציות כאלו:

  • אומרים ש-\( f\left(x\right) \) מתכנסת ב-\( x_{0} \) אל \( L \) ומסמנים זאת \( \lim_{x\to x_{0}}f\left(x\right)=L \) אם לכל \( \varepsilon>0 \) יש \( \delta>0 \) כך שאם \( 0<d\left(x,x_{0}\right)<\delta \) אז \( d\left(f\left(x\right),L\right)<\varepsilon \)
  • אומרים ש-\( f\left(x\right) \) רציפה ב-\( x_{0} \) אם \( \lim_{x\to x_{0}}f\left(x\right)=f\left(x_{0}\right) \)

מושג הרציפות הוא נקודתי; אנחנו מדברים על נקודה קונקרטית שבה \( f \) רציפה. אבל המושג הזה באמת זורח כשיש לנו סיטואציה שבה \( f \) לא רציפה רק בנקודה אחת, אלא בתוך קבוצה “נחמדה” של נקודות. למשל, קטע (קטע הוא דבר טוב כי אין בו “חורים באמצע” שבהם פתאום הפונקציה לא צריכה להיות רציפה ויכולה להשתולל). אני רוצה להראות כמה משפטים בסיסיים שמסתמכים על כך שפונקציה רציפה בקבוצה נחמדה מתנהגת נחמד, אבל לפני כן בואו נראה דרך לחבר את מושג הגבול של סדרה עם מושג הרציפות.

נניח ש-\( f \) רציפה בנקודה \( a \) ונניח שבנוסף לכך יש לנו סדרה \( a_{0},a_{1},a_{2},\ldots \) כך ש-\( \lim_{n\to\infty}a_{n}=a \). עכשיו, בואו נפעיל את \( f \) על אברי הסדרה ונקבל סדרה חדשה, \( f\left(a_{0}\right),f\left(a_{1}\right),\ldots \). אני טוען שהרציפות של \( f \) גוררת ש-\( \lim_{n\to\infty}f\left(a_{n}\right)=f\left(a\right) \). כדי לראות את זה בואו נשתמש בהוכחה סטנדרטית: נגיד שיהא \( \varepsilon>0 \) כלשהו, ומהרציפות של \( f \) נסיק שקיים \( \delta \) כך שאם \( d\left(x,a\right)<\delta \) אז \( d\left(f\left(x\right),f\left(a\right)\right)<\varepsilon \). עכשיו, נעבור לפתוח את הגדרת הגבול \( \lim_{n\to\infty}a_{n}=a \): מהגדרת הגבול נובע שעבור ה-\( \delta \) שמצאנו קודם קיים \( N \) כך שאם \( n>N \) אז \( d\left(a_{n},a\right)<\delta \), אבל זה אומר ש-\( d\left(f\left(a_{n}\right),f\left(a\right)\right)<\varepsilon \) כפי שרצינו, וסיימנו. עכשיו, כשיש לי את המשפט המועיל הזה, אני יכול להתחיל להראות תוצאות מגניבות של רציפות.

בואו נתחיל עם המשפט היסודי של האלגברה. המשפט בעל השם המפוצץ הזה אומר שבמספרים המרוכבים \( \mathbb{C} \), לכל פולינום יש שורש, כלומר אם \( p\left(x\right)=a_{n}x^{n}+a_{n-1}x^{n-1}+\ldots+a_{1}x+a_{0} \) הוא פולינום, קיים \( z\in\mathbb{C} \) כך ש-\( p\left(z\right)=0 \). במבט ראשון לא ברור איך זה קשור אלינו, הרי זה משפט שמדבר על מספרים מרוכבים; אבל מספרים ממשיים הם מקרה פרטי חשוב של מרוכבים, ובפרט אם יש לנו פולינום שהמקדמים שלו ממשיים והדרגה שלו אי-זוגית אז קל לראות שחייב להיות לו לפחות שורש ממשי אחד (כי השורשים הלא ממשיים בהכרח באים בזוגות של \( z,\overline{z} \)), כלומר מקרה פרטי של המשפט היסודי הוא הטענה “לפולינום ממשי מדרגה אי זוגית יש שורש ממשי”. בשעתו הראיתי בבלוג הוכחה יפה למשפט היסודי של האלגברה שהשתמשה בטכניקות אלגבריות מתורת גלואה - אבל הטכניקות הללו לא יכלו להוכיח בעצמן את הטענה עבור פולינום ממשי ממעלה אי זוגית, ונזקקו להוכחה שאני הולך להראות עכשיו, שהיא חדו”אית לגמרי (ועל כן יש כאלו שאוהבים ללגלג בצורה לא הוגנת ש”המשפט היסודי של האלגברה הוא משפט באנליזה”).

הרעיון הוא זה: ראשית, פולינום הוא פונקציה רציפה (אני לא הולך להוכיח את זה, אבל זה לא קשה; \( f\left(x\right)=x \) הוא די בבירור רציף ועכשיו רק צריך להראות שסכומים ומכפלות סופיים של פונקציות רציפות הם רציפים). שנית, אם הפולינום הוא ממעלה אי-זוגית, ואפשר להניח שהוא מתוקן כלומר שהמעלה של החזקה הגבוהה ביותר \( x^{n} \) היא 1, אז לא קשה לראות שעל ידי הצבת ערך \( a \) שלילי שהוא מספיק גדול בערכו המוחלט אפשר לקבל ש-\( p\left(a\right)<0 \) ובדומה אפשר למצוא \( b \) כך ש-\( p\left(b\right)>0 \). כלומר, קיבלנו שני ערכים ש-\( p \) “מחליף סימן” ביניהם, בקטע \( \left[a,b\right] \). מכיוון ש-\( p \) רציף, אנחנו מדמיינים אותו בתור קו כזה שמציירים על הנייר בלי להרים את העיפרון מהדף, ולכן אם ברגע אחד הוא מתחת לציר \( x \) ורגע אחר כך הוא מעל ציר \( x \) היה שבריר שניה שבו הוא היה בדיוק על ציר \( x \), כלומר יש נקודה \( c\in\left(a,b\right) \) כך ש-\( f\left(c\right)=0 \). משכנע?

לא, לא ממש משכנע. בדיוק בגלל זה צריך הוכחות. הטענה שאני רוצה להוכיח נקראת משפט ערך הביניים והנה הניסוח הפורמלי יותר שלה: אם \( f \) היא פונקציה רציפה בקטע \( \left[a,b\right] \) כך ש-\( f\left(a\right)<0<f\left(b\right) \), אז קיימת \( c\in\left(a,b\right) \) כך ש-\( f\left(c\right)=0 \) (אפשר לנסח בצורה כללית יותר, עבור כל ערך ביניים ולא רק 0, אבל זה ניתן לרדוקציה למקרה של \( 0 \) כי מחליפים את הפונקציה \( f \) שרוצים להראות שמקבלת את הערך \( T \) בפונקציה \( f\left(x\right)-T \)).

איך מוכיחים את זה? הנה הוכחת “אריה במדבר” סטייל עם משפט החיתוך של קנטור. נבנה סדרה של קטעים \( \left[a_{n},b_{n}\right] \) כשהקטע הראשון הוא \( a_{0}=a,b_{0}=0 \). הכלל המנחה יהיה שבכל הקטעים הללו מתקיים \( f\left(a_{n}\right)<0<f\left(b_{n}\right) \), שהם מכילים אחד את השני ושהאורך של כל אחד מהם הוא חצי מהאורך של הקודם, כלומר שהאורכים שלהם שואפים לאפס. נעשה את זה בצורה פשוטה מאוד: נסתכל על נקודת האמצע של כל קטע, \( x_{n}=\frac{a_{n}+b_{n}}{2} \). אם \( f\left(x_{n}\right)=0 \) מצאנו את ה-\( c \) שחיפשנו ואפשר לסיים את ההוכחה; אחרת, אם \( f\left(x_{n}\right)>0 \) אז נגדיר \( a_{n+1}=a \) ו-\( b_{n+1}=x_{n} \), ואילו אם \( f\left(x_{n}\right)<0 \) אז נגדיר \( a_{n+1}=x_{n} \) ו-\( b_{n+1}=b_{n} \).

עכשיו, משפט החיתוך של קנטור אומר לנו שקיימת נקודה יחידה \( c\in\bigcap_{n=1}^{\infty}\left[a_{n},b_{n}\right] \). האינטואיציה היא שזו הנקודה שחיפשתי, שבה \( f\left(c\right)=0 \), כי עם הקטעים \( \left[a_{n},b_{n}\right] \) אני עושה “זום אין” מדויק על רגע שבו הפונקציה עוברת משלילית לחיובית. אבל איך אני מוכיח את זה? כאן הרציפות נכנסת לתמונה. ראשית, קל להראות ש-\( a_{n}\to c \). שנית, בגלל ש-\( f \) רציפה נובע ממה שהראיתי קודם ש-\( \lim_{n\to\infty}f\left(a_{n}\right)=f\left(c\right) \). בנוסף, \( f\left(a_{n}\right)<0 \) לכל \( n \) כי ככה בניתי את סדרת ה-\( n \)-ים. אז קיבלנו ש-\( f\left(c\right) \) הוא הגבול של סדרה של מספרים שליליים, וגבול כזה חייב להיות שלילי או אפס, כי אם הוא \( L>0 \) אז כל איבר בסדרה יהיה לפחות במרחק \( L \) ממנו ולכן עבור \( \varepsilon<L \) הוכחת הגבול תיכשל. כלומר, \( f\left(c\right)\le0 \). באופן דומה בעזרת סדרת ה-\( b \)-ים מראים ש-\( f\left(c\right)\ge0 \), והמסקנה משני אלו היא ש-\( f\left(c\right)=0 \), כפי שרצינו.

מה קרה פה? הרציפות היא זו שנתנה לנו את \( f\left(c\right)\le0 \) ואת \( f\left(c\right)\ge0 \), אבל מה שתכונת השלמות נתנה לנו הוא את זה שבכלל קיים \( c \) כזה - קיים חלקיק שניה מדויק שבו אפשר לעצור את הסרט של \( f \) ולהגיד “הנה! רואים?! זו השניה המדויקת שבה עברנו את ציר \( x \)!” במספרים הרציונליים זה פשוט לא עובד: אם למשל נסתכל על הפונקציה \( f\left(x\right)=x-\pi \): אין מספר רציונלי שמאפס אותה, אבל היא כמובן רציפה. פשוט אין בסרט שלנו את הפריים עבור \( x=\pi \) שבו רואים אותה מתאפסת, כי הסרט כולל רק פריימים שנלקחו בנקודות רציונליות.

בואו נעבור עכשיו למה שמכונה משפט ערך הקיצון של ויירשטראס (Extreme value theorem) ולפעמים מחלקים לשני משפטים - “משפט ויירשטראס הראשון” ו”משפט ויירשטראס השני” (שההוכחה שלו מסתמכת על הראשון) וגם אני כאן אדבר עליהם בתור שני משפטים. הרעיון בהם די פשוט: אם אני מצייר פונקציה רציפה בקטע סגור, העפרון שלי מתחיל בנקודה אחת ומצייר איזה קו עד שהוא מגיע לנקודה בקצה השני. הוא לא יכול בשום שלב לברוח לאינסוף, כי פונקציה רציפה היא “רגועה”. אני אצייר את כולה על הנייר שעל השולחן ולא אמצא את עצמי פתאום נאלץ ללכת עד לקוטב הצפוני בשביל לצייר אותה (זה לא נכון, אני משקר כדי לתת אינטואיציה, פונקציה רציפה בהחלט עלולה לדרוש ממני ללכת עד לקוטב הצפוני, פשוט לא עד לאינסוף). באופן פורמלי: פונקציה רציפה על קטע סגור וחסום היא חסומה בו. זה משפט ויירשטראס הראשון, והשני מרחיב: לא סתם חסומה, אלא מקבלת את המקסימום והמינימום שלה, כלומר אם יש לנו את הקטע \( \left[a,b\right] \) ופונקציה רציפה \( f:\left[a,b\right]\to\mathbb{R} \) אז קיימות נקודות \( c_{1},c_{2}\in\left[a,b\right] \) כך ש-\( f\left(c_{1}\right)=\min\left\{ f\left(x\right)\ |\ x\in\left[a,b\right]\right\} \) ו-\( f\left(c_{2}\right)=\max\left\{ f\left(x\right)\ |\ x\in\left[a,b\right]\right\} \).

האם המשפט הראשון מתבסס רק על הרציפות של \( f \) או גם על השלמות של \( \mathbb{R} \)? לכאורה לא צריך פה את השלמות, הרי הטענה היא לא מהצורה “קיימת נקודה בקטע שמקיימת כך וכך” אלא “קיים חסם אחיד עבור כל הנקודות בקטע”. אבל הנקודה היא שבלי ש-\( \mathbb{R} \) יהיה שלם, פונקציה יכולה “להשתגע” כשהערכים שלה מתקרבים לנקודה ש”חסרה” ב-\( \mathbb{R} \) ועדיין להיחשב רציפה, כי הדוגמא הנגדית לרציפות שלה היא נקודה שלא קיימת בכלל.

איך גורמים לפונקציה “להשתגע”? פשוט מאוד, מחלקים באפס. למשל, נסתכל על הקטע \( \left(0,1\right) \) ועל הפונקציה \( f\left(x\right)=\frac{1}{x} \). הפונקציה הזו בבירור כן רציפה בקטע (זה דורש טיפה הוכחה) אבל כש-\( x \) מתקרב ל-\( 0 \) הפונקציה “מתפוצצת”, גדלה ועוברת כל חסם אפשרי; היא בוודאי לא חסומה ב-\( \left(0,1\right) \), והסיבה שזו לא דוגמא נגדית למשפט ויירשטראס היא שעל הקטע הסגור \( \left[0,1\right] \) הפונקציה לא תהיה רציפה כי היא בכלל לא מוגדרת ב-0. זה ממחיש את החשיבות בכך שהקטע הוא סגור; בלי זה המשפט לא עובד.

עכשיו, בואו נניח לרגע ש-0 בכלל לא קיים ביקום שלנו ואנחנו מסתכלים עדיין על \( f\left(x\right)=\frac{1}{x} \), אבל בקטע \( \left[-1,1\right] \). הפונקציה עדיין לא חסומה בו כי בסביבות \( x=0 \) היא “מתפוצצת”, אבל האם היא לא רציפה? בכל נקודה חוץ מ-0 היא כן רציפה, אז אם 0 לא קיים ביקום שלנו, קיבלנו פונקציה שרציפה בקטע הסגור והחסום \( \left[-1,1\right] \) אבל לא חסומה בו. כמובן, 0 כן קיים ביקום שלנו, אבל אם אנחנו לא ב-\( \mathbb{R} \) אלא ב-\( \mathbb{Q} \) אז מספרים אחרים כמו \( \pi \) לא קיימים בו ואפשר לתקן את הדוגמא כדי שתהיה סביבם, באופן הבא: נסתכל על הקטע \( \left[3,4\right] \) ועל הפונקציה \( f\left(x\right)=\frac{1}{x-\pi} \) ש”מתפוצצת” ב-\( x=\pi \).

ההוכחה של משפט ויירשטראס הראשון מתבססת על הדוגמא הנגדית המטופשת הזו: היא מניחה בשלילה שהפונקציה לא חסומה ולכן יש מקום שבו היא “מתפוצצת”, ואז משתמשת בשלמות של הממשיים כדי למצוא נקודה שנמצאת במרכז הפיצוץ הזה והפונקציה פשוט לא יכולה להיות רציפה בה. בואו נניח בשלילה ש-\( f\left(x\right) \) הרציפה לא חסומה בקטע \( \left[a,b\right] \), אז לכל \( n \) קיימת נקודה \( x_{n}\in\left[a,b\right] \) כך ש-\( f\left(x_{n}\right)\ge n \). קיבלנו סדרה \( \left\{ x_{n}\right\} _{n=0}^{\infty} \) של נקודות שביחד מתארות את ה”התפוצצות” של \( f \), אלא שלרוע המזל ייתכן שהנקודות הללו נמצאות במקומות שונים לגמרי של הקטע \( \left[a,b\right] \) ואני רוצה התפוצצות שמרוכזת בנקודה אחת; כאן בדיוק בא משפט בולצאנו-ויירשטראס לעזרתי ומוצא תת-סדרה מתכנסת \( \left\{ c_{n}\right\} _{n=0}^{\infty} \) של \( \left\{ x_{n}\right\} _{n=0}^{\infty} \). תחשבו על בולצאנו-ויירשטראס כאילו הוא מתמקד בנקודת “התפוצצות” כלשהי ומעיף מהסדרה \( \left\{ x_{n}\right\} _{n=0}^{\infty} \) את כל הנקודות שלא קשורות אליה אלא מתארות התפוצצויות אחרות או סתם מקומות שבהם הפונקציה מגיעה לגבהים בלי להתפוצץ (“הקוטב הצפוני”). נסמן \( c=\lim_{n\to\infty}c_{n} \), וכאן השתמשנו בשלמות של \( \mathbb{R} \): בלי זה הנקודה \( c \) לא הייתה בהכרח קיימת, אפילו אם היינו מצליחים לבנות מקבץ \( \left\{ c_{n}\right\} _{n=0}^{\infty} \) של נקודות שנראה כאילו הוא סובב סביב נקודת התפוצצות כלשהי.

הטיעון עכשיו הוא שבגלל הרציפות של \( f \) צריך להתקיים \( f\left(c\right)=\lim_{n\to\infty}f\left(c_{n}\right) \) אבל מכיוון שהסדרה \( f\left(c_{n}\right) \) לא חסומה (קל להראות ש-\( f\left(c_{n}\right)\ge n \) כי כשיצרנו את תת-הסדרה \( c_{n} \) מתוך \( x_{n} \) התכונה \( x_{n}\ge n \) רק התחזקה) נובע שהגבול לא קיים בכלל (הוא קיים במובן הרחב, של \( \lim_{n\to\infty}f\left(c_{n}\right)=\infty \), אבל זו הגדרה שונה) ולכן \( f\left(c\right) \) לא מוגדרת בכלל; זה תרגיל טוב ולא קשה לנסח את זה פורמלית עד הסוף. סיימנו את ההוכחה של משפט ויירשטראס הראשון במובן זה שהראינו שהפונקציה חסומה מלעיל, ובאותו אופן מוכיחים שהיא חסומה מלרע.

עכשיו אפשר לעבור למשפט ויירשטראס השני - ננצל את זה שאנחנו כבר יודעים שהפונקציה חסומה כדי להראות שהיא מקבלת את הערך המקסימלי שלה. כרגיל, כדי להבין מה זה אומר ולמה השלמות של הממשיים קריטית לזה, בואו נסתכל על דוגמת צעצוע: הפונקציה הרציפה \( f\left(x\right)=1-\left|x\right| \). קל לראות ש-\( f\left(0\right)=1 \) הוא הערך המקסימלי של הפונקציה הזו, אבל אם \( 0 \) לא היה חלק מהיקום המתמטי שלנו, הפונקציה לא הייתה מגיעה ל-1 אף פעם, רק שואפת אליו. רק מה, 0 הוא כן חלק מהעולם שלנו אז אפשר לעשות את הטריק הרגיל של להזיז את הכל כך שהנקודה שאנחנו מדברים עליה תהיה \( \pi \) ולא 0, כלומר להגדיר \( f\left(x\right)=1-\left|x-\pi\right| \). אני חוזר שוב ושוב על השטיק הזה כדי שיהיה ברור שהפואנטה של השלמות של \( \mathbb{R} \) היא לא שקיים מספר מעניין ומיוחד כמו \( \pi \), כי אין למהות של \( \pi \) תפקיד אמיתי כאן; מה שחשוב הוא המבנה של קבוצת הממשיים בכללותה, המחסור הזה בחורים, כי אם יש אפילו חור אחד אפשר “להזיז” את כל העולם כך שהחור יהיה מרכז העולם, ולא משנה אם זה חור ב-0 או ב-\( \pi \).

בדוגמא \( f\left(x\right)=1-\left|x-\pi\right| \) יש לנו פונקציה שאם תוגדר על הרציונליים, לא תקבל את המקסימום שלה בקטע \( \left[3,4\right] \), אבל מה שכן יהיה נכון הוא שלפחות יהיה סופרמום לקבוצת הערכים שהיא מקבלת שם: \( \sup\left\{ f\left(x\right)\ |\ x\in\left[3,4\right]\right\} =1 \). גם את זה אפשר לקלקל בקלות אם מגדירים \( f\left(x\right)=\pi-\left|x-\pi\right| \). כלומר, כדי שמשפט ויירשטראס השני יעבוד אנחנו צריכים להשתמש בשלמות פעמיים: פעם אחת בשביל התחום של \( f \), כדי להוכיח את קיום הנקודה שבה יתקבל המקסימום; ופעם שניה, עוד יותר מוקדמת, עבור הטווח של \( f \) כדי להוכיח שבכלל יש ערך מקסימלי ששווה לנסות ולקבל.

ההוכחה הסטנדרטית הולכת כך: בואו באמת נסתכל על \( \sup\left\{ f\left(x\right)\ |\ x\in\left[a,b\right]\right\} \). מכיוון שידוע לנו ש-\( f \) חסומה ב-\( \left[a,b\right] \) (זה משפט ויירשטראס הראשון) ומכיוון ש-\( \left[a,b\right] \) כולל לפחות נקודה אחת (אם \( a=b \) הקטע עדיין כולל את \( a \)) אז \( A=\sup\left\{ f\left(x\right)\ |\ x\in\left[a,b\right]\right\} \) קיים כי לקחנו סופרמום של קבוצה חסומה לא ריקה; זה שימוש ישיר באקסיומת השלמות של שדה סדור שלם. עכשיו אפשר להשתמש בטריק בולצאנו-ויירשטראסי בדיוק כמו קודם, רק במקום עם סדרה שמתפוצצת, עם סדרה ששואפת אל \( A \): לכל \( n \) נמצא \( x_{n}\in\left[a,b\right] \) כך ש-\( A-\frac{1}{n}\le f\left(x_{n}\right)\le A \) (קיים כזה כי \( A \) סופרמום), ניקח תת-סדרה מתכנסת \( \left\{ c_{n}\right\} _{n=0}^{\infty} \), נסמן \( c=\lim_{n\to\infty}c_{n} \), נשתמש ברציפות של \( f \) כדי להסיק \( f\left(c\right)=\lim_{n\to\infty}f\left(c_{n}\right) \) ונוכיח די בקלות (תרגיל טוב!) ש-\( \lim_{n\to\infty}f\left(c_{n}\right)=A \).

ההוכחה הזו פשוטה ונהדרת, ולרוע המזל היא גורמת לי אי נוחות בפוסט הספציפי הזה כי קלעתי את עצמי לפינה שבה אני מנסה לא להשתמש ישירות באקסיומת השלמות, כי אני רוצה להראות שטבעי באותה מידה להתחיל מהניסוח האלטרנטיבי של קנטור לשלמות ו”להיפגש באמצע”, כלומר להשתמש במשפט החיתוך של קנטור או בבולצאנו-ויירשטראס. אבל כאן אני לא רואה דרך לא מסורבלת לעשות את זה. זו כנראה נקודה פדגוגית לזכות ההצגה המוקדמת של אקסיומת השלמות.

לסיכום חלק הדוגמאות הזה, רציתי להביא כאן גם את משפט הערך הממוצע של לגראנז' שהוא באמת משפט שימושי בצורה יוצאת דופן, אבל אני לא אעשה את זה כי זה ייאלץ אותי לדבר גם על נגזרות ומשפטים שקשורים אליהן שאני לא רוצה להוכיח, אז הנה שורה אחת על לגראנז’ למי שמכירות אותו: כדי להוכיח את לגראנז’ אנחנו עושים תעלול אלגברי קטן שמבצע לו רדוקציה אל משפט רול. את משפט רול מוכיחים על ידי שילוב של שני משפטים: משפט פרמה, שאומר שנגזרת של פונקציה בנקודת קיצון מתאפסת; ומשפט ויירשטראס השני, שמראה שבתנאים של משפט רול יש לפונקציה נקודת קיצון. במילים אחרות, בכל מקרה אין כאן תוכן מתמטי רלוונטי שלא ראינו כי אנחנו מסתמכים פה על משפט ויירשטראס; ומצד שני בלי לגראנז’ באמת שאין חדו”א כמו שאנחנו מכירים. וכך זה ממשיך ומפעפע עוד ועוד לכל רחבי החדו”א.

כל זה כנראה משכנע שאקסיומת השלמות היא דבר חשוב ושהגישה של דדקינד נכונה; אבל עכשיו הגיע הזמן לדבר גם על הגישה הנוספת.

סדרות קושי

בשלבים הקודמים של הפוסט ראינו את משפט החיתוך של קנטור. הנה תזכורת איך הוא הולך: אם \( \left\{ C_{n}\right\} _{n=0}^{\infty} \) היא סדרה של קטעים סגורים כך ש-\( C_{n}\supseteq C_{n+1} \) ו-\( \lim_{n\to\infty}\left|C_{n}\right|=0 \) אז קיים \( c\in\mathbb{R} \) יחיד כך ש-\( c\in\bigcap_{n=0}^{\infty}C_{n} \). איך אפשר להוכיח את זה? ובכן, הנה גישה אחת: מכיוון שהקטעים \( C_{n} \) הם סגורים כל אחד כולל לפחות נקודה אחת, אז פשוט ניקח \( c_{n}\in C_{n} \) לכל קטע וקיבלנו סדרה. עכשיו נגדיר \( c=\lim_{n\to\infty}c_{n} \) וקיבלנו את ה-\( c \) שלנו. עכשיו צריך עדיין להוכיח שהוא בחיתוך של כל הקטעים ושהוא יחיד, אבל עברנו את השלב הקשה של להוכיח שהוא קיים… רגע רגע רגע, לא הוכחנו שום דבר. אני לא יכול להגדיר \( c=\lim_{n\to\infty}c_{n} \) כי אני לא יודע שהסדרה \( \left\{ c_{n}\right\} _{n=0}^{\infty} \) מתכנסת בכלל. אבל מה שאני כן יודע הוא שהסדרה הזו נראית כאילו היא אמורה להתכנס. למה? ובכן, כי בגלל שהאיברים שלה שייכים לסדרת קטעים שהולכת ומצטופפת, גם האיברים שלה צריכים, ובכן, ללכת ולהצטופף יחד. וכשיש לי סדרה שנראה שהאיברים שלה מצטופפים סביב מקום אחד, הייתי יכול לקוות שהיא תתכנס, לא?

זה הרעיון מאחורי המושג שנקרא סדרת קושי (במאמר שלו קנטור קרא לה “סדרה יסודית”, אבל זה לא המושג המקובל כיום). פורמלית, \( \left\{ a_{n}\right\} _{n=0}^{\infty} \) היא סדרת קושי אם לכל \( \varepsilon>0 \) קיים \( N \) כך שלכל \( n,m>N \) מתקיים \( d\left(a_{n},a_{m}\right)<\varepsilon \). כלומר, לכל אפסילון קיים מקום בסדרה שהחל ממנו כל זוג איברים בסדרה קרובים זה לזה עד כדי אפסילון. ניסוח שימושי שקול הוא שלכל \( \varepsilon>0 \) קיים \( N \) כך שלכל \( n>N \) מתקיים \( d\left(a_{n},a_{N}\right)<\varepsilon \), כלומר לכל אפסילון קיים איבר בסדרה שכל יתר אברי הסדרה קרובים אליו עד כדי אפסילון.

שימו לב להבדל בין זה ובין הגדרת הגבול. גבול אומר שלכל אפסילון, קיים מקום בסדרה שהחל ממנו כל יתר איברי הסדרה קרובים אל הגבול עד כדי אפסילון - הגבול עצמו בכלל לא צריך להיות איבר בסדרה. לעומת זאת בסדרת קושי לכל אפסילון אנחנו בוחרים איבר מהסדרה שאליו כל יתר האיברים יהיו קרובים - והאיבר הזה תלוי באפסילון, כלומר זה לא שיש בסדרה איבר בודד שכל יתר האיברים קרובים אליו לכל אפסילון שנרצה (להבדיל מגבול שכן מקיים את זה). כלומר, התכונה שמגדירה סדרת קושי מרגישה קצת “חלשה יותר” מקיום גבול.

האמנם? ובכן, יש כאן שני משפטים שאפשר להוכיח: ראשית, שאם סדרה מתכנסת לגבול אז היא סדרת קושי (מה שמראה שקיום גבול “חזק לפחות כמו” להיות סדרת קושי) ושנית, שאם סדרה היא סדרת קושי אז היא אכן מתכנסת לגבול. בואו נוכיח את שניהם.

ראשית, נניח ש-\( \left\{ a_{n}\right\} _{n=0}^{\infty} \) מתכנסת, \( \lim_{n\to\infty}a_{n}=a \), ונוכיח ש-\( \left\{ a_{n}\right\} _{n=0}^{\infty} \) היא סדרת קושי ממש על פי ההגדרה. ניקח \( \varepsilon>0 \), אז קיים מקום \( N \) בסדרה כך שלכל \( n>N \) מתקיים \( d\left(a_{n},a\right)<\frac{\varepsilon}{2} \) (השתמשנו בהגדרת הגבול של סדרה עם \( \frac{\varepsilon}{2} \)). עכשיו, ניקח \( n,m>N \), נשתמש באי שיוויון המשולש ונקבל

\( d\left(a_{n},a_{m}\right)\le d\left(a_{n},a\right)+d\left(a,a_{m}\right)<\frac{\varepsilon}{2}+\frac{\varepsilon}{2}=\varepsilon \)

וסיימנו. זה היה כיוון קל.

מה עם הכיוון השני? ובכן, אם \( \left\{ a_{n}\right\} _{n=0}^{\infty} \) היא סדרת קושי אנחנו עדיין לא יודעים אם היא מתכנסת או לא, אבל בזכות בולצאנו-ויירשטראס אנחנו יודעים שקיימת לה תת-סדרה מתכנסת. נסמן את הגבול של תת-הסדרה הזו ב-\( a \). עכשיו נראה ש-\( \lim_{n\to\infty}a_{n}=a \) בשיטה הסטנדרטית: ניקח \( \varepsilon>0 \) כלשהו ונמצא \( N \) כך שאם \( n>N \) אז \( d\left(a_{n},a\right)<\varepsilon \). בשביל זה נשלב גם את התכונה של סדרת קושי וגם את הקטע של תת-סדרה מתכנסת.

ראשית, בגלל ש-\( \left\{ a_{n}\right\} _{n=0}^{\infty} \) היא סדרת קושי, קיים \( N \) כך שלכל \( n,m>N \) מתקיים \( d\left(a_{n},a_{m}\right)<\frac{\varepsilon}{2} \). עכשיו, בתת-הסדרה המתכנסת של \( \left\{ a_{n}\right\} _{n=0}^{\infty} \) קיים מקום \( N^{\prime} \) כך שלכל \( n>N^{\prime} \), אם \( a_{n} \) שייך לתת-הסדרה אז \( d\left(a_{n},a\right)<\frac{\varepsilon}{2} \). בואו ניקח \( m \) כך ש-\( m>\max\left\{ N,N^{\prime}\right\} \) אז בפרט מתקיים \( d\left(a_{m},a\right)<\frac{\varepsilon}{2} \) ובנוסף, לכל \( n>N \), מכיוון ש-\( n,m>N \) אז \( d\left(a_{n},a_{m}\right)<\frac{\varepsilon}{2} \) ואפשר להשתמש באי שוויון המשולש:

\( d\left(a_{n},a\right)\le d\left(a_{n},a_{m}\right)+d\left(a_{m},a\right)<\frac{\varepsilon}{2}+\frac{\varepsilon}{2}=\varepsilon \)

וסיימנו גם את הכיוון הזה. אבל שימו לב מה היה המחיר ששילמנו: בניגוד להוכחה של הכיוון הקודם שהייתה אלמנטרית, כאן השתמשנו במשפט המאוד לא טריוויאלי של בולצאנו-ויירשטראס. זה רומז לנו שיש כאן משהו מהותי, ובעצם זה לא צריך להיות מפתיע - אנחנו שוב פעם בוראים איבר יש מאין, במקרה הזה את גבול הסדרה. כבר ראינו בפוסט הזה את הסדרה \( 1,1.4,1.41,1.414,1.4142,\ldots \) ש”אמורה להתכנס” אל \( \sqrt{2} \); הבאתי אותה במקור בתור סדרה מונוטונית חסומה, אבל זו גם בבירור סדרת קושי של מספרים ב-\( \mathbb{Q} \) ולכן בלי ש-\( \sqrt{2} \) יהיה חלק מהעולם שלנו פשוט לא יהיה לה לאן להתכנס.

זה זמן טוב לעצור לרגע ולראות את שרשרת ההוכחות שיש לנו:

  • אקסיומת השלמות \( \leftarrow \) כל סדרה מונוטונית וחסומה מתכנסת \( \leftarrow \) בולצאנו ויירשטראס (הוכחת ה"פסגות") \( \leftarrow \) כל סדרת קושי מתכנסת

בתוך כל זה גם הכנסתי את משפט החיתוך של קנטור, בתור דרך אחרת להוכיח את בולצאנו ויירשטראס, וקיבלתי מוטיבציה להוכחה של משפט החיתוך של קנטור דווקא מסדרות קושי. זה רומז לנו במעורפל שאולי אפשר גם לקחת את שרשרת ההוכחות הזו בכיוון ההפוך - להתחיל מכך שכל סדרת קושי מתכנסת ולהסיק מכך את בולצאנו ויירשטראס, את ההתכנסות של כל סדרה מונוטונית וחסומה, ואת אקסיומת השלמות.

כלומר, אני מציע שבמקום להתחיל מאקסיומת השלמות, נתחיל ממה שאני אקרא לו “שלמות-קנטור”, בזמן שלשלמות ה”רגילה” אני אקרא “שלמות-דדקינד”:

  • שלמות-קנטור: כל סדרת קושי מתכנסת.
  • שלמות-דדקינד: לכל קבוצה לא ריקה וחסומה קיים חסם עליון.

נתחיל אם כן מהאקסיומה שבמספרים הממשיים מתקיימת שלמות-קנטור ונראה לאן נגיע עם זה. כרגיל, אני מזהיר שהמילה אקסיומה פה לא אומרת “משהו שברור מאליו ולא צריך להוכיח” אלא “תכונה שהיא בסיסית מספיק כדי שנציין אותה במפורש ואנחנו מצפים מהבניה של המרחב שלנו לוודא שהיא מתקיימת”. בבניה של קנטור למספרים הממשיים, שלמות-קנטור היא מה שכל הבניה סובבת סביבו כדי להבטיח שיתקיים, בעוד שבבניה של דדקינד, באופן לא מפתיע, הבניה סובבת סביב להראות ששלמות-דדקינד מתקיימת. את שתי הבניות, כאמור, אני לא אציג בפוסט הזה כי הוא גם ככה ארוך מדי.

בואו נוכיח דברים עם שלמות-קנטור. בראש ובראשונה, את משפט החיתוך של קנטור. כבר התחלתי את זה: הייתה לי סדרה \( \left\{ C_{n}\right\} _{n=0}^{\infty} \) של קטעים סגורים כך ש-\( C_{n}\supseteq C_{n+1} \) ו-\( \lim_{n\to\infty}\left|C_{n}\right|=0 \). אמרתי שאני בונה סדרה \( c_{n}\in C_{n} \). בגלל התכונה \( C_{n}\supseteq C_{n+1} \) נובע שאם \( n>N \) אז \( a_{n}\in C_{N} \), ולכן קל להראות שזו סדרת קושי: עבור \( \varepsilon>0 \) כלשהו, נשתמש בכך ש-\( \lim_{n\to\infty}\left|C_{n}\right|=0 \) כדי למצוא \( N \) כך ש-\( \left|C_{N}\right|<\varepsilon \). כלומר, פורמלית, \( C_{N}=\left[a_{N},b_{N}\right] \) כך ש-\( \left|a_{N}-b_{N}\right|<\varepsilon \), אבל אפשר לחשוב על זה קצת יותר כללי: לחשוב על\( \left|C_{n}\right| \) בתור סימון של הקוטר של הקבוצה \( C_{N} \), המרחק המקסימלי בין כל שני איברים שלה. כשמכלילים את משפט קנטור למרחבים מטריים כלליים, זה המושג שנעזרים בו.

גם במקרה הפרטי שלנו זה מתקיים: אם \( x,y\in\left[a,b\right] \) אני טוען ש-\( \left|x-y\right|\le\left|a-b\right| \). כדי לראות את זה צריך קצת חשבונות קטנים וקטנוניים: אני מניח בלי הגבלת הכלליות ש-\( a\le x\le y\le b \) ולכן בפרט \( -a\ge-x \) ולכן \( b-a\ge y-a\ge y-x \) ולכן \( \left|x-y\right|\le\left|a-b\right| \).

זה נותן לנו את סדרת הקושי שלנו: ניקח \( n,m>N \) אז בגלל ש-\( c_{n},c_{m}\in C_{N} \) נקבל ש-\( d\left(c_{n},c_{m}\right)\le\left|C_{N}\right|<\varepsilon \), כפי שרצינו. ועכשיו נשתמש בשלמות-קנטור כדי לקבל \( c \) כך ש-\( c=\lim_{n\to\infty}c_{n} \). זה היה החלק הקריטי - לעבור ממצב שבו אין לנו איבר ביד למצב שבו יש לנו אותו ביד. עכשיו צריך להראות עדיין ש-\( c\in\bigcap_{n=0}^{\infty}C_{n} \) ושהוא האיבר היחיד שמקיים את זה, אבל זה החלק הקל.

ראשית, כדי להראות ש-\( c\in C_{n} \) לכל \( n\ge0 \), נשים לב לכך ש-\( c \) הוא הגבול של הסדרה \( a_{n},a_{n+1},a_{n+2},\ldots \) (כלומר, הסדרה \( \left\{ c_{n}\right\} _{n=0}^{\infty} \) שבניתי כשאני זורק לפח את האיברים הראשונים עד \( a_{n} \)). בגלל התכונה \( C_{n}\supseteq C_{n+1} \) אנחנו יודעים שכל אברי הסדרה הזו שייכים ל-\( C_{n} \), כך ש-\( a \) הוא גבול של סדרה ששייכת ל-\( C_{n} \), ו-\( C_{n} \) הוא קטע סגור ולכן הוא בפרט קבוצה סגורה וההגדרה של קבוצה סגורה היא “קבוצה של הגבולות של איבריה שייכים אליה” ולכן \( c\in C_{n} \). שכנעתי אתכם? בוודאי שלא, מאיפה שלפתי את ההגדרה הזו של קבוצה סגורה? תכף נחזור לזה.

שנית, בואו נראה את היחידות של \( c \). ניקח \( c_{1},c_{2}\in\bigcap_{n=0}^{\infty}C_{n} \) כלשהם. כעת, לכל \( n \) מתקיים \( d\left(c_{1},c_{2}\right)\le\left|C_{n}\right| \) כי \( c_{1},c_{2}\in C_{n} \), ולכן \( d\left(c_{1},c_{2}\right)\le\lim_{n\to\infty}\left|C_{n}\right|=0 \) והמסקנה היא ש-\( d\left(c_{1},c_{2}\right)=0 \) כלומר \( c_{1}=c_{2} \) (ושוב - זה תרגיל טוב לפרמל את זה עד הסוף אם אתם מרגישים שמשהו חסר). אז הכל פה באמת קל, ורק נשארה לי הטענה “קטע סגור הוא קבוצה סגורה” שלא באמת קשורה להוכחה הזו אלא היא משהו כללי יותר.

כדי לעשות לעצמנו סדר בהגדרות, הנה הן שוב, במפורט:

  • קבוצה סגורה היא קבוצה \( D \) כך שלכל סדרה מתכנסת \( \left\{ a_{n}\right\} _{n=0}^{\infty} \), אם \( a_{n}\in D \) לכל \( n \), גם \( \lim_{n\to\infty}a_{n}\in D \).
  • קטע סגור הוא קבוצה מהצורה \( D=\left[a,b\right]=\left\{ x\in\mathbb{R}\ |\ a\le x\le b\right\} \)

במבט ראשון לא נראה שיש ביניהן קשר וזה סתם שימוש מבלבל כפול ב”סגור”, אבל בפועל קל להראות שקטע סגור הוא אכן קבוצה סגורה. ניקח \( D=\left[a,b\right] \) שכזה. אם יש לנו סדרה מתכנסת \( \left\{ c_{n}\right\} _{n=0}^{\infty} \) שכל אבריה שייכים ל-\( D \), נסמן את הגבול שלה ב-\( c=\lim_{n\to\infty}c_{n} \). אם \( a\le c\le b \) הכל בסדר, אז בואו נראה למשל איך מגיעים לסתירה אם \( c<a \). זה די פשוט: נסמן \( \varepsilon=a-c \), ולכן על פי הגדרת הגבול קיים \( c_{n} \) כך ש-\( d\left(c_{n},c\right)<\varepsilon \). אבל \( c_{n}\in D \), כלומר \( a\le c_{n} \), כלומר

\( d\left(c_{n},c\right)=\left|c_{n}-c\right|=c_{n}-c=\left(c_{n}-a\right)+\left(a-c\right)\ge\varepsilon \)

וזו סתירה ל-\( d\left(c_{n},c\right)<\varepsilon \), מה שמסיים את ההוכחה הזו.

סיכום ביניים: הראינו איך שלמות-קנטור גוררת את משפט החיתוך של קנטור, וראינו עוד קודם שמשפט החיתוך של קנטור גורר את בולצאנו-ויירשטראס. מה שנחמד הוא שאפשר לדבר על כל התוצאות הללו בהקשרים כלליים יותר של מרחבים מטריים וההוכחות די דומות, אבל לא אכנס לזה כאן - אנחנו מאוד ממוקדים באובייקט של “שדה סדור שלם”.

מה נשאר לנו להראות? ראינו את המשפט על כך שסדרה מונוטונית חסומה היא מתכנסת. האם בולצאנו-ויירשטראס מוכיח אותו? אם \( \left\{ a_{n}\right\} _{n=0}^{\infty} \) היא הסדרה המונוטונית החסומה אז החסימות שלה נותנת לנו את בולצאנו-ויירשטראס ואנחנו מקבלים תת-סדרה \( \left\{ c_{n}\right\} _{n=0}^{\infty} \) שמתכנסת אל \( c \). שימו לב שבהכרח \( c_{n}\le c \) לכל איבר בתת-הסדרה, בגלל המונוטוניות שלה: אם היה מתקיים \( c<c_{N} \) עבור \( N \) כלשהו, אז עבור \( \varepsilon=c_{N}-c \) היינו מקבלים שלכל \( n>N \), \( d\left(c_{n},c\right)=\left(c_{n}-c_{N}\right)+\left(c_{N}-c\right)\ge\varepsilon \).

בואו נוכיח ש-\( \lim_{n\to\infty}a_{n}=c \): ניקח \( \varepsilon>0 \) כלשהו, אז קיים \( N \) כך ש-\( a_{N} \) שייך לתת-הסדרה וגדול מספיק כדי שיתקיים \( d\left(a_{N},c\right)<\varepsilon \), כלומר \( c-a_{N}<\varepsilon \). עכשיו, לכל \( n>N \) מתקיים \( a_{N}<a_{n}\le c \) ולכן \( c-a_{n}<c-a_{N}<\varepsilon \), כמו שרצינו (הסיבה שבגללה \( a_{n}\le c \) היא שאם היה מתקיים \( a_{n}>c \) זה היה מכריח גם איברים של תת-הסדרה שמופיעים בסדרה אחרי \( a_{n} \) להיות גדולים מ-\( c \) וראינו שזה לא יכול לקרות).

אם כן, לסיכום - הראינו איך משלמות-קנטור נובעות אותן התוצאות בחדו”א שעניינו אותנו - מלבד אחת, זו של שלמות-דדקינד עצמה. בשביל זה כדאי לעבור לחלק נוסף ואחרון.

שלמות דדקינד נגד שלמות קנטור - הקרב האחרון

מה ראינו עד כה?

  • שלמות-דדקינד גוררת את שלמות-קנטור.
  • שלמות-קנטור גוררת את כל התוצאות שראינו בפוסט בערך חוץ מאשר את שלמות-דדקינד (ולכן בעצם גם המשפט השני של ויירשטראס שמשתמש בה).

אם נחזור לטרמינולוגיה של הפוסט הקודם, ראינו ששדה סדור שלם הוא גם שלם-קנטור. למעשה, סביר להניח שחלק נכבד מהקוראים נתקלו בשלמות-קנטור בתור המשמעות של “שלם”; כשמדברים בטופולוגיה על “מרחב מטרי שלם” ועל “השלמה של מרחב מטרי” זה במובן של שלמות-קנטור. האם ההפרדה הזו בין שלמות-דדקינד ושלמות-קנטור היא לא קצת מלאכותית? אי אפשר לקרוא לשני אלו “שלמות” וזהו?

ובכן, למרבה הצער, לא בדיוק.

הטענה “אם \( \mathbb{F} \) הוא שדה סדור שבו כל סדרת קושי מתכנסת, אז הוא שלם” היא פשוט לא נכונה.

מה שנכון, ואני הולך להוכיח, הוא הטענה “אם \( \mathbb{F} \) הוא שדה סדור ארכימדי שבו כל סדרת קושי מתכנסת, אז הוא שלם”. אבל צריך את הארכימדיות. מה זו ארכימדיות? כזכור, זו התכונה לפיה לכל \( a\in\mathbb{F} \) קיים \( n\in\mathbb{Z} \) כך ש-\( a<n \). כשיש לנו שדה סדור שלם הוא אוטומטית ארכימדי. זה כבר אומר שיהיה לנו קצת קשה להראות דוגמא לשדה סדור שהוא שלם-קנטור אבל לא שלם-דדקינד, כי הוא יצטרך להיות מוזר בגלל חוסר הארכימדיות שלו. יש דוגמא סטנדרטית עם שדה של טורי לורן אבל אני לא אכנס לזה כאן כי היא טכנית וארוכה. במקום זה אני אעשה משהו טכני וארוך אחר: אוכיח ששדה סדור ארכימדי שבו כל סדרת קושי מתכנסת הוא שלם.

יש כל מני הוכחות שראיתי ואני אלך דווקא על אחת טכנית יחסית כי אני מרגיש שזו דרך טובה להרגיש בידיים “מה הולך פה”. אני לוקח קבוצה לא ריקה וחסומה \( A\subseteq\mathbb{F} \) ורוצה להוכיח ש-\( \sup A \) קיים. בשביל זה אני צריך כלי כלשהו שיודע להראות לי שמשהו קיים, והכלי הזה עבורי יהיה משפט החיתוך של קנטור, שכבר ראינו שנובע משלמות-קנטור. הרעיון המרכזי הוא פשוט: נבנה סדרה של קטעים, \( \left[a_{n},b_{n}\right] \), שמקיימים את התנאים הרגילים של משפט החיתוך כלומר \( \left[a_{n},b_{n}\right]\supseteq\left[a_{n+1},b_{n+1}\right] \) ו-\( \lim_{n\to\infty}\left(b_{n}-a_{n}\right)=0 \), ובנוסף הם מקיימים את התכונה הבאה: לכל \( n \), \( b_{n} \) הוא חסם מלעיל של \( A \) אבל \( a_{n} \) אינו חסם מלעיל של \( A \). עכשיו נשתמש במשפט החיתוך ונקבל \( c \) שמקיים ש-\( a_{n}\le c\le b_{n} \) לכל \( n \).

מצד אחד, \( c \) חייב להיות חסם מלעיל של \( A \), כי אם הוא לא היה כזה, אז היה קיים \( a\in A \) כך ש-\( c<a \), ומכאן בפרט ש-\( a_{n}<a \) לכל \( n \) (כלומר, נקודות הקצה השמאליות של הקטעים שלנו “לא מתקרבות מספיק לקצה של \( A \)”). אבל תזכרו שסדרת נקודות הקצה הימניות, ה-\( b_{n} \)-ים, מתקרבות כרצוננו אל ה-\( a_{n} \)-ים, אז ברור שנוכל להנדס פה סתירה עם טכניקות שכבר ראינו לא אחת בפוסט הבא: נגדיר \( \varepsilon=a-c \) (מכיוון ש-\( c<a \) אז \( \varepsilon>0 \)) וניעזר בכך ש-\( \lim_{n\to\infty}\left(b_{n}-a_{n}\right)=0 \) כדי למצוא \( N \) עבורו \( b_{N}-a_{N}<\varepsilon \). אבל עכשיו תראו מה קרה: \( a_{N}<c<a\le b_{N} \), כשאי השוויון האחרון נובע מכך ש-\( b_{N} \) הוא חסם מלעיל של \( A \) וש-\( a\in A \). המסקנה מהשרשרת היא ש

\( \varepsilon=a-c\le b_{N}-c<b_{N}-a_{N}<\varepsilon \)

וזו סתירה. אז קיבלנו ש-\( c \) הוא חסם מלעיל של \( A \).

בנוסף, אני טוען ש-\( c \) הוא החסם מלעיל המינימלי של \( A \), כי אם הוא לא היה כזה אז היה קיים \( b \) שהוא חסם מלעיל של \( A \) כך ש-\( b<c \), ומכאן בפרט ש-\( b<b_{n} \) לכל \( n \) (כלומר, נקודות הקצה הימניות של הקטעים שלנו “הן לא חסמים מלעיל מספיק קטנים של \( A \)”). רואים את הדז’ה-וו? בואו נסיים את זה באותו האופן: נגדיר \( \varepsilon=c-b \) ונמצא \( N \) עבורו \( b_{N}-a_{N}<\varepsilon \) ועכשיו תראו מה קרה: \( a_{N}\le b<c<b_{N} \) כשאי השוויון הראשון נובע מכך ש-\( b \) הוא חסם מלעיל של \( A \) (גדול או שווה לכל אברי \( A \)) ואילו \( a_{N} \) אינו חסם מלעיל כזה (קיים איבר ב-\( A \) שגדול ממנו, ו-\( b \) גדול או שווה מאותו איבר). המסקנה מהשרשרת היא ש

\( \varepsilon=c-b<b_{N}-b\le b_{N}-a_{N}<\varepsilon \)

וזו סתירה. אז קיבלנו ש-\( c \) קטן מכל חסם מלעיל אחר של \( A \), ולכן הוא החסם מלעיל המינימלי, ולכן \( c=\sup A \). זה מסיים את החלק התיאורטי יותר בהוכחה ונשאר לעבור לחלק הקונקרטי - איך בונים בפועל סדרת קטעים \( \left[a_{n},b_{n}\right] \) כזו שעוטפת בצורה כל כך אפקטיבית את הקצה הימני של הקבוצה \( A \)? וכאן הארכימדיות הולכת לצוץ בכל הכוח כי בלעדיה יכול להיות חור עצום בין קבוצת האיברים ב-\( A \) וקבוצת החסמים מלעיל שלהם.

הרעיון הבסיסי הוא זה: בואו נחלק את כל ציר המספרים למקטעים באורכים קצרים - נאמר, \( \frac{1}{2} \). עכשיו נעבור על נקודות הקצה של המקטעים הללו: \( -\frac{1}{2},0,\frac{1}{2},1,\frac{3}{2},\ldots \). מתישהו יגיע הרגע הראשון שבו אנחנו עוברים את \( A \), כלומר מוצאים מספר \( \frac{k}{2} \) שהוא חסם מלעיל של \( A \) אבל \( \frac{k-1}{2} \) הוא לא חסם מלעיל של \( A \). כשזה קורה, נסמן \( a_{1}=\frac{k-1}{2} \) ו-\( b_{1}=\frac{k}{2} \).

איך נגדיר עכשיו את \( a_{2},b_{2} \)? כדאי לחלק את העולם לחלקים עוד יותר קטנים, כי ככל שאנחנו מקטינים את העולם ככה הדיוק שלנו משתפר. אבל צריך להיות זהירים מאוד כאן: אם למשל אני אחלק את העולם לשלישים, \( -\frac{1}{3},0,\frac{1}{3},\frac{2}{3},\ldots \), נקודות הקצה ממש לא בהכרח יהיו שיפור ביחס לקודם. למשל, אם הסופרמום של \( A \) הוא \( \frac{1}{2} \) אז נקבל \( a_{1}=0,b_{1}=\frac{1}{2} \) אבל \( a_{2}=\frac{1}{3},b_{2}=\frac{2}{3} \). במקרה הזה אמנם \( a_{1}<a_{2} \) כפי שהיינו רוצים שיקרה (כי אנחנו רוצים שיתקיים \( \left[a_{1},b_{1}\right]\supseteq\left[a_{2},b_{2}\right] \)) אבל ממש לא מתקיים \( b_{2}<b_{1} \). אז לא מספיק להגדיל את המכנה - צריך להגדיל אותו בצורה שבעצם לוקחת את החלוקה הקודמת ומחלקת אותה עוד קצת. אם קודם חילקנו לקטעים באורך \( \frac{1}{2} \), עכשיו משתלם לחלק לקטעים באורך \( \frac{1}{4} \), וכן הלאה: באופן כללי נחלק לקטעים באורך \( \frac{1}{2^{n}} \).

אם כן, הבניה שלי תהיה כזו: לכל \( n\ge1 \) אני אמצא מספר שלם \( k_{n} \) שהוא המספר השלם המינימלי עבורו \( \frac{k_{n}}{2^{n}} \) הוא חסם מלעיל של \( A \) - כלומר, כך ש-\( \frac{k_{n}}{2^{n}} \) הוא חסם מלעיל של \( A \) אבל \( \frac{k_{n}-1}{2^{n}} \) אינו חסם מלעיל של \( A \) (אני כמובן אצטרך להוכיח שקיים \( k_{n} \) כזה) ואז אגדיר \( a_{n}=\frac{k_{n}-1}{2^{n}} \) ו-\( b_{n}=\frac{k_{n}}{2^{n}} \).

תחת ההגדרה הזו, \( b_{n}-a_{n}=\frac{k_{n}-\left(k_{n}-1\right)}{2^{n}}=\frac{1}{2^{n}} \) ולכן \( \lim_{n\to\infty}\left(b_{n}-a_{n}\right)=0 \) וזה אחד משני הדברים שרצינו עבור תנאי משפט החיתוך של קנטור. הדבר השני שאנחנו צריכים להוכיח הוא \( \left[a_{n},b_{n}\right]\supseteq\left[a_{n+1},b_{n+1}\right] \).

ראשית, להוכיח ש-\( b_{n+1}\le b_{n} \) יהיה קל יחסית. נסתכל על \( b_{n}=\frac{k_{n}}{2^{n}} \) ונכפול ונחלק את זה ב-2, כלומר

\( b_{n}=\frac{k_{n}}{2^{n}}=\frac{2k_{n}}{2^{k+1}} \)

המכנה עכשיו הוא מה שאנחנו מחפשים. המונה? ובכן, תזכרו שאנחנו לוקחים את \( k_{n+1} \) להיות המספר הקטן ביותר עבורו \( \frac{k_{n+1}}{2^{n+1}} \) הוא חסם מלעיל של \( A \) אבל \( \frac{k_{n+1}-1}{2^{n+1}} \) לא. ואנחנו כבר יודעים ש-\( b_{n} \) הוא חסם מלעיל של \( A \), ולכן \( k_{n+1}\le2k_{n} \), כלומר קיבלנו

\( b_{n+1}=\frac{k_{n+1}}{2^{n+1}}\le\frac{2k_{n}}{2^{n+1}}=b_{n} \)

יהיה קצת יותר טריקי להראות ש-\( a_{n}\le a_{n+1} \), כלומר להראות ש-\( \frac{k_{n}-1}{2^{n}}\le\frac{k_{n+1}-1}{2^{n+1}} \). נכפול את שני האגפים ב-\( 2^{n+1} \) ונקבל שמספיק להראות \( 2\left(k_{n}-1\right)\le k_{n+1}-1 \), ואחרי העברת אגפים נקבל שמספיק להראות \( 2k_{n}-1\le k_{n+1} \).

כדי לראות את זה, בואו נסתכל על \( 2k_{n}-2 \). כזכור, בחרנו את \( k_{n} \) כך ש-\( \frac{k_{n}}{2^{n}} \) הוא חסם מלעיל של \( A \) אבל \( \frac{k_{n}-1}{2^{n}} \) אינו חסם מלעיל שכזה. אם נכפול מונה ומכנה ב-2 נקבל ש-\( \frac{2k_{n}-2}{2^{n+1}} \) אינו חסם מלעיל של \( A \). אנחנו יודעים ש-\( \frac{k_{n+1}}{2^{n+1}} \) הוא כן חסם מלעיל של \( A \) ולכן \( 2k_{n}-2<k_{n+1} \), ומכיוון שבשני האגפים יש מספרים שלמים, הוספת 1 לאגף שמאל יכולה לכל היותר להפוך את אי השוויון לשוויון, אגף שמאל לא יכול להפוך לגדול יותר מאגף ימין. לכן \( 2k_{n}-1\le k_{n+1} \), כפי שרצינו.

כל מה שנשאר לנו לעשות הוא להסביר איך עושים את זה: לכל \( n \), למצוא מספר שלם \( k_{n} \) כך ש-\( \frac{k_{n}}{2^{n}} \) הוא חסם מלעיל של \( A \) אבל \( \frac{k_{n}-1}{2^{n}} \) אינו חסם מלעיל של \( A \).

הנתון שלנו הוא ש-\( A \) היא קבוצה לא ריקה וחסומה. מכך שהיא לא ריקה נסיק שיש \( x\in A \) כלשהו. מכך שהיא חסומה נסיק קיים מספר \( M\in\mathbb{F} \) שהוא חסם מלעיל של \( A \).

עכשיו הגיע הזמן להשתמש בארכימדיות. אני אצטט את אחד מהניסוחים של ארכימדיות שנתתי בפוסט הקודם:

“עוד דרך לחשוב על זה, שאני אוהב במיוחד, היא זו: בואו ניקח \( \varepsilon>0 \) כלשהו, כשהאינטואיציה היא לחשוב על \( \varepsilon \) בתור משהו ממש ממש קטן (זה השימוש הסטנדרטי של האות הזו בחדו”א). בואו ניקח גם \( M>0 \) כלשהו, כשהאינטואיציה היא לחשוב עליו בתור מספר ממש ממש ענק. אז ארכימדיות פירושה שקיים \( n \) כך ש-\( n>\frac{M}{\varepsilon} \), או במילים אחרות \( n\varepsilon>M \). זה אומר שלא משנה עד כמה משהו קטן - אם אנחנו בשדה ארכימדי, לחבר אותו מספר פעמים לעצמו יגרום לו לעבור בגודלו כל מספר כולל ענקיים.”

אוקיי, “מספר ענק” \( M \) כבר יש לנו - זה החסם מלעיל של \( A \). המספר הקטן שלנו יהיה \( \varepsilon=\frac{1}{2^{n}} \), והארכימדיות תיתן לנו מספר שלם \( T \) כך ש-\( \frac{T}{2^{n}}>M \) - כלומר, קיבלנו שקיים חסם מלעיל של \( A \) שהוא מהצורה \( \frac{T}{2^{n}} \) כאשר \( T \) שלם. הרעיון הוא שעכשיו אפשר להתחיל “ללכת אחורה” מה-\( T \) הזה עד שמוצאים את הערך המינימלי שעדיין נשאר חסם מלעיל, אבל בשביל זה צריך כמובן להשתכנע שאם נלך מספיק אחורה באמת נגיע למצב שבו האיברים שלנו הם כבר לא חסמים מלעיל. כאן נזדקק ל-\( x\in A \) שמצאנו, ולתכונה הארכימדית פעם נוספת.

מה שהייתי רוצה למצוא הוא \( S \) שלם כך ש-\( \frac{S}{2^{n}}<x \), כי אז \( \frac{S}{2^{n}} \) הוא בודאות לא חסם מלעיל של \( A \). אבל איך מוצאים את זה עם ארכימדיות, שנותנת לנו משהו גדול יותר? בפוסט הקודם אמרנו שזו לא בעיה כי עושים טריק של כפל ב-\( -1 \), אז בואו נעשה טריק של כפל ב-\( -1 \): נשתמש בארכימדיות כדי למצוא \( R \) שלם כך ש-\( -x<\frac{R}{2^{n}} \), ואז נכפול את שני האגפים ב-\( -1 \), נסמן \( S=-R \) ונקבל שמצאנו \( S \) שלם כך ש-\( \frac{S}{2^{n}}<x \).

עכשיו סיימנו: קיבלנו את הסדרה הסופית \( S,S+1,S+2,\ldots,T \) שהאיבר הראשון בה לא נותן חסם מלעיל של \( A \) והאיבר האחרון בה כן נותן חסם מלעיל כזה, אז פשוט ניקח את \( k_{n} \) להיות האיבר המינימלי בסדרה שנותן חסם מלעיל. הוא בודאות קיים (כי זו סדרה סופית, ויש לפחות איבר אחד בסדרה שמקיים את הקריטריון הזה) והוא בודאות גדול מ-\( S \) ולכן \( k_{n}-1 \) הוא גם כן איבר בסדרה, והוא איבר שעבורו לא מתקבל חסם מלעיל של \( A \) - בדיוק מה שרצינו.

אם כן - סיימנו את ההוכחה, הבנו את הקשר בין שלמות-דדקינד ושלמות-קנטור, ועכשיו נשאר לנו רק דבר אחד: להראות את הבניות של קנטור ודדקינד ואיך הן שתיהן נותנות לנו את \( \mathbb{R} \).


נהניתם? התעניינתם? אם תרצו, אתם מוזמנים לתת טיפ:

Buy Me a Coffee at ko-fi.com