למה הרציונליים הם ממידה אפס (או: הטרחן צועק ולבג צודק)
תודות לבעליו של הבלוג המתמטי העברי החדש “מהומה רבה על לא דבר” גיליתי מכרה זהב טרחני לא מבוטל. הטרחן שבקישור מתהדר בכמה ממוצגי הטרחנות הקלאסיים - “הוכחות” קצרות לבעיות מתמטיות קשות ומפורסמות כמו השערת פואנקרה והשערת רימן, כמו גם הוכחה לכך שאקסיומת הבחירה שקולה להשערת הרצף (ממש ממש לא - השערת הרצף אינה תלויה באקסיומות הרגילות של תורת הקבוצות, גם אם מכניסים פנימה את אקסיומת הבחירה). בנוסף, וגם זה כרגיל אצל טרחנים, הוא מראה כי מתמטיקאים מפורסמים טעו. קנטור הוא הקורבן הראשון, אבל קנטור הוא קורבן לכל טרחן אפשרי בערך, ולכן פחות מעניין כאן. הקורבן השני של הטרחן מעניין יותר - אנרי לבג הצרפתי, הממציא של אינטגרל לבג (ככל הנראה הכללתו החשובה ביותר של האינטגרל ה”רגיל”, אינטגרל רימן) ומי שנתן תנופה עצומה להתפתחותה של תורת המידה המתמטית. ולמה הטרחן נטפל? להוכחה המקסימה אך הפשוטה מאוד של לבג לכך שקבוצת המספרים הרציונליים היא ממידה אפס. במאמרו, הטרחן תוקף את הטענה בשלוש דרכים שונות, כולן שגויות באופן מעורר חלחלה. למרבה המזל המאמר קצר מאוד והשגיאות שבו בולטות מאוד לעין כך שניתן לדון בהן, ולדעתי הן מסייעות לשים דגש על מספר נקודות עדינות שאולי לא ברורות דיו למי שזה עתה נתקל בתחום - וכמובן, זה תירוץ טוב להציג את ההוכחה של לבג, שבפני עצמה היא קצרה מדי מכדי שיוקדש לה פוסט עצמאי.
נתחיל קודם כל מהמתמטיקה האמיתית - ההוכחה של לבג. לשם כך צריך להבהיר קודם כל מהי מידה, על קצה המזלג. הרעיון הבסיסי שמאחורי מידה הוא הכללה של שלושה מושגים מוכרים שהם בעצם אותו הדבר בממדים שונים - אורך, שטח, ונפח. כולם מהווים מדד מסויים ל”כמות” או ל”גודל”, אף שצריך להיות מאוד זהירים עם הנימוקים האינטואיטיביים הללו, כי יש להם פירושים מתמטיים אחרים שונים בתכלית (בפרט למושג ה”גודל” של קבוצות אינסופיות קיים מושג ה”עוצמה” של קנטור, וישנן דוגמאות לקבוצות שעוצמתן גדולה - לא בת מניה - אך המידה שלהן היא אפס). כדי להגדיר אורך באופן מפורש מתחילים מהגדרת אורך של אובייקט פשוט - קטע סגור \( \left[a,b\right] \) כלשהו, שאורכו מוגדר פשוט בתור \( b-a \). כלומר, אורך הקטע \( \left[0,1\right] \) הוא 1, כמו אורך הקטע \( \left[1,2\right] \), ואילו אורך הקטע \( \left[-2,5\right] \) הוא 7, וכן הלאה. זוהי הגדרה שעליה קשה לחלוק.
בעזרת אורך של קטע אפשר להגדיר שטח של מלבן: אם אורך צלעות המלבן הוא \( x,y \) בהתאמה, אז שטחו יהיה \( x\cdot y \). בדומה אפשר להגדיר נפח של תיבה באמצעות מכפלת אורכי צלעותיה. אך כל אלו הן צורות “פשוטות”- מה עם צורות מורכבות יותר?
כאן נכנסת לתמונה האינטואיציה הנוספת שלנו ביחס למידה - אם יש לנו שתי קבוצות, \( A,B \), הזרות זו לזו (אין להן נקודות משותפות), אז המידה של \( A\cup B \) שווה לסכום המידות של \( A,B \). בצורה זו ניתן להגדיר מידה של קבוצה קצת יותר מתוחכמת, כמו \( \left[0,1\right]\cup\left[3,5\right] \) - האורך של הקבוצה יהיה 3, סכום אורכי שני הקטעים שמרכיבים אותה. באופן דומה אפשר לטפל גם בצורות דו ממדיות ותלת ממדיות שניתן להציג כאיחוד של מלבנים ותיבות. כאן כבר נכנס קושי טכני כלשהו לתמונה - לרוב כשנתונה לנו צורה מורכבת שעדיין ניתנת לחלוקה לאיחוד סופי של מלבנים, המלבנים שבאיחוד יהיו חייבים לגעת זה בזה בשפה שלהם. זו לא בעיה אמיתית מכיוון שהמידה של השפה היא 0 (לא אוכיח זאת כאן, אבל לפחות במקרה החד ממדי זה נובע מיידית ממה שכן אוכיח, שכן השפות במקרה זה יהיו קבוצות בנות מניה של נקודות), ולכן לא אתעכב יותר מדי על נקודה זו. לתכונה שהראיתי כעת, על כך שמידה של איחוד שתי קבוצות זרות שווה לסכום המידות של הקבוצות, קוראים אדיטיביות (“חיבוריות”).
אלא שאדיטיביות עדיין לא מספיקה לנו כדי לתאר קבוצות שהן מאוד טבעיות, ובראש ובראשונה עיגול. לא משנה כמה נרצה, לא נוכל לתאר עיגול כמורכב ממספר סופי של מלבנים (נימוק מהיר - השפה של כל מלבן היא קו ישר; אם העיגול יתואר ע”י מספר סופי של מלבנים, אז השפה של אחד מהם תהיה גם שפת העיגול; אבל השפה של עיגול היא אף פעם לא קו ישר). עם זאת, אפשר לקרב מצויין עיגולים על ידי מלבנים - נסו לצייר עיגול ולמלא אותו ככל יכולתכם במלבנים - התוצאה תהיה טובה למדי. למעשה, זה בדיוק הרעיון שמאחורי אינטגרל רימן - קירוב שטחים באמצעות מלבנים. אם מרשים לצייר אינסוף מלבנים, אז ניתן לקבל בדיוק את העיגול כולו, למעט שפתו (שכאמור, מידתה היא 0) - כלומר, אפשר איכשהו למלא את שטח העיגול באינסוף מלבנים כך שכל נקודה בעיגול שאיננה על השפה תוכל באחד המלבנים, וכל המלבנים יהיו זרים (למעט חפיפה בשפות שלהם). אם \( A_{i} \) היא סדרת המלבנים שמקרבת את העיגול, טבעי יהיה להגדיר את שטח העיגול בתור סכום שטח כל המלבנים בסדרה, כלומר \( \mu\left(\bigcup_{i=1}^{\infty}A_{i}\right)=\sum_{i=1}^{\infty}\mu\left(A_{i}\right) \) (כש-\( \mu \) הוא סימון מקובל עבור מידה). סכום אינסופי איננו אובייקט בעייתי במיוחד - בחשבון האיניפינטסימלי יש לו הגדרה מדוייקת ונאה, שמתאימה לאינטואיציה שהצגנו כאן. אם כן, תכונה סבירה לדרוש ממידה באופן כללי היא שאם \( A_{i} \) היא סדרה של קבוצות זרות זו לזו, אז יתקיים \( \mu\left(\bigcup_{i=1}^{\infty}A_{i}\right)=\sum_{i=1}^{\infty}\mu\left(A_{i}\right) \). לתכונה זו קוראים סיגמה-אדיטיביות (ה”סיגמה”בא לציין שמדובר באדיטיביות על קבוצה אינסופית אך בת מניה של מחוברים).
כעת אפשר להוכיח כי מידת הרציונליים היא אפס. על פניו זה נשמע מטופש להחריד, כי עדיין לא הגדרתי מהי מידה! רק תיארתי שתי תכונות שאני מצפה ממידה לקיים (אורך של קטע \( \left[a,b\right] \) הוא \( b-a \), וסיגמה-אדיטיביות). מסתבר שאין צורך בהרבה יותר מכך כדי להוכיח כי כל פונקציה שמקיימת את התכונות הללו תיתן אפס לקבוצת המספרים הרציונליים; התכונה המהותית הנוספת היחידה שאדרוש היא שהמידה של כל קבוצה היא אי-שלילית (היא יכולה להיות אפס או אינסוף). זה כמובן טבעי לחלוטין, כי בהקשר של “אורך”או “נפח” אין משמעות לערך שלילי.
האבחנה הראשונה היא שאם יש לנו שתי קבוצות \( A,B \) כך ש-\( A\subseteq B \), אז \( \mu\left(A\right)\le\mu\left(B\right) \). זאת מכיוון שניתן להציג את \( B \) בתור איחוד זר של \( A \) ושל כל אברי \( B \) שאינם ב-\( A \), כלומר \( \mu\left(B\right)=\mu\left(A\right)+\mu\left(B\backslash A\right) \), ומכיוון ששני המחוברים באגף ימין אי שליליים מתקבלת התוצאה.
האבחנה השנייה היא שאם יש לנו אוסף קבוצות \( A_{i} \) שאינן בהכרח זרות זו לזו, אז אמנם כבר לא ניתן לומר שהמידה של איחודן היא סכום המידות שלהן, אבל סכום המידות שלהן הוא בוודאי עדיין חסם למידה שלה: \( \mu\left(\bigcup A_{i}\right)\le\sum\mu\left(A_{i}\right) \). נסו להוכיח זאת - זה תרגיל פשוט למדי.
המסקנה משני אלו היא שאם יש לנו קבוצה \( A \), ואנחנו מצליחים איכשהו לכסות אותה באמצעות סדרת קבוצות \( B_{i} \), כלומר שיתקיים \( A\subseteq\bigcup B_{i} \), אז \( \mu\left(A\right)\le\sum\mu\left(B_{i}\right) \). לכן ככל שנצליח לכסות את \( A \) על ידי \( B_{i} \) עם מידה קטנה יותר, נקבל חסם טוב יותר על מידת \( A \). ועדיין, איך אפשר להשתמש בזה כדי להוכיח שמידת \( A \) היא ממש אפס? האם לא צריך לשם כך לכסות את \( A \) על ידי קבוצות שמידת כולן אפס? ואילו קבוצות כאלו קיימות? זכרו - כרגע כל מה שאנחנו יודעים את המידה שלו הם קטעים סגורים, אבל המידה של כל קטע סגור לא טריוויאלי גדולה מאפס. אז מה עושים?
כאן נכנס היופי של החשבון האינפיניטסימלי לתמונה במלוא כוחו. כדי להראות ש-\( \mu\left(A\right) \) היא אפס, לא צריך אף פעם להראות את השוויון הזה באופן ישיר - די לנו להראות כי לכל מספר גדול מאפס \( \varepsilon>0 \), מתקיים \( \mu\left(A\right)\le\varepsilon \). מכיוון שבנוסף לכך \( \mu\left(A\right)\ge0 \) על פי הגדרת מידה, נובע מכך שמידת \( A \), אם היא מוגדרת, חייבת להיות אפס - כי אם היא הייתה גדולה מאפס, נניח \( t \), אז עבור \( \varepsilon=\frac{t}{2}>0 \) לא היה מתקיים ש-\( \mu\left(A\right)\le\varepsilon \). הוכחות כאלו הן הלחם והחמאה של החשבון האינפיניטסימלי, והמחשה חזקה מאוד לאופן שבו הוא מצליח, למרות שלכאורה הוא עוסק רק בקירובים והזנחות, לתת תוצאות מדוייקות לחלוטין (כך למשל האינטגרל - מושג שכל כולו קירובים “עקומים”באמצעות מלבנים, מצליח לתת במדוייק ערכים מורכבים רבים - למשל, שטח עיגול).
נעבור כעת לקבוצה הקונקרטית \( A \) של המספרים הרציונליים. למה דווקא הרציונליים? למעשה, ההוכחה שנציג עובדת לכל קבוצה בת מניה (כלומר, שניתן למספר את אבריה במספרים טבעיים בלי חזרות - קבוצת המספרים הממשיים אינה כזו, ולמעשה אף קטע אינו כזה - מספר הנקודות בכל קטע הוא לא בן מניה), והרציונליים הם בעיקר לשם הקוריוז, מכיוון שהם צפופים בישר הממשי - כלומר, כל קטע שרק ניקח, קטן ככל שיהיה, יכיל מספר רציונלי, מה שלכאורה אמור לתת את התחושה שהמידה שלהם דווקא צריכה להיות גדולה, ואף אינסופית.
יהי \( \varepsilon>0 \) כלשהו, ונתבונן במניה כלשהי של הרציונליים: \( a_{1},a_{2},a_{3},\dots \). לכל רציונלי \( a_{i} \) נתאים קטע סגור \( B_{i} \) שמכיל את \( a_{i} \), כך שהגדלים של ה-\( B_{i} \) דועכים אקספוננציאלית. או בעברית: \( B_{i}=\left[a_{i},a_{i}+\frac{\varepsilon}{2^{i}}\right] \). על פי ההגדרה, \( \mu\left(B_{i}\right)=\frac{\varepsilon}{2^{i}} \), ועל כן קיבלנו מייד ש-\( \mu\left(\mathbb{Q}\right)\le\sum_{i=1}^{\infty}\mu\left(B_{i}\right)=\sum_{i=1}^{\infty}\frac{\varepsilon}{2^{i}}=\varepsilon \), כאשר המעבר האחרון נובע מהנוסחה הידועה לסכום של טור הנדסי מתכנס - זוהי בדיוק אותה נוסחה של פרדוקס אכילס של זנון.
זהו, נגמרה ההוכחה. כאמור, זו הוכחה קצרצרה, ובזבזנו את רוב הזמן על מבוא ותיאור אינטואיטיבי, אבל מבחינת החישובים, מספיקה חצי שורה, ואין כאן שום דבר מסובך.
ועם זאת, את הטרחן זה לא מספק, והוא משוכנע שלבג טעה כשנתן את ההוכחה הזו. מה שבאמת מחפיר הוא שהטרחן מצטט את ההוכחה של לבג במדוייק, ועדיין טוען כנגדה טענות שגויות לחלוטין.
אז איך כבר ניתן לתקוף את ההוכחה הפשוטה הזו?
הטענה הראשונה שלו כל כך נפלאה שאצטט אותה כאן במדוייק, כמעט מילה במילה:
אם \( \varepsilon \) מושווה לאפס, הסכימה היא על אינסוף קטעים מנוונים מאורך 0, וסכום אורכיהם הוא מהצורה \( \frac{1}{2}\varepsilon+\frac{1}{2^{2}}\varepsilon+\frac{1}{2^{3}}\varepsilon+\dots=0+0+0+\dots=0\cdot\infty \). ואף אחד לא יודע מה פירושו של \( 0\cdot\infty \). \( 0\cdot\infty \) יכול להיות שווה לכל מספר \( a \), או לאינסוף, או לאפס.
מה שכל כך יפה כאן הוא שהטרחן דווקא נוהג כמתמטיקאי טוב ומזהיר מפני הביטוי המסוכן \( 0\cdot\infty \). הוא צודק לחלוטין בכך שהוא אומר שהביטוי הזה יכול להיות שווה לכל דבר - תלוי בהקשר. לרוב \( \infty \)לא צץ מעצמו במערכת המספרים שלנו אלא כתוצר של תהליך גבולי כלשהו. למשל, \( \lim_{x\to0}\frac{1}{x^{2}}=\infty \). הביטוי \( 0\cdot\infty \) יכול לצוץ באופן טבעי, אם כך, אם אנחנו מסתכלים על הגבול של מכפלת שתי פונקציות, שאחת שואפת לאפס והשניה לאינסוף. במקרה הזה אכן לא ברור מיידית מה תהיה התוצאה, וזה תלוי מאוד בזהות הפונקציות. אלא מה? אין לזה שום קשר להוכחה של לבג.
המעבר הבעייתי הוא בין \( 0+0+0+\dots \) לבין \( 0\cdot\infty \). אין לאינסוף שלו שום משמעות קונקרטית כאן - אם יש לנו סכום אינסופי על קבוצת איברים קבועה, זה עדיין לא אומר שהסכום הוא אינסוף כפול האיבר הקבוע של הסדרה, פשוט כי \( \infty \) לא הוגדר בתור אובייקט אלגברי, אי אפשר לכפול בו וכו’. גם אם טורחים להגדיר אותו בתור אובייקט אלגברי (ועושים זאת לעתים קרובות כאשר עוסקים בתורת המידה), זה עדיין לא תקף לגבי הטור הזה, שבו אינסוף לא מייצג כמות אלא את מספר הנסכמים. הדרך הנכונה לטפל בטור הזה היא פשוט על ידי ההגדרה הבסיסית של טורים אינסופיים - מסתכלים על גבול סדרת הסכומים החלקיים. כל סכום חלקי הוא 0, ולכן גבולה של סדרת הסכומים החלקיים הוא 0, ולכן הטור הוא 0, וחסל.
אלא מה? כל הדיון הזה מיותר לחלוטין, מהטעם הפשוט שבכלל לא צריך להציב \( \varepsilon=0 \)! שימו לב להוכחה שלי - הוכחתי שלכל \( \varepsilon \) שהוא גדול מאפס, מידת הרציונליים קטנה מאותו אפסילון. בשום שלב לא נזקקתי להצבה \( \varepsilon=0 \) - כאמור, כל היופי בחשבון האינפיניטסימלי הוא שכלל לא צריך אותה. אם יורשה לי להיות קיצוני - אדם שלא מבין את הנקודה הזו, לא ייתכן שיוכיח את השערת רימן, ולכן לא אטרח לקרוא את המאמר של הטרחן שבו הוא מתיימר לעשות זאת.
המתקפה השניה של הטרחן על ההוכחה מעניינת הרבה יותר. במקרה זה אקצר מעט את הקשקשת. ראשית כל, הוא מתמקד רק ברציונליים שבקטע \( \left[0,1\right] \), שעליהם דיבר לבג בהוכחה המקורית (מן הסתם זה לא משנה מאום). כעת הוא אומר דבר כזה - ניקח את הקבוצה המשלימה של \( \bigcup B_{i} \) ביחס לקטע \( \left[0,1\right] \) - מה שנקבל הוא, לדבריו: “איחוד של קטעים עם אורך כולל של לפחות \( 1-\varepsilon \)”. ואז הוא מעלה את השאלה “האם ייתכן שיהיה קטע לא מנוון שאין בו מספרים רציונליים?” והתשובה לכך היא כמובן שלילית, בשל צפיפות הרציונליים. מכאן הטרחן מסיק ש”טענת לבג שהוא מסוגל לשמור את הרציונליים מחוץ לאינסוף קטעים ב-\( \left[0,1\right] \) איננה אמינה”. אוי ווי.
מה הבעיה כאן? שהטרחן לא זוכר דברים בסיסיים בתורת הקבוצות. הוא אמנם צודק בכך שהמשלים של \( \bigcup B_{i} \) אינו יכול לכלול בתוכו קטעים כי זה יעמוד בסתירה לצפיפות הרציונליים, אבל הוא לא מבין שאין שום סיבה שהמשלים יכיל קטעים! בפרט, המשלים ממש איננו “איחוד של קטעים”- אם הולכים לפי כללי תורת הקבוצות הבסיסיים מקבלים \( \overline{\bigcup B_{i}}=\bigcap\overline{B_{i}} \), דהיינו מקבלים חיתוך אינסופי של משלימי קטעים (על משלימי קטעים אפשר לחשוב כאיחוד של קטעים). החיתוך הזה הוא שמבטיח שכל קטע אפשרי בתוך \( \left[0,1\right] \) לא ישתתף ב-\( \bigcap\overline{B_{i}} \), והנימוק פשוט - ניקח קטע כלשהו, אז מצפיפות הרציונליים הוא מכיל רציונלי \( a_{i} \), כלומר \( a_{i}\in B_{i} \) כלומר \( a_{i}\notin\overline{B_{i}} \), כלומר \( a_{i}\notin\bigcap\overline{B_{i}} \). כמובן שההוכחה הפורמלית הזו לא עוזרת “לראות” את הקבוצה המוזרה \( \bigcap\overline{B_{i}} \) - חשבו עליה בתור הישר עם המון חורים קטנטנים בתוכו, אבל “לא יותר מדי” - אבל היא מראה שאין שום בעיה פורמלית, בניגוד למה שהטרחן סבור.
ברשותכם, לא אתייחס למתקפה השלישית, שהיא עוד יותר מקושקשת מקודמותיה ואיני מוצא בה תוכן מעניין. אם כן, מה היה לנו? הוכחה יפה ופשוטה של טענה מעניינת (אך בסיסית), ושתי “הפרכות” שלה שמצביעות על בעיות אינטואיציה שאני מניח שלרוב העוסקים במתמטיקה יש, לפחות כאשר הם נתקלים לראשונה בחומר. אבל בעיקר יש כאן מוטיבציה לעיסוק קצת יותר מעניין במידות - בפרט, בפוסט הבא בנושא אוכיח שלמרבה הצער, פשוט לא קיימת מידה משביעת רצון (תחת הגדרה נאיבית של “משביעת רצון”) על הישר הממשי.
נהניתם? התעניינתם? אם תרצו, אתם מוזמנים לתת טיפ: