למה אין מידה על כל הישר הממשי

בפוסט הקודם דיברתי על מושג המידה. מידה היא הכללה של מושג האורך-שטח-נפח לקבוצות “מסובכות” ככל הניתן; בפוסט הזה אני רוצה להראות שיש להכללה הזו גבולות. כמו בפוסט הקודם כך גם כאן לא אציג הגדרה מדוייקת של מידה, אלא אתאר כמה תכונות “רצויות” שהיינו מצפים שמידה תקיים, ואז אראה שאם כולן מתקיימות אז יש לנו בעיה מסויימת. הסיבה לגישה החמקנית הזו היא כפולה - ראשית, במתמטיקה תמיד מעדיפים להניח כמה שפחות אם ניתן, כי אז התוצאות שמושגות הן כלליות יותר; ושנית, הקושי שאני מתאר מהווה מוטיבציה להגדרות שבאות לאחר מכן.

אסתפק כאן בדיבור על מידה על הישר הממשי - \( \mathbb{R} \) - אף כי ניתן להגדיר מידה על קבוצות כלליות בהרבה. הבה ונסכם את הדרישות שלנו ממידות: אנחנו רוצים שמידה תהיה פונקציה שלכל תת קבוצה של \( \mathbb{R} \) מתאימה מספר ממשי אי שלילי או “אינסוף” (שנסמן באמצעות \( \infty \)). שתי תכונות בסיסיות שאנו מצפים שמידה תקיים תוארו בפוסט הקודם: ראשית, אנו רוצים שעל קטעים המידה תתנהג באופן שמכליל את מושג האורך, כלומר ש-\( \mu\left(\left[a,b\right]\right)=b-a \). שנית, אנחנו רוצים שהמידה תהיה סיגמה-אדיטיבית, כלומר שיתקיים \( \mu\left(\bigcup_{i=1}^{\infty}A_{i}\right)=\sum_{i=1}^{\infty}\mu\left(A_{i}\right) \) כאשר ה-\( A_{i} \) הן קבוצות זרות - כלומר, שאם בונים קבוצה מכמה קבוצות נפרדות, אז המידה של הקבוצה תהיה סכום המידות של הרכיבים, אחרת צצות אנומליות של “השלם גדול/קטן מסך רכיביו” שלא תואמות את האינטואיציה שלנו לגבי מידה.

כאן עולה הפקפוק הראשון - מדוע אנו דורשים סיגמה-אדיטיביות, כלומר מדוע אנו מרשים מספר אינסופי של מחוברים? ניסיתי לספק לכך תשובה כלשהי בפוסט הקודם - אם לא היינו מרשים זאת, הייתה לנו בעיה משמעותית בהערכת המידה של קבוצות שלא ניתן להרכיב ממספר סופי של קבוצות פשוטות, והדוגמה הקלאסית לכך הייתה עיגול שלא ניתן לתאר כאיחוד סופי של מלבנים, אך ניתן לתאר כאיחוד אינסופי שלהם. למעשה, תכונת הסיגמה-אדיטיביות אומרת כי אם נבנה סדרת קירובים לצורה כלשהי, שהולכת ושואפת לצורה עצמה, אז המידות של הקירובים יהוו קירוב שהולך ומשתפר למידה של הקבוצה עצמה - שימו לב שכאן לא דיברתי כלל על איחוד אינסופי או סכום אינסופי. פסילת הסיגמה-אדיטיביות שקולה לאמירה כי “יש קבוצות שלא ניתן לקרב את המידה שלהן באופן מוצלח” - בעיה מהותית לכשעצמה.

ועם כל הדיון הזה במדוע סיגמה-אדיטיביות היא נחוצה, חשוב להדגיש שהיא איננה התכונה הבעייתית באמת כאן, וארחיב על כך בהמשך.

כעת נותרה לנו רק תכונה אחת שתהווה את המסמר האחרון בארון המתים של המידה - אינוריאנטיות להזזות. מאחורי השם המפוצץ הזה מסתתר רעיון פשוט - האורך של \( \left[0,1\right] \) והאורך של \( \left[1,2\right] \) זהים, אינטואיטיבית, כי אפשר להזיז את \( \left[0,1\right] \) ולשים אותו על \( \left[1,2\right] \) בצורה כזו שתהיה התאמה מושלמת ביניהם - כל נקודה של \( \left[0,1\right] \) תתאים לנקודה של \( \left[1,2\right] \). הדגש כאן הוא על “להזיז”, כי אפשר לבצע פעולות אחרות על \( \left[0,1\right] \) - למשל, “למתוח” אותו עד שיתאים לקטע \( \left[0,2\right] \). האינטואיציה שלנו היא שהזזות לא אמורות לשנות את ה”אורך” של הקטע, בזמן שמתיחות דווקא כן. למי שעדיין לא משוכנע, נקודת מבט אחרת על העניין היא זו: ההבדל המהותי בין \( \left[0,1\right] \) ובין \( \left[1,2\right] \) הוא בסך הכל מרחקם מראשית הצירים, מרחק שנקבע באופן שרירותי למדי. אפשר באותה מידה היה להזיז את ראשית הצירים יחידה אחת שמאלה והישר הממשי עדיין היה נראה זהה, אבל הקטע \( \left[0,1\right] \) היה הופך באופן קסום לקטע \( \left[1,2\right] \), ולכן גם מידתו הייתה משתנה, אם המידה לא הייתה אינוריאטית להזזות.

פורמלית, אם \( A \) היא קבוצה, אז מגדירים \( A+x \) כאשר \( x \) הוא מספר ממשי, בתור \( A+x=\left\{ a+x|a\in A\right\} \). אינוריאנטיות להזזות פירושה ש-\( \mu\left(A+x\right)=\mu\left(A\right) \) לכל \( x \) וכל \( A \).

וכעת הפאנץ’: לא קיימת מידה על כל תת הקבוצות של \( \mathbb{R} \) שהיא גם אינוריאנטית להזזות, גם סיגמה-אדיטיבית וגם נותנת לכל קטע את אורכו. הסיבה: אם \( \mu \) מקיימת אינוריאנטיות להזזות וסיגמה-אדיטיביות ומוגדרת על כל תת הקבוצות של \( \mathbb{R} \), אז אפשר להראות ש-\( \mu\left(\left[0,1\right]\right) \) הוא או 0 או \( \infty \), אבל בשום פנים ואופן לא 1. ולמה? כי כפי שאראה כעת, ניתן להציג את \( \left[0,1\right] \) בתור איחוד בן מניה של קבוצות שהמידה של כולן זהה. כלומר, למצוא סדרה אינסופית של \( A_{i} \)-ים זרות זו לזו כך ש-\( \left[0,1\right]=\bigcup_{i=1}^{\infty}A_{i} \) וכך שיש מספר ממשי כלשהו \( t \) (או אינסוף) כך ש-\( \mu\left(A_{i}\right)=t \) לכל \( i \). הסיגמה-אדיטיביות של המידה גוררת שבמקרה זה מתקיים \( \mu\left(\left[0,1\right]\right)=\mu\left(\bigcup_{i=1}^{\infty}A_{i}\right)=\sum_{i=1}^{\infty}\mu\left(A_{i}\right)=\sum_{i=1}^{\infty}t \), וסכום של אינסוף מחוברים זהים זה לזה שהם או חיוביים או 0 יכול להיות רק אינסוף (אם \( t>0 \)) או 0 (אם \( t=0 \)).

כדי להבין עד כמה ה-\( A_{i} \)-ים הללו מוזרים, חשבו על האופן שבו אנו מקרבים עיגול. ראשית אנו מציירים ריבוע גדול במרכז העיגול, שקודקודיו נוגעים בשפת העיגול. כעת “מיצינו” את רוב שטח העיגול וכל מה שנותר הוא כמה פינות שלא הצלחנו להגיע אליהן. גם בתוכן אנחנו מציירים מלבנים - קטנים בהרבה מהריבוע שבמרכז - ואז שוב תפסנו את “רוב השטח” ונשארו רק עוד כמה חורים. גם בהם אנחנו מטפלים באופן דומה, וכן הלאה וכן הלאה - כלומר, בכל פעם אנחנו משפרים את הקירוב שלנו על ידי הוספת קבוצות שהן קטנות משמעותית מקודמותיהן (דהיינו, בעלות מידה קטנה יותר). ה-\( A_{i} \)-ים הם סדרת קירובים שלא משתפרת אף פעם - הגודל של כל איבר בסדרה זהה, כך שה”טעות” שלנו לא באמת שואפת לאפס. במילים אחרות, אנחנו מראים שאפשר לקרב את \( \left[0,1\right] \) על ידי סדרת קירובים שבכלל לא מהווה קירוב. פלא שמגיעים לסתירה?

אם כן, איך בונים את ה-\( A_{i} \)-ים הללו? הבניה מעט מחוכמת (פשוט כי בניה טריוויאלית לא הייתה עובדת כאן - כפי שנראה, כדי שהבניה תעבוד הקבוצות \( A_{i} \) צריכות להיות “מוזרות”) אך היא אינה מורכבת מדי מבחינה טכנית, ולטעמי היא פשוט יפהפיה. הרעיון הבסיסי, כפי שניתן לשער, הוא לבנות קבוצה מיוחדת \( A\subseteq\left[0,1\right] \), ואת כל ה-\( A_{i} \) לקבל כהזזות של אותה \( A \), כך שהמידות של כולן יהיו שוות למידה של \( A \). אלא שמכיוון שאנו עוסקים בנסיון לבנות את \( \left[0,1\right] \), לעבוד עם סתם הזזות יהיה בעייתי, כי הזזה של \( A \) יכולה להוציא חלק מנקודות \( A \) אל מחוץ ל-\( \left[0,1\right] \), ולכן נשתמש במושג טיפה שונה - “הזזה מודולו 1”. הרעיון כאן הוא שאם נקודה עוברת את 1 כשמזיזים אותה, תכף ומייד מחזירים אותה דרך 0. כדי לראות זאת באופן ציורי חשבו כאילו אנו תופסים את קצוות הקטע \( \left[0,1\right] \) ו”מדביקים”אותם לקבלת עיגול, וכעת מי שיוצא דרך 1 אכן נכנס תכף ומייד דרך 0. פורמלית אפשר להגדיר זאת כך: עבור \( a\in\mathbb{R} \) נגדיר את “הערך השברי” של \( a \) בתור “כל מה שנמצא מימין לנקודה העשרונית בפיתוח של \( a \)”. למשל, אם \( a=3.5 \) אז הערך השברי שלו הוא \( 0.5 \). נהוג לסמן את הערך השברי כ-\( \left\{ a\right\} \), כלומר \( \left\{ 7.31\right\} =0.31 \). עם ההגדרה הזו קל להגדיר הזזה מודלו 1: \( a+x \) מודולו 1 הוא פשוט \( \left\{ a+x\right\} \). יש כאן לכאורה בעיה כי 1 עובר כך ל-0, ומי שזה ממש מפריע לו יכול לחשוב מעתה על ההוכחה כאילו היא עוסקת בקטע החצי פתוח \( [0,1( \), שגם מאורכו שלו אנו מצפים שיהיה 1.

כעת נעבור להגדרת \( A \), ואת זה נעשה באמצעות יחס שקילות (מי שאינו מכיר את המושג כנראה יתקשה טיפונת להבין מה אני מקשקש בהמשך - מומלץ בחום לקרוא הסבר קודם): נגיד ש-\( x \) שקול ל-\( y \) אם ההפרש שלהם הוא מספר רציונלי: \( x-y\in\mathbb{Q} \). כך למשל \( \pi,\pi+\frac{1}{2} \) שקולים כי הפרשם הוא \( \frac{1}{2} \) הרציונלי, אבל \( \pi,\frac{1}{2} \) אינם שקולים כי אם הפרשם היה רציונלי, גם \( \pi \) היה רציונלי (למה?) וידוע שהוא אינו רציונלי. לא קשה לראות שזה יחס שקילות - \( x-x=0 \) וזה מספר רציונלי, כך ש-\( x \) שקול לעצמו; ואם \( x-y \) הוא רציונלי כך גם \( y-x \) (מינוס של מספר רציונלי הוא רציונלי) ולכן היחס סימטרי, ואם \( x-y \) רציונלי וגם \( y-z \) רציונלי, כך גם \( x-z=\left(x-y\right)+\left(y-z\right) \) כי סכום של רציונליים הוא רציונלי, ולכן היחס טרנזיטיבי. מכאן שאפשר לחלק את כל המספרים בקטע \( \left[0,1\right] \) למחלקות שקילות זרות; ו-\( A \) שלנו תוגדר בתור אוסף נציגים לכל מחלקות השקילות הללו. כלומר - לכל מחלקת שקילות של היחס שהגדרתי, \( A \) תכיל בדיוק איבר אחד מאותה מחלקת שקילות.

משהגדרנו את \( A \) אפשר חיש קל להגדיר את כל ה-\( A_{i} \)-ים. מה שנעשה יהיה להגדיר מספור כלשהו של הרציונליים בקטע \( \left[0,1\right] \), ו-\( A_{i} \) תוגדר בתור \( A+q_{i} \) - בתור הקבוצה \( A \) כשמזיזים את כל אבריה ברציונלי \( q_{i} \) (הרציונלי ה-\( i \) ברשימה) מודולו 1, כמו שתיארתי קודם. לראות שה-\( A_{i} \)-ים מכסות את \( \left[0,1\right] \) זה כמעט מיידי - ניקח \( x\in\left[0,1\right] \) כלשהו, אז הוא שייך למחלקת שקילות כלשהי של היחס שהגדרתי קודם; ולכן קיים \( y\in A \) ששקול ל-\( x \). כעת, אם \( x-y=t \) ו-\( t \) הוא חיובי, אז בפרט \( t \) הוא רציונלי ב-\( \left[0,1\right] \) (רציונלי מהגדרת יחס השקילות; ולא גדול מ-1 כי \( x \) אינו גדול מ-1 ו-\( y \) חיובי). לכן \( t \) משתתף במניה ואנחנו תופסים את \( x \) עם הקבוצה \( A+t \). המקרה ההפוך טיפה יותר מבלבל - אם \( x-y \) הוא מספר שלילי אז \( y-x=t \) הוא חיובי רציונלי, ואז מי שתופס את \( x \) הוא דווקא \( 1-t \) (כלומר, \( x\in A+\left(1-t\right) \)). נסו להוכיח זאת לעצמכם כתרגיל.

מה נותר להראות? רק שהמידה של \( A_{i} \) שווה למידה של \( A \). זה נובע מכך שהמידה אינוריאנטית להזזות, אבל מכיוון שיש לנו כאן הזזה מוזרה, מודולו 1, זה לא ברור מיידית. לשם כך אפשר לחשוב על \( A+t \) כמורכבת מאיחוד שתי קבוצות זרות - אחת של הנקודות שכאשר מוסיפים להן \( t \) לא עוברים את 1, והשניה של הנקודות שכאשר מוסיפים להן \( t \) כן עוברים את \( 1 \), ולכן מוזזים מרחק \( t \) “ימינה”, אבל גם מרחק \( -1 \) שמאלה. כלומר, הקבוצה הראשונה מוזזת למרחק \( t \), והשניה מוזזת למרחק (השלילי) \( t-1 \), אבל בשני המקרים אלו הזזות “רגילות” ולכן המידה של שתי הקבוצות הללו נשמרת, ולכן איחוד מידותיהן הוא כמידת \( A \). סיימנו.

יש רק נקודה מהותית אחת שטאטאתי ב”אלגנטיות” אל מתחת לשטיח. אמרתי ש-\( A \) נבנית על ידי בחירת נציגים לכל מחלקות השקילות של היחס המוזר שהגדרתי. בשום מקום לא הסברתי איך אני בוחר נציגים למחלקות הללו. אינטואיטיבית אנו חשים ש”אפשר” לבצע בחירה כזו, אבל מבחינה מתמטית זה לא טריוויאלי כלל; מה שמאפשר לנו לעשות זאת מיידית הוא אקסיומת הבחירה - וכפי שהראו שנים רבות לאחר שההוכחה הזו התגלתה לראשונה, אקסיומת הבחירה גם הכרחית כאן; בלעדיה לא ניתן לייצר דוגמה פתולוגית כמו זו. אם כן, הדוגמה הזו היא המחשה נאה לאופן שבו אקסיומת הבחירה מייצרת לנו תוצאות לא טריוויאליות - ובד בבד זה ממחיש עד כמה הקבוצה \( A \) היא “מוזרה”ו”לא מציאותית”; צריך להתאמץ מאוד כדי לייצר אותה, ואין דרך קונסטרוקטיבית לעשות זאת! על כן איננו חוששים מפני היתקלות ב-\( A \) בחיי היום-יום, וזה מרכך קצת את המכה של הדוגמה הנגדית הזו.

אם כן, ראינו שלא קיימת מידה על הממשיים שמקיימת אינוריאינטיות להזזות, סיגמה-אדיטיביות ונותנת לקטעים את אורכם. איך ממשיכים מכאן, כדי להישאר עם מושג סביר של “מידה”? מקלים קצת על אחת מהדרישות שלנו. על פניו תכונת הסיגמה-אדיטיביות נראית כמו קורבן קל ומתאים, כי היא מהתכונות המתועבות הללו שמרשות משהו אינסופי ואינסוף זה פויה. אבל כבר ניסיתי להסביר בפוסט הזה למה סיגמה-אדיטיביות היא חשובה וטבעית; ויותר מכך, השמטה שלה פשוט לא תעזור לנו בכלום. הדוגמה הנגדית שהצגתי כאן היא רק הראשונה בשרשרת של “פירוקים פרדוקסליים”של קבוצות לחלקים שמסרבים להתנהג יפה; גולת הכותרת של הפירוקים הפרדוקסליים זכתה לכינוי “פרדוקס בנך-טרסקי”, ובבסיסה ניתן לתאר אותה כפירוק של כדור למספר סופי וקטן של חלקים, הזזה שלהם (כמו שכאן הזזנו את \( A \)) והרכבה מחודשת שלהם שיוצרת שני כדורים מאותה מידה כמו הכדור המקורי. גם פרדוקס זה משתמש באקסיומת הבחירה, ואני מקווה לתאר אותו כאן בפירוט בקרוב. לבינתיים המסקנה שצריך לגזור ממנו היא שהסיגמה-אדיטיביות היא לא התכונה ההרסנית כאן, שכן ניתן לשחזר את ההרסניות גם עם אדיטיביות “סופית”.

מה שמוותרים עליו הוא פשוט הדרישה שהמידה תוגדר לכל תת קבוצה אפשרית של הממשיים. כמובן שמידה טובה צריכה להיות מוגדרת על כל הקבוצות ה”מעניינות”, וצריך להיות לקבוצות שהן בעלות מידה מבנה כלשהו שיאפשר להבין מי בעל מידה ומי לא, אבל על השאיפה למידה שמוגדרת לכל קבוצה פשוט מוותרים. כך הקבוצה \( A \) שלנו פשוט לא תהיה בעלת מידה (וגם לא הרכיבים שמשתמשים בהם בפרדוקס בנך-טרסקי). זה אולי מרגיש קצת כמו רמאות, אבל רק אם מניחים מראש שמידה צריכה להיות מוגדרת על כל תת-קבוצה של הממשיים. אם חושבים על כך, מדובר על שאפתנות גדולה מאוד, ואפילו קיצונית, בהתחשב בכמות הזעומה של דברים שיכלנו לדבר על ה”אורך” שלהם קודם.

הדבר מזכיר לי מעט את המהומה הגדולה שנהוג להקים בספרות המתמטיקה הפופולרית סביב חורבן תוכניתו השאפתנית של הילברט לביסוס המתמטיקה - מתעלמים מכך שהתוכנית הייתה כל כך שאפתנית עד שמראש היא הייתה כמעט חסרת סיכוי; זה לא אומר שמשפטי אי השלמות של גדל הפכו אותה לכישלון מוחץ או שהיה צריך להשליך כל דבר שקשור בה לפח. זה מזכיר גם, כמובן, את תורת הקבוצות הנאיבית שקרסה עם גילוי הפרדוקס של ראסל; אך כמובן שמייד לאחר מכן היא קמה לתחייה מן האפר כתורת הקבוצות האקסיומטית, שבה ממש לא כל דבר הוא קבוצה, אך זה רק מחדד עבורנו את ההבנה של מה קבוצה היא כן. בדומה, במקרה שלפנינו, הדוגמה הנגדית שהצגתי אינה רעה; ההפך, היא מחדדת את ההבנה שלנו את מושג המידה ומה בכלל המשמעות שלו.


נהניתם? התעניינתם? אם תרצו, אתם מוזמנים לתת טיפ:

Buy Me a Coffee at ko-fi.com