הפרדוקס של בנך-טרסקי (חלק ב’)

הפוסט הקודם שלי על פרדוקס בנך-טרסקי עורר זעם רב בציבור הקוראים ואולי בעולם כולו - למרות שכבר בשורת הפתיחה של הפוסט הבהרתי בדיוק מהו פרדוקס בנך-טרסקי, הטענה הייתה שהפוסט בכלל לא התעסק בבנך-טרסקי אלא בכל מני שטויות לא קשורות. ובכן, לחלק מהשטויות הלא קשורות הייתה חשיבות בכך שבנך-טרסקי נבנה עליהן, והחלק האחר נועד לתת אינטואיציה ורעיונות שיעזרו בהסבר של בנך-טרסקי עצמו. גם בפוסט הזה לא נגיע לבנך-טרסקי אלא נוכיח פרדוקס אחר - פרדוקס האוסדורף - אבל פרדוקס האוסדורף מכיל את כל הרכיבים המרכזיים של בנך-טרסקי ומהווה את הצעד המרכזי בהוכחה של בנך-טרסקי עצמו; להבין את האוסדורף זה שלב הכרחי בדרך להבנת בנך-טרסקי.

מה אומר פרדוקס האוסדורף? ש-\( S^{2}\backslash D \) היא קבוצה פרדוקסלית (ניתנת לפירוק לכמה חלקים זרים, שאחרי הפעלת איזומטריות כלשהן עליהם מרכיבים שני עותקים של הקבוצה המקורית), כאשר \( S^{2} \) היא ספירת היחידה, ו-\( D \) קבוצה בת מניה. מה אומרים המושגים הללו? אסביר עוד מעט. האוסדורף “כמעט” מראה שספירת היחידה היא פרדוקסלית; בנך-טרסקי מתגברים על מכשול ה”כמעט” הזה, ומראים איך ממנו נובעת הטענה גם עבור כדור היחידה.

ההוכחה של האוסדורף היא יישום ישיר של הטענה שהראיתי בפוסט הקודם, לפיה החבורה החופשית עם שני יוצרים היא פרדוקסלית. האבחנה הראשונה היא שלחבורת האיזומטריות של המרחב \( \mathbb{R}^{3} \) קיימת תת-חבורה חופשית מסדר 2 שכזו. השלב הבא הוא “להרים” את הפרדוקסליות של אותה תת-חבורה לפרדוקסליות של אותה \( S^{2}\backslash D \). אתחיל דווקא בתיאור שלב ההרמה הזה, ואתאר אותו בצורה כללית מעט יותר. לדעתי, זה השלב החשוב ביותר בכל עניין בנך טרסקי, ואולי גם הכי מבלבל להבנה; וזה, כצפוי, השלב שבו אקסיומת הבחירה צצה.

באופן הכי כללי בעולם, אם יש לנו קבוצה \( X \) וחבורה \( G \) שפועלת עליה, מה זה אומר? זה אומר שכל \( g\in G \) מגדיר פרמוטציה כלשהי על אברי \( X \), ושכלל הכפל בחבורה מתורגם להרכבה של הפרמוטציות הללו. בניסוח המתמטי הפורמלי לכל \( g\in G \) מתאימה פונקציה מ-\( X \) אל \( X \), כך שאם \( g,h\in G \) אז \( g\left(h\left(x\right)\right)=\left(g\cdot h\right)\left(x\right) \) (באגף שמאל יש לנו את \( g \) שמופעל על התוצאה של הפעלת \( h \) על \( x \); באגף ימין יש לנו הפעלה של האיבר \( g\cdot h \) על \( x \)). כמו כן דורשים שאיבר היחידה בחבורה יהיה ההעתקה שמעבירה כל איבר לעצמו - \( e\left(x\right)=x \). למי שכל זה אבסטרקטי מדי בשבילו, תחשבו על \( X \) כעל נקודות במרחב, ועל \( G \) בתור חבורת האיזומטריות של המרחב.

\( G \) פרדוקסלית, כלומר אפשר לפרק אותה לקבוצות הזרות \( A_{1},\dots,A_{n} \) ו-\( B_{1},\dots,B_{m} \) ויש איברים \( g_{1},\dots,g_{n} \) ו-\( h_{1}.\dots,h_{m} \) כך ש-\( G=\bigcup g_{i}\left(A_{i}\right)=\bigcup h_{i}\left(B_{i}\right) \). אנחנו רוצים לקבל מהפירוק הזה פירוק של \( X \) - לכל קבוצה \( A_{i} \) להתאים קבוצה \( A_{i}^{*}\subseteq X \) וכנ”ל עבור ה-\( B_{i} \) כך ש-\( X=\bigcup g_{i}\left(A_{i}^{*}\right)=\bigcup h_{i}\left(B_{i}^{*}\right) \). בפוסט הקודם ראינו את זה נעשה בפרדוקס סרפינקי-מזורקביץ’; שם התעלול היה לקחת איבר ספציפי \( x\in X \) (אצלם זה היה \( 0 \)), ולהגדיר \( A_{i}^{*}=A_{i}\left(x\right) \), כאשר \( A_{i}\left(x\right) \) זה סימון מקוצר עבור \( \left\{ g\left(x\right)|g\in A_{i}\right\} \), כלומר ההפעלה של כל האיברים ב-\( A_{i} \) על \( x \). זה גם הרעיון הכללי של האוסדורף (אם כי הוא המציא אותו באופן בלתי תלוי בסרפינקי-מזורקביץ’). עם זאת, יש שתי בעיות לא פשוטות עם הרעיון הזה: ראשית, אנחנו לא בהכרח תופסים ככה את כל \( X \); ושנית, אף אחד לא מבטיח לנו שה-\( A_{i}^{*} \) וה-\( B_{i}^{*} \) שנקבל יהיו קבוצות זרות. שתי אלו הן בעיות כבדות משקל למדי. נראה עכשיו איך מתמודדים עם הבעיה הראשונה בעזרת אקסיומת הבחירה; ההתמודדות עם הבעיה השניה אצל האוסדורף היא מעין רמאות (בערך כמו שסרפינקי-מזורקביץ’ “מרמים” בהתמודדות עם הבעיה הראשונה), והיא תיפתר רק על ידי בנך-טרסקי עצמו.

כדי להבין את הבעיה בואו נחשוב על המקרה שבו \( G \) היא חבורה חופשית עם שני יוצרים, ו-\( X \) הוא, נאמר, כדור היחידה ב-\( \mathbb{R}^{3} \). ב-\( G \) יש רק מספר בן מניה של איברים (כי כל איבר הוא סדרה סופית של אותיות מתוך קבוצה סופית). בשיטה שלנו, לכל איבר ב-\( G \) מותאם בדיוק איבר אחד ב-\( X \) - מה שקורה כשמפעילים את האיבר ב-\( G \) על איבר נתון מראש אחד ב-\( X \) (למשל, 0). מכאן שאוסף כל הקבוצות שנקבל יכיל רק מספר בן מניה של נקודות, ואין שום סיכוי שדבר כזה ירכיב את כל הכדור, שיש בו מספר לא בן מניה של נקודות. לא רק שאנחנו לא תופסים את כל הכדור, אנחנו אפילו ממש ממש לא קרובים.

באופן כללי בתורת החבורות, אם \( G \) פועלת על \( X \) ויש לנו איבר \( x\in X \), אז לאוסף כל האיברים שאפשר להגיע אליהם מ-\( x \) על ידי הפעולה של \( G \) קוראים המסלול (Orbit) של \( x \) ביחס לפעולה של \( G \). פורמלית זו פשוט הקבוצה \( \left\{ g\left(x\right)|g\in G\right\} \). הבעיה שלנו היא שלא בהכרח קיים \( x \) שהמסלול שלו הוא כל \( X \). למעשה, לא קשה לראות שאם קיים \( x \) שהמסלול שלו הוא כל \( X \), אז המסלול של כל איבר ב-\( X \) הוא \( X \); הסיבה לכך היא שהיחס “\( x \) ו-\( y \) נמצאים באותו מסלול” הוא יחס שקילות . זו נקודה חשובה אז בואו נקדיש לה כמה דקות.

נסמן \( x\sim y \) אם קיים \( g\in G \) כך ש-\( g\left(x\right)=y \). מייד רואים ש-\( e\left(x\right)=x \) ולכן \( x\sim x \); ושאם \( x\sim y \), כלומר \( g\left(x\right)=y \), אז \( g^{-1}\left(y\right)=g^{-1}\left(g\left(x\right)\right)=\left(g^{-1}g\right)x=e\left(x\right)=x \) ולכן \( y\sim x \). אם \( x\sim y \) ו-\( y\sim z \) אז \( g\left(x\right)=y \) ו-\( h\left(y\right)=z \) עבור \( g,h\in G \) מסויימים, ולכן \( hg\left(x\right)=h\left(g\left(x\right)\right)=h\left(y\right)=z \), כלומר \( x\sim z \). שלוש התכונות הללו, שבעברית נקראות רפלקסיביות, סימטריות וטרנזיטיביות, הופכות את \( \sim \) ליחס שקילות. המסלולים של פעולת \( G \) על \( X \) הן בדיוק מחלקות השקילות של היחס הזה.

המשמעות של זה עבורנו היא פשוטה: אם נפעיל את \( G \) על \( x \), האיברים שנקבל יהיו בדיוק האיברים ששקולים ל-\( x \), ואם נפעיל את \( G \) על אחד מאותם איברים נקבל שוב את האיברים ששקולים ל-\( x \) ולא שום דבר אחר. לכן ברור שאם אנחנו רוצים לתפוס את כל \( X \) על ידי הפעלה של אברי \( G \), נצטרך להפעיל את \( G \) לא על איבר בודד מתוך \( X \), אלא על איבר אחד מכל מסלול של \( G \). לכן בואו נגדיר קבוצה \( M \), שהאיברים שלה הם נציגים של המסלולים; יש בה בדיוק איבר אחד מכל מסלול. אפשר לראות בקלות ש-\( G\cdot M=X \) (\( G\cdot M \) היא ההפעלה של כל איבר ב-\( G \) על כל איבר ב-\( M \)). אם זה לא ברור לכם מייד, נסו להוכיח זאת.

כמה מסלולים יש ל-\( G \)? יכולים להיות המון, זו הנקודה. אם \( G \) בת מניה ו-\( X \) לא בת מניה (כמו שקורה במקרה של בנך-טרסקי), אז יש מספר לא בן מניה של מסלולים. זה אומר ש-\( M \) עשויה להיות ענקית למדי. כך אנחנו מצליחים להתגבר על הבעייתיות בכך ש-\( G \) הייתה קטנה מדי מכדי שתוכל לתפוס את כל \( X \) על ידי פעולה על איבר אחד בלבד. מכאן המשך ההוכחה טריוויאלי: \( A_{i}^{*}=A_{i}\cdot M \), \( B_{i}^{*}=B_{i}\cdot M \), וקל לבדוק ש-\( \bigcup g_{i}\left(A_{i}^{*}\right)=\bigcup h_{i}\left(B_{i}^{*}\right)=X \). כמקודם, אם זה לא ברור לכם מייד, לנסות לכתוב את ההוכחה בעצמכם יעזור להבין מה הולך כאן הרבה יותר מכל מה שאני יכול לכתוב פה.

נותרה רק בעיה אחת לטפל בה - אולי ה-\( A_{i}^{*},B_{i}^{*} \) הללו לא זרות - יש שתי קבוצות שיש להן איבר משותף. בפועל זה אומר שיש \( g,h\in G \) כלשהן ו-\( x,y\in M \) כלשהם כך ש-\( g\left(x\right)=h\left(y\right) \). אבל רגע אחד - \( M \) נבנתה כך שיש בה נציג אחד בדיוק מכל מסלול, ואם \( g\left(x\right)=h\left(y\right) \) אז \( x=\left(g^{-1}h\right)\left(y\right) \), כלומר הם באותו מסלול, ולכן בהכרח \( x=y \). כלומר, \( g\left(x\right)=h\left(x\right) \), כלומר \( x=g^{-1}h\left(x\right) \). במילים אחרות, יש ב-\( G \) איבר שונה מ-\( e \) שבפעולה שלו על \( X \) יש נקודות שבת. אז בואו ננקוט עכשיו בגישה הבוגרת והאחראית להתמודדות עם הסכנה בכך שהקבוצות שנבנה לא יהיו זרות - נניח מראש שהפעולה של \( G \) על \( X \) היא כזו שאין לאף איבר שאינו הזהות נקודות שבת, והבעיה נפתרה!

לסיכום, הוכחנו את המשפט הבא: אם \( G \) פרדוקסלית ופועלת על \( X \) ללא נקודות שבת לא טריוויאלית, אז \( X \) פרדוקסלית ביחס לפעולה של \( G \). רק מה? אולי לא שמתם לב, אבל השתמשנו כאן באקסיומת הבחירה.

אקסיומת הבחירה אומרת (בניסוח שלה שהכי מתאים לנו כאן) את הדבר הבא: בהינתן אוסף של קבוצות זרות ולא ריקות, קיימת קבוצה שמכילה בדיוק איבר אחד מכל אחת מהקבוצות. נשמע מוכר? זו בדיוק \( M \) שלנו, והקבוצות הזרות-אך-לא-ריקות הן המסלולים של פעולת \( G \) על \( X \). בהוכחה שלי הנחתי במובלע ש-\( M \)קיימת; לרוע המזל, זה פשוט לא מובן מאליו, אם מנסים להיות פורמליים. אם הולכים לפי אקסיומות תורת הקבוצות, אין לנו דרך להבטיח שקבוצה כמו \( M \) אכן תתקיים; הסיבה לכך היא שבתורת הקבוצות האקסיומטית ממש לא כל דבר שניתן לתאר במילים הוא אכן קבוצה; זה מונע בעיות דוגמת הפרדוקס של ראסל, אבל גם מכריח אותנו להיות הרבה יותר זהירים בהנחות שאנחנו מניחים כלאחר יד.

האם יכלתי להסתדר כאן בלי אקסיומת הבחירה? זו שאלה מצויינת, והתשובה הקצרה היא שאני לא יודע, ושתשובה מדויקת לשאלה תיקח אותי רחוק מדי גם מתוכן הפוסט הזה וגם מתחום הדברים שאני עוד קצת בקיא בהם. לכן נצטרך לדחות את השאלה הזו לפעם אחרת.

בואו נעבור עכשיו להחלת המשפט הכללי שלנו על המקרה של איזומטריות בתלת מימד. האבחנה הראשונה היא שחבורת האיזומטריות של \( \mathbb{R}^{3} \) מכילה תת חבורה חופשית עם שני יוצרים; ליתר דיוק, שיש שתי איזומטריות סיבוב שהן בלתי תלויות זו בזו (אף מילה בתת החבורה שנוצרת על ידי שתיהן אינה שווה ל-\( e \) מלבד המילה הריקה). יש כמה וכמה דוגמאות שאפשר לתת; הדוגמה שלי היא של סיבוב בזווית \( \arccos\frac{1}{3} \) סביב ציר ה-\( z \), וסיבוב באותה זווית סביב ציר ה-\( x \). ההוכחה ששתי האיזומטריות הללו בלתי תלויות היא… ובכן, טכנית ולא כל כך מעניינת. נעזוב אותה לעתה ואם יהיה ביקוש אדיר מהקהל אולי אציג אותה.

אם כן, יש לנו חבורה חופשית על שני יוצרים \( G \) של איזומטריות. מה מונע מאיתנו להפעיל אותה על כדור היחידה ולקבל את בנך-טרסקי, אם אנחנו מוכנים להניח את אקסיומת הבחירה? בעיה אחת בלבד - יש בחבורה הזו איזומטריות עם נקודות שבת. חשבו למשל על סיבוב סביב ציר \( z \); סיבוב שכזה מקבע את כל ציר \( z \). אפשר עם קצת עבודה להראות שבאופן כללי, כל איבר ב-\( G \) מקבע בדיוק את כל הנקודות על ישר כלשהו שעובר דרך ראשית הצירים. בקיצור, בעיה.

מה האוסדורף עושה? ראשית, הוא לא מדבר על כדור היחידה אלא על ספירת (Sphere) היחידה \( S^{2} \) - ה”מעטפת” של כדור היחידה, אוסף כל הנקודות שמרחקן מהראשית הוא 1 בדיוק. זה אותו הבדל כמו ההבדל שבין מעגל לעיגול. כל איבר של \( G \) מקבע רק שתי נקודות על הספירה, כי כל ישר העובר דרך הראשית חותך את הספירה בשתי נקודות בדיוק. יש רק מספר בן מניה של איברים ב-\( G \), ולכן קבוצת כל הנקודות שאברי \( G \) מקבעות, \( D \), היא בת מניה, ולכן קטנה וחסרת חשיבות בהשוואה ל-\( S^{2} \). אם נזרוק את הנקודות הללו לפח ונביט בקבוצה \( X=S^{2}\backslash D \) (\( X \) היא כל הנקודות ב-\( S^{2} \) שאינן ב-\( D \)) נוכל להפעיל את המשפט מקודם באופן חלק, ולקבל ש-\( S^{2}\backslash D \) פרדוקסלית. זהו פרדוקס האוסדורף. בפוסט הבא (והאחרון!) נעבור ממנו לבנך-טרסקי המלא, אבל כפי שכבר אמרתי - מה שראיתם עכשיו זה לב ההוכחה של בנך-טרסקי.

לסיום, בואו נפעיל את כל עניין הפרדוקסליות הזה על מקרה קצת שונה ממה שראינו עד כה. \( X \) יהיה מעגל היחידה, \( S^{1} \), ואילו \( G \) תהיה \( \left(\mathbb{Q},+\right) \) - החבורה החיבורית של הרציונליים. הפעלה של \( q\in\mathbb{Q} \) על אברי \( X \) תהיה סיבוב בזווית \( 2\pi\cdot q \) (\( 2\pi \) כי זה מעגל שלם). \( G \) איננה פרדוקסלית במובן הרגיל שלנו אבל במובן מאוד קרוב היא כן - אפשר לפרק אותה לשתי סדרות אינסופיות של קבוצות זרות, \( A_{1},A_{2},\dots \) ו-\( B_{1},B_{2},\dots \), כך שכל אחת מהסדרות נותנת את כל \( G \) אחרי פעולות מתאימות עליה. את החלוקה אפשר לבצע באופן שרירותי לגמרי - מתבקש לבנות כל קבוצה כך שתכיל בדיוק רציונלי אחד (יש מספר בן מניה של רציונליים ולכן זה אפשרי). ההוכחה שאפשר לקבל מהסדרה \( A_{1},A_{2},\dots \) את כל \( G \) נובעת מכך שאפשר לקבל כל רציונלי על ידי חיבור של מספר רציונלי אחר (אתם ב-\( q \) ורוצים להגיע ל-\( p \)? חברו לו את המספר הרציונלי \( \left(p-q\right) \)!) ולכן אפשר להעביר את האיבר של \( A_{1} \) אל הרציונלי הראשון במספור כלשהו שלנו, את \( A_{2} \) אל הרציונלי השני וכן הלאה.

כעת בואו נמשיך כמו קודם - \( M \) תהיה אוסף כל הנציגים של המסלולים של פעולת \( G \) על \( X \) (כלומר, אוסף הנציגים של כל מחלקות השקילות של היחס “אפשר לסובב את \( x \) בזווית שהיא כפולה רציונלית של \( 2\pi \) ולקבל את \( y \)”), נגדיר \( A_{i}^{*} \) ו-\( B_{i}^{*} \) כמו קודם, וקיבלנו שמעגל היחידה הוא פרדוקסלי אם מרשים פירוק אינסופי בן-מניה. על פניו זו סתם עוד דוגמה נחמדה, אבל אני מביא אותה כי הרעיון כאן הוא אותו רעיון כמו בהוכחה שאין מידה אינוריאנטית להזזות על הישר הממשי, שכבר הראיתי כאן פעם: גם שם בנינו את אותה \( M \) בדיוק (שם דיברנו על הקטע \( \left[0,1\right] \) עם הזזה מודולו 1, אבל זה אותו הדבר כמעט כמו מעגל היחידה עם סיבובים), ובנינו את הקבוצות \( A_{i}^{*} \) ו-\( B_{i}^{*} \) (שם קראתי להן פשוט \( A_{i} \) כי לא ניסינו לבנות שום דבר פרדוקסלי בסגנון בנך-טרסקי) והבעיה נבעה מכך שהמידה של כל ה-\( A_{i}^{*},B_{i}^{*} \) הללו הייתה צריכה להיות שווה לזו של \( M \) המקורי, והאיחוד של כולן (מבלי שנעשה עליהן מניפולציות נוספות) היה צריך להיות מצד אחד \( \left[0,1\right] \) ולכן בעל מידה 1, ומצד שני היו אינסוף קבוצות ולכן אם המידה שלהן (של כל אחת בנפרד) הייתה גדולה מאפס, המידה של האיחוד שלהן הייתה חייבת להיות אינסופית. הפרדוקסליות מאפשרת לנו לראות זאת בדרך טיפה שונה שלא מערבת מידה אינסופית - ראינו שבאמצעות הזזות, שהמידה לכאורה אינוריאנטית להן, הצלחנו “להכפיל” את \( \left[0,1\right] \) ולכן גם את המידה שלו. זה גם הדבר המוזר שקורה בבנך-טרסקי - באמצעות פעולות שהן לכאורה משמרות מידה אנחנו מצליחים להכפיל את הנפח של כדור.

מה המסקנה? פשוט מאוד - שלקבוצה \( M \) שלנו אין מידה. גם בבנך-טרסקי (וגם בהאוסדורף), הסוד הגדול הוא שהפלחים שנבנים הם פשוט לא מדידים (להבדיל מסרפינקי-מזורקביץ’ שבו הם היו מדידים, אבל פשוט ממידה אפס). זה אולי שופך קצת אור על המוזרות של בנך-טרסקי - אם הצלנו לפצל את הכדור לכמה חלקים שכל אחד בפני עצמו הוא בכלל חסר מידה מוגדרת, פלא שכשמחברים את הכל מחדש מקבלים דברים מוזרים?

בפוסט הבא אני מקווה להציג את המעבר הסופי מפרדוקס האוסדורף אל בנך-טרסקי ובכך לסיים את התופעה המוזרה הזו, שפוסט בודד על פרדוקס בודד הצליח להכפיל את עצמו לשלושה פוסטים על אותו נושא.

נהניתם? התעניינתם? אם תרצו, אתם מוזמנים לתת טיפ: