בעקבות השערת הרצף, חלק ד': התמונה הגדולה של ההוכחה

תזכורת מהפוסט הקודם ופרדוקס סקולם

הפוסט הקודם כלל סדרה של טענות טכניות לא מסובכות במיוחד בפני עצמן, אבל שהיה קל ללכת לאיבוד בסך הפרטים שלהן, וכדי להבין מה הולך לקרות מכאן והלאה קריטי להבין את התמונה הגדולה. אז הפוסט הזה יוקדש להסבר לא טכני (יותר מדי) על מה השגנו עד כה (די הרבה, למען האמת) ולאן אנחנו הולכים מכאן (אל החלק הממש מגניב).

נתחיל מהשורה התחתונה של הפוסט הקודם. הוכחנו שם את מה שמכונה “עקרון הרפלקציה”, שאומר את הדבר הבא: אם \( \phi \) הוא פסוק בשפה של תורת הקבוצות, אז קיימת קבוצה טרנזיטיבית ובת מניה \( M \) כך ש-\( \phi \) הוא תקף (מקבל את הערך T) אם ורק אם \( \phi|_{M} \) תקף, כאשר \( \phi|_{M} \) הוא מה שנקרא הרלטיביזציה של \( \phi \) אל \( M \): ההגבלה של הכמתים ב-\( \phi \) כך שיסתכלו רק על איברים ששייכים אל \( M \).

למה זה מעניין? כי קבוצה שהיא גם טרנזיטיבית וגם בת מניה היא קבוצה פשוטה למדי. יהיה לנו קל לעבוד עם קבוצה כזו בהמשך. למעשה, במבט ראשון היא נראית פשוטה מדי וכל העסק נראה די חשוד. אז נתחיל מלדבר על זה.

קודם כל, אמנם עקרון הרפלקציה דיבר על פסוק בודד \( \phi \), אבל בעצם הוא תקף לכל קבוצה סופית של פסוקים, \( \phi_{1},\ldots,\phi_{n} \), מסיבה פשוטה מאוד: נסתכל על הפסוק \( \phi=\phi_{1}\wedge\ldots\wedge\phi_{n} \) ונפעיל את עקרון הרפלקציה עליו: אז כל ה-\( \phi_{i} \)-ים תקפים אם ורק אם \( \phi \) תקף רק אם קיימת \( M \) עבורה \( \phi|_{M} \) תקף, אם ורק אם \( \phi_{i}|_{M} \) תקף לכל \( 1\le i\le n \).

עכשיו בואו תראו תעלול! ניקח פסוק \( \psi \) שאומר “קיימת קבוצה לא בת מניה”. זו טענה שאפשר להוכיח במסגרת ZFC. נסתכל על ההוכחה הזו. הוכחה היא אובייקט סופי, ולכן היא כוללת רק מספר סופי של אקסיומות מתוך ZFC (כזכור, יש ב-ZFC מספר אינסופי של אקסיומות כי אקסיומות ההחלפה וההפרדה הן סכמות - הן בעצם תיאור כללי של אינסוף אקסיומות). ניקח את האקסיומות הללו ונשתמש בעקרון הרפלקציה כדי לקבל קבוצה טרנזיטיבית ובת מניה \( M \) שהאקסיומות תקפות בה. אם האקסיומות תקפות בה, כך גם כל דבר שנובע מהן לוגית, ובפרט הפסוק \( \psi \) שאומר “קיימת קבוצה לא בת מניה”.

קיבלנו שיש ב-\( M \) קבוצה לא בת מניה, \( A\in M \). בגלל ש-\( M \) טרנזיטיבית אז \( A\subseteq M \); כל אברי \( A \) הם איברים של \( M \). בגלל ש-\( M \) היא בת מניה, המסקנה היא ש-\( A \) היא בת מניה… רגע רגע רגע, מה הולך פה?!

מה שקרה לנו כרגע נקרא פרדוקס סקולם והוא כנראה הדרך הטובה ביותר להמחיש את עולם הדקויות המתמטיות שנקלענו אליו. נתחיל מזה שאין פה סתירה במתמטיקה והכל טוב. הקבוצה \( A \) המדוברת היא באמת בת מניה, והיא באמת הקבוצה שהפסוק \( \psi \) מבטיח את קיומה. אבל מה ש-\( \psi \) אומר הוא לא בהכרח מה שאנחנו חושבים עליו כשאומרים שקבוצה היא לא בת מניה.

כשאומרים לי “קבוצה לא בת מניה” אני חושב על קבוצה ענקית, כזו שיש בה המון איברים. כל כך הרבה איברים, שאין דרך למספר אותם. כך גם הולכת ההגדרה ה”פורמלית”: קבוצה \( A \) היא לא בת מניה אם לא קיימת פונקציה \( f:\mathbb{N}\to A \) שהיא חח”ע ועל. מה שקורה בפרדוקס סקולם הוא שאנחנו מדברים על מה שקורה בתוך קבוצה \( M \), שהיא “יקום מתמטי זעיר שבו חלק מהאקסיומות של ZFC מתקיימות”. כמה היקום זעיר? הקבוצה \( A \) שייכת אליו והיא אמנם קטנה יחסית כך שביקום הגדול והרחב של תורת הקבוצות קיימת פונקציה \( f:\mathbb{N}\to A \), אבל אותה \( f \) לא שייכת ל-\( M \). מנקודת המבט של \( M \), הקבוצה \( A \) היא לא בת מניה כי אין בתוך \( M \) שום פונקציה שמראה שהיא בת מניה.

אמרתי שהשם “עקרון הרפלקציה” מגיע מכך שהתכונות של ZFC “משתקפות” ב-\( M \). אבל כפי שאנו רואים, הן משתקפות בו מוזר. ב”מבעד למראה ומה שאליס מצאה שם” של לואיס קארול, אליס עוברת דרך מראה ומגיעה ליקום מוזר מעברה השני. ביקום הזה כלי השחמט קמים לחיים, ופרש השחמט הוא אביר אמיתי על סוס, שכל הזמן נופל ממנו הצידה. פרש שחמט “רגיל” נע שני צעדים בכיוון אחד ואז זז עוד צעד אחד לכיוון ימין או שמאל. הפרש הנופל של אליס הוא השתקפות מוזרה שכזו של פרש השחמט האמיתי - הוא מקיים את אותה תכונה בסיסית, אבל בוודאי שהוא לא מקיים אותה באופן שבו אנחנו רגילים לחשוב שהיא מתקיימת.

עוברים מ-ZFC אל ZFC+

בואו נעבור לפסים טכניים יותר. עד עכשיו עבדנו במסגרת ZFC. מהי ZFC? זו תורה מסדר ראשון עם סימן יחס אחד \( \in \) (בנוסף לסימן השוויון, שהוא לרוב חלק מההגדרה של שפות מסדר ראשון), בלי סימני קבועים ובלי סימני פונקציות, ועם קבוצה גדולה של אקסיומות שכבר דיברנו עליה. מהמערכת הזו אני הולך לבנות מערכת חדשה, \( \text{ZFC}^{+} \), שאפשר לתאר לא פורמלית בתור “ZFC עם ההנחה הנוספת שקיים יקום זעיר \( M \) עבור ZFC”.

כן פורמלית, \( \text{ZFC}^{+} \) כוללת את סימן היחס \( \in \) ואין בה סימני פונקציה, אבל יש בה סימן קבוע חדש, שאסמן \( \mathcal{M} \). האקסיומות של \( \text{ZFC}^{+} \) הן האקסיומות של ZFC וגם הרלטיביזציה של כל אקסיומה של ZFC אל \( \mathcal{M} \), וגם אקסיומה בודדת אחת שאומר ש-\( \mathcal{M} \) הוא קבוצה בת מניה וטרנזיטיבית (אפשר לנסח את התכונות הללו במסגרת ZFC).

עכשיו אפשר לעבור לדבר על הפיל בחדר: למה, בעצם, קיימת \( M \) כזו, שאם נציב במקום \( \mathcal{M} \) תספק את כל האקסיומות של \( \text{ZFC}^{+} \)? הרי עקרון הרפלקציה דיבר רק על קבוצה סופית של אקסיומות, לא על הכל בבת אחת.

או, טוב ששאלתם. אני לא יודע אם קיימת כזו. גרוע מזה, אני לא יכול לדעת אם קיימת כזו, והבעיה הרבה יותר רצינית מאשר הטריקים שלי עם עקרון הרפלקציה. הבעיה היא שאני לא יודע אם ZFC עצמה מתארת יקום שבאמת קיים או לא.

למה ש-ZFC לא תתאר יקום כזה? על פניו היא מתארת יפה את העולם של תורת הקבוצות שאנחנו רוצים לתפוס. אבל כזכור, ZFC נולדה אחרי שהגישה הנאיבית שבה עשינו דברים ב”עולם של תורת הקבוצות שאנחנו רוצים לתפוס” הובילה לפרדוקס של ראסל ולהבנה ששיחקנו בנדמה-לי מופרך כל הזמן הזה. מה ש-ZFC באה לעשות הוא להגביל את הכללים, כדי להגדיל את הסיכוי שהיא מתארת משהו אמיתי. אבל האם היא מתארת משהו אמיתי? בשביל זה צריך לכל הפחות להשתכנע ש-ZFC עקבית, כלומר לא מאפשרת להוכיח סתירה, כמו הסתירה שצצה בפרדוקס של ראסל. וכאן אנחנו בבעיה: על פי משפט השלמות השני של גדל, פשוט לא ניתן להוכיח ש-ZFC לא מאפשרת להוכיח סתירה מבלי שנזדקק לצורך כך למערכת אקסיומות נוספת, חיצונית, שונה מ-ZFC שגם האמיתות שלה תוטל בספק.

לכן כל מה שאנחנו עושים פה הוא הוכחה של תוצאה יחסית. אנחנו אומרים, “אם ZFC עקבית, אז גם \( \text{ZFC}^{+} \) עקבית”. זו לא באמת בעיה כי אם ZFC לא עקבית, אז היא מוכיחה גם את השערת הרצף וגם את שלילת השערת הרצף (כי בלוגיקה מסדר ראשון, מערכת ההוכחה היא כזו שמסתירה אפשר להוכיח כל דבר) ולכן מלכתחילה כל הדיון על להוכיח את אי-התלות של השערת הרצף הוא חסר משמעות. הדיון מעניין מלכתחילה רק אם ZFC עקבית - וזו הנחת העבודה שלנו בכל מה שאנחנו עושים במתמטיקה.

אז בואו ניגש לעבודה: למה אם ZFC עקבית גם \( \text{ZFC}^{+} \) עקבית? נניח ש-\( \text{ZFC}^{+} \) אינה עקבית, אז קיימת במסגרת \( \text{ZFC}^{+} \) הוכחה של סתירה כלשהי, \( \phi\wedge\neg\phi \). אלא שהוכחה היא אובייקט סופי (צריך שוב ושוב ושוב להדגיש את הנקודה הקריטית הזו - הפשטות הזו של הוכחות היא הבסיס שעליו הכל נבנה), ולכן במהלך ההוכחה אנחנו משתמשים רק במספר סופי של אקסיומות; בפרט אנחנו משתמשים רק במספר סופי של אקסיומות של \( \text{ZFC}^{+} \) שהן מהצורה “אקסיומה של ZFC שעברה רלטיביזציה ל-\( \mathcal{M} \)”. נסמן אותן \( \phi_{1}|_{\mathcal{M}},\ldots,\phi_{n}|_{\mathcal{M}} \).

עכשיו ננקוט בטריק שדיברתי עליו קודם: נסתכל על \( \phi_{1}\wedge\ldots\wedge\phi_{n} \). זה פסוק בודד ששייך למסגרת שלZFC . מכיוון שהוא נבנה מאקסיומות של ZFC, הוא בוודאי בעל ערך האמת T, ולכן עקרון הרפלקציה מאפשר לנו ליצור הוכחה ב-ZFC לקיום של קבוצה טרנזיטיבית ובת מניה \( M \) כך שהפסוק \( \phi_{1}|_{M}\wedge\ldots\wedge\phi_{n}|_{M} \) תקף. שימו לב לנקודה המאוד עדינה הזו: \( \phi|_{M} \) ו-\( \phi|_{\mathcal{M}} \) זה לא אותו דבר! \( \phi|_{M} \) זו רלטיביזציה עם סימן של משתנה \( M \), ואילו \( \phi|_{\mathcal{M}} \) זו רלטיביזציה עם סימן של קבוע \( \mathcal{M} \). זה לא אותו דבר אבל זה כמעט אותו דבר וזה מן הסתם מה שאנחנו מכוונים אליו כאן.

עכשיו נחזור אל ההוכחה של הסתירה ב-\( \text{ZFC}^{+} \) שממנה התחלנו. הוכחה כזו היא סדרה של טענות. חלקן אולי הן טענות מתוך ZFC, אבל יש גם טענות שלא ניתן לנסח במסגרת ZFC; אלו בדיוק הטענות שמשתמשות בסימן הקבוע החדש \( \mathcal{M} \). ניקח את הטענות הללו ונשנה אותן, מבחינה תחבירית; נחליף את סימן הקבוע \( \mathcal{M} \) בסימן המשתנה \( M \).

עכשיו יש לנו שתי הוכחות: הראשונה, הוכחה ב-ZFC לקיום של קבוצה טרנזיטיבית ובת מניה \( M \) כך שהפסוק \( \phi_{1}|_{M}\wedge\ldots\wedge\phi_{n}|_{M} \) תקף. השניה: הוכחה ב-ZFC לכך ש-\( \phi\wedge\neg\phi \) שמסתמכת על ההנחה שהערך שהושם במשתנה \( M \) הוא קבוצה טרנזיטיבית ובת מניה (כי כך אומרת אקסיומה אפשרית אחת של \( \text{ZFC}^{+} \)) כך שהפסוק \( \phi_{1}|_{M}\wedge\ldots\wedge\phi_{n}|_{M} \) תקף (כי אלו האקסיומות האחרות של \( \text{ZFC}^{+} \) שבהן השתמשנו ואינן גם ככה ב-ZFC). זה אומר שקיבלנו הוכחה ל-\( \phi\wedge\neg\phi \) במסגרת ZFC: ביצענו המרה של הוכחת חוסר עקביות של \( \text{ZFC}^{+} \) להוכחת חוסר עקביות של ZFC.

אולי הנקודה העדינה ביותר שיש לשים אליה לב היא שבשום שלב לא באמת בניתי “יקום זעיר” עבור כל ZFC. בפוסט הקודם, כשהצגתי את הרעיון של “יקום זעיר”, התנסחתי במעורפל בכוונה ואמרתי ש”ביקומים הזעירים הללו ZFC מתקיימת במובן מסוים”. עכשיו גם יותר ברור איזה מובן - אנחנו לא יודעים לבנות יקום זעיר עבור כל ZFC בבת אחת אבל אנחנו גם לא צריכים לעשות את זה; מספיק לנו לבנות יקום זעיר עבור חלק סופי של ZFC. למרבה המזל השיטה שלנו מאפשרת לבנות יקום זעיר לכל חלק סופי של ZFC, כך שכל מה שנעשה בהמשך יוכל להניח במובלע שיש לנו יקום זעיר לכל חלק מ-ZFC שנזדקק לו (כי תמיד נזדקק רק לחלק סופי) ולפעול בחופשיות על בסיס ההנחה הזו.

ולאן הולכים עכשיו?

בואו נחזור אל מטרת העל שלנו: אנחנו רוצים להוכיח שהשערת הרצף, מה שמסומן בתור \( \text{ZFC} \), היא בלתי תלויה באקסיומות \( \text{ZFC} \). מה המשמעות של “בלתי תלויה”? זה אומר שאי אפשר להוכיח או להפריך את \( \text{CH} \) מתוך \( \text{ZFC} \). ומה זה אומר “אי אפשר להפריך את \( \text{CH} \) מתוך \( \text{ZFC} \)”? זה אומר ש-\( \text{ZFC+CH} \), מערכת האקסיומות שמתקבלת מ-\( \text{ZFC} \) על ידי הוספת \( \text{CH} \), היא עקבית. למה זה מה שזה אומר? כי אם היה אפשר להפריך את \( \text{CH} \) מתוך \( \text{ZFC} \) זה אומר שהיה אפשר להוכיח את \( \neg\text{CH} \) מתוך \( \text{ZFC} \) - זו המשמעות של “הפרכה”, ולכן \( \text{ZFC+CH} \) הייתה מערכת אקסיומות שמוכיחה גם את \( \text{CH} \) (כי זו אקסיומה) וגם את \( \neg\text{CH} \) - מערכת שמוכיחה דבר ושלילתו, ולכן איננה עקבית.

באותו אופן, כדי להראות שלא ניתן להוכיח את \( \text{CH} \) מתוך \( \text{ZFC} \) מספיק להראות ש-\( \text{ZFC+}\neg\text{CH} \) היא עקבית. עכשיו, הדיון שקיימנו קודם מראה לנו שכדי להוכיח את שני אלו, מספיק לנו להוכיח שהמערכות \( \text{ZFC}^{+}+\text{CH} \) ו-\( \text{ZFC}^{+}+\neg\text{CH} \) הן עקביות, תוך הסתמכות על ההנחה ש-\( \text{ZFC}^{+} \) עקבית. אני אסביר איך נראה ש-\( \text{ZFC}^{+}+\text{CH} \) עקבית; עבור \( \text{ZFC}^{+}+\neg\text{CH} \) זה אותו רעיון.

ובכן, יש כאן נקודה עדינה שצריך להתייחס אליה. כשאני כותב \( \text{ZFC}^{+}+\text{CH} \) אני אומר “מערכת האקסיומות שכוללת את ZFC, כוללת את קיום \( \mathcal{M} \) טרנזיטיבית ובת מניה שמקיימת את ZFC בעצמה, וכוללת את השערת הרצף”. כל הרעיון בקיום \( \mathcal{M} \) הזו הוא לחסוך לי את הצורך להתעסק ישירות עם השערת הרצף, אלא להסתכל על השערת הרצף כשהיא מצומצמת ל”יקום מתמטי זעיר”. עכשיו אנחנו כבר מכירים את המשמעות הפורמלית של צמצום שכזה - רלטיביזציה.

העניין הוא שאם אני אבצע רלטיביזציה של \( \text{CH} \) אל \( \mathcal{M} \) אני לא אקבל שום דבר מעניין כי לא ברור אם \( \mathcal{M} \) מקיימת את \( \text{CH} \) או לא. מה שנעשה בפוסטים הבאים יהיה להראות איך מתוך הקיום של \( \mathcal{M} \) אפשר להוכיח את הקיום של קבוצה אחרת, \( \mathcal{N} \), שבה השערת הרצף כן מתקיימת; דהיינו \( \text{CH}|_{\mathcal{N}} \) מתקיימת. עכשיו אפשר להשתמש בטריק שראינו קודם. שם הוכחנו שאם \( \text{ZFC}^{+} \) לא עקבית אז גם \( \text{ZFC} \) לא עקבית תוך הסתמכות על זה שהרלטיביזציה של כל אקסיומות \( \text{ZFC} \) אל \( \mathcal{M} \) מתקיימות. באותו האופן, אז הרלטיביזציה של כל אקסיומות \( \text{ZFC} \) וגם של \( \text{CH} \) אל \( \mathcal{N} \) מתקיימות, אז חוסר עקביות של \( \text{ZFC}^{+}+\text{CH} \) יתורגם לחוסר עקביות של \( \text{ZFC}+\text{CH} \).

זה מסיים את כל החלק של רלטיביזציה ורפלקציה בסיפור הזה. כל מה שנשאר לנו לעשות הוא את המשימה הבאה: להראות איך אפשר, במסגרת ZFC, לקחת “יקום מתמטי זעיר” \( \mathcal{M} \) שמקיים את אקסיומות ZFC ולבנות מתוכו “יקום מתמטי קצת פחות זעיר” \( \mathcal{N} \) שמקיים את אקסיומות ZFC וגם את \( \text{CH} \) (או את \( \neg\text{CH} \)).

את הבניה של יקום שבו \( \text{ZFC}+\text{CH} \) מתקיימות ביצע קורט גדל בשנות השלושים, בעזרת בניה של משהו שנקרא L ואני לא הולך לדבר עליו בכלל בסדרת הפוסטים הזו. למה לא? כי הסדרה עמוסה כבר ככה, ואת אותה תוצאה של גדל אפשר לקבל בצורה שונה למדי בעזרת מה שאני כן הולך להראות. זה לא אומר שהתוצאה של גדל והטכניקה שלו לא מעניינות בפני עצמן, כי הן בהחלט כן; פשוט הפעם אוותר עליהן.

את הבניה של יקום שבו \( \text{ZFC}+\neg\text{CH} \) מתקיימות ביצע פול כהן בשנות השישים, תוך שהוא מפתח לשם כך טכניקה שנקראת כפייה. כל יתר סדרת הפוסטים תעסוק בטכניקה הזו, שהיא יפהפיה (מרגע שנופל האסימון) ולא עד כדי כך קשה להבנה (מרגע שנופל האסימון) וחזקה וכללית עד להפתיע (CH הוא רק קצה הקרחון של מה שעושים איתה, אבל אני לא האיש שיציג שימושים מתקדמים יותר). בפוסט הבא אתחיל להציג את פרטיה, אבל אי אפשר לסיים את הפוסט הזה בלי לומר עליה משהו. אז הנה השיטה מאוד ממעוף הציפור:

  1. מתחילים עם היקום המתמטי הזעיר \( \mathcal{M} \) שלנו.
  2. בתוך \( \mathcal{M} \) מגדירים קבוצה \( P \) (שנקראת מושג כפייה) שאבריה, שנקראים תנאי כפייה הם מעין בניות חלקיות של אובייקט שאנחנו רוצים להוסיף ל-\( \mathcal{M} \) (למשל פונקציה חח"ע ועל בין הממשיים ו-\( \aleph_{1} \))
  3. מתוך \( P \) בוחרים תת-קבוצה \( G \) של תנאי כפייה שנקראת "אידאל גנרי" והרעיון בה הוא שתנאי הכפייה שלה שמסתדרים יפים זה עם זה והיא "מקיפה מספיק" במובן מסוים שמבטיח שתנאי הכפייה שנמצאים בה תופסים עד הסוף את הבניה החלקית.
  4. מבצעים הרחבה של \( \mathcal{M} \) ליקום גדול יותר \( \mathcal{M}\left[G\right] \) (זה יהיה ה-\( \mathcal{N} \) שלנו) בעזרת \( G \).
  5. מוכיחים ש-\( \mathcal{M}\left[G\right] \) מקיים בעצמו את כל אקסיומות ZFC (זה יהיה עיקר העבודה שלנו, אבל הקסם הוא שנוכל לעשות את ההוכחה הזו בצורה כללית, לכל \( P \) ולכל אידאל גנרי \( G \)).
  6. מוכיחים ש-\( \mathcal{M}\left[G\right] \) מכיל את האובייקט החדש שרצינו לבנות.
  7. (וזו נקודה עדינה) מוכיחים ש-\( \mathcal{M}\left[G\right] \) עדיין משתמש באותו עולם מושגים מ-\( \mathcal{M} \) שאנחנו זקוקים לו. למשל, שמה שאנחנו קוראים לו \( \aleph_{1} \) ב-\( \mathcal{M} \) הוא עדיין מה שאנחנו קוראים לו \( \aleph_{1} \) ב-\( \mathcal{M}\left[G\right] \) (זה חשוב, כי האובייקט שאנחנו בונים פועל על ה-\( \aleph_{1} \) של \( \mathcal{M} \), ולכן אם ה-\( \aleph_{1} \) הזה השתנה במעבר אל \( \mathcal{M}\left[G\right] \) בנינו אובייקט שכבר לא רלוונטי לנו).

יהיה שווה את זה? אני מקווה שכן. אני יודע שאני בהתחלה הייתי מבועת ממש מהשיטה ומההגדרה של \( \mathcal{M}\left[G\right] \), ועכשיו אני ממש מתלהב ממנה. שיהיה לנו בהצלחה.


נהניתם? התעניינתם? אם תרצו, אתם מוזמנים לתת טיפ:

Buy Me a Coffee at ko-fi.com