בעקבות השערת הרצף, חלק ו': הרחבות גנריות
מבוא
בפוסט הקודם תיארנו את הרעיון הכללי של שיטת הכפייה של כהן. כדאי להזכיר את המרכיבים העיקריים שבהם נשתמש: יש לנו קבוצה \( \mathcal{M} \) שהיא טרנזיטיבית ובת מניה ומהווה סוג של מודל עבור ZFC, ואנחנו רוצים להרחיב אותה כדי שהשערת הרצף תתקיים בה (וגם להרחיב בצורה אחרת שבה השערת הרצף לא מתקיימת). לצורך כך אנחנו לוקחים קבוצה \( P\in\mathcal{M} \) וקוראים לאיברים שלה תנאי כפייה, ומתוך קבוצת התנאים הזו אנחנו בוחרים תת-קבוצה \( G\subseteq P \) שמקיימת כמה תכונות מועילות לנו ונקראת אידאל גנרי. עכשיו אנחנו רוצים להרחיב את \( \mathcal{M} \) בעזרת האידאל הגנרי הזה ולקבל קבוצה חדשה \( \mathcal{M}\left[G\right] \) שמרחיבה את \( \mathcal{M} \) באופן המבוקש שלנו ועדיין מהווה סוג של מודל עבור \( \text{ZFC} \).
בפוסט הקודם נתתי דוגמא פשוטה מאוד שעוזרת לאינטואיציה: אפשר היה לחשוב על \( P \) בדוגמא הזו כעל בניות חלקיות של פונקציה מ-\( \mathbb{N} \) אל \( \left\{ 0,1\right\} \), כלומר כעל פונקציות מתת-קבוצות סופיות של \( \mathbb{N} \) אל \( \left\{ 0,1\right\} \). אידאל גנרי היה אוסף ספציפי של בניות חלקיות שלא סותרות זו את זו והוא גדול דיו כך שכאשר נסתכל על האיחוד \( \bigcup G \) נקבל פונקציה מהטבעיים אל \( \left\{ 0,1\right\} \), ולא סתם פונקציה אלא אחת שלא יכלה להיות ב-\( \mathcal{M} \) מראש (את הכל הוכחתי והסברתי בפירוט בפוסט הקודם). עכשיו, כזכור יש לנו ב-\( \text{ZFC} \) משהו שנקרא אקסיומת האיחוד שאומר שאם קבוצה כלשהי קיימת, גם האיחוד של כל אבריה קיים; כלומר, אותה \( G \) שהזכרתי לא יכלה להיות שייכת אל \( \mathcal{M} \) (שימו לב: כל האיברים של \( G \) שייכים ל-\( \mathcal{M} \) אבל זה ממש לא אומר שהיא עצמה שייכת ל-\( \mathcal{M} \), והמטרה בבניית \( \mathcal{M}\left[G\right] \) היא להוסיף את \( G \) אל \( \mathcal{M} \) כך ש-\( \text{ZFC} \) תמשיך להתקיים גם אחרי התוספת הזו.
את הבניה הזו אציג כאן, ואני מזהיר שלמרות שהיא מאוד פשוטה מבחינה פורמלית, היא לא קלה לעיכול. אבל מרגע שנשתלט עליה, החלק הקשה מאחורינו.
שתי אנלוגיות מועילות (או שלא מועילות)
כשיש הגדרה אבסטרקטית יחסית, לדעתי מועיל לראות אנלוגיות מתחומים אחרים, שבתקווה כבר התרגלנו אל הטירוף שמתחולל בהם. אני אנסה לתת שתי אנלוגיות כאלו כאן, ואני מזהיר מראש שהן לא זהות 1:1 למה שהולך לקרות עכשיו - אבל מן הסתם, זו הסיבה שבגללה מה שהולך לקרות עכשיו הוא מעניין!
הדוגמא הראשונה היא הרחבה אלגברית של הרציונליים. נאמר, למשל, שאני לוקח את המספר \( \sqrt[3]{7} \) ומוסיף אותו למספרים הרציונליים ו”סוגר” את התוצאה כדי לקבל שדה, \( \mathbb{Q}\left(\sqrt[3]{7}\right) \), איך השדה הזה ייראה? הוא יכיל את \( \sqrt[3]{7} \), ואת המכפלה שלו בעצמו, שהיא \( \sqrt[3]{49} \), וכשנכפול אותו שוב בעצמו נקבל פשוט 7 שכבר שייך לשדה. לאיברים הללו צריך גם להוסיף את כל מה שאפשר לקבל ממכפלה שלהם באיבר מהשדה, ואת הסכומים של האיברים שמתקבלים כך, ויוצא שהצורה הכללית של איבר בהרחבה האלגברית הזו הוא \( a\sqrt[3]{7}+b\sqrt[3]{49}+c \) כאשר \( a,b,c\in\mathbb{Q} \).
הכל טוב ויפה, אבל יש כאן בעיה אחת: הדרך הזו תקפה רק אם אנחנו כבר יודעים שהאיבר \( \sqrt[3]{7} \) קיים; אבל מה אם נקודת המבט שלנו היא שאנחנו לא מכירים אותו, ורוצים לבנות את האיבר הזה מתוך מה שיש לנו בידיים כרגע, כלומר \( \mathbb{Q} \)? מה שעושים הוא לעבור להתבונן על חוג הפולינומים מעל \( \mathbb{Q} \), החוג \( \mathbb{Q}\left[x\right] \) שכולל את כל האיברים מהצורה \( p_{n}x^{n}+p_{n-1}x^{n-1}+\ldots+p_{1}x+p_{0} \) כאשר ה-\( p \)-ים הם מספרים רציונליים. אפשר כמובן לשאול מה זה ה-\( x \) הזה בכלל, אבל זו סתם שיטת סימון; על כל פולינום כזה אפשר לחשוב פשוט בתור סדרה \( \left(p_{0},\ldots,p_{n}\right) \) ואין לנו ספק שהן קיימות. גם בבניה שתכף נציג, אנחנו בונים את אברי \( \mathcal{M}\left[G\right] \) מתוך אברי \( P \) שמסודרים במבנה מסוים (קצת יותר מורכב מאשר סדרה). לאיברים שנבנה באופן הזה נקרא שמות-\( P \).
עכשיו, אחרי שיש לנו את \( \mathbb{Q}\left[x\right] \), אנחנו מחלקים אותו באידאל שנוצר על ידי פולינום, במקרה שלנו \( x^{3}-7 \) שהוא הפולינום הקטן ביותר שמאפס את \( \sqrt[3]{7} \). החלוקה הזו היא תהליך שלוקח את האיברים הכלליים של \( \mathbb{Q}\left[x\right] \) ומפשט אותם (הם הופכים להיות פולינומים ממעלה 2 לכל היותר) תוך כדי זה שהוא מקנה להם מבנה מסוים (פעולת הכפל שלהם תשקף את האופי הספציפי של הפולינום \( x^{3}-7 \) שבו חילקנו). גם אצלנו, אנחנו הולכים לקחת את כל האיברים שבנינו באמצעות \( P \) ולבצע עליהם מין תהליך של פישוט שיתבסס על האופי הספציפי של \( G \) שבחרנו - תהליך שבו אנחנו נותנים ערך לכל שם-\( P \) שבנינו קודם.
הדוגמא האנלוגית השניה מגיעה מהוכחת משפט השלמות של גדל על לוגיקה מסדר ראשון (יש לי פוסט על זה). מאוד בגדול, מה שקורה שם הוא שיש לנו תורה - אוסף של נוסחאות - \( \Phi \) והאוסף הזה הוא עקבי, ואנחנו רוצים להראות שנובע מהעקביות הזו שקיים לתורה הזו מודל - כלומר אובייקט מתמטי שמספק את כל הנוסחאות של \( \Phi \). זו תעלומה גדולה מאיפה אפשר בכלל לבנות אובייקט כזה, והתשובה היא שעושים תעלול: מרחיבים איכשהו את השפה שלנו כך שיש בה המון סימני קבועים (אלו המקבילים של שמות-\( P \) אצלנו) ואז בונים את המודל כך שהעולם שלו מורכב מסימני הקבועים הללו (זה תעלול יפה - האובייקט הסינטקטי של הקבועים הופך להיות מה שמשתמשים בו בפרשנות הסמנטית של הפסוקים) והיחסים של המודל נבחרים בצורה שמתיישבת יפה עם \( \Phi \) - זה דומה לתהליך הפישוט באמצעות \( G \) שדיברתי עליו.
כאמור, שתי האנלוגיות הללו לא מושלמות, והן כמובן חסרות ערך אם לא מכירים את הבניות המתמטיות שתיארתי; אבל אלו האינטואיציות הכי טובות שאני יכול לגייס לפני שאנחנו לוקחים צעד קדימה, אל מה שהיה עבורי הדבר הקשה ביותר לעיכול בכל סדרת הפוסטים הזו.
שמות ופרשנותם
הבניה של \( \mathcal{M}\left[G\right] \) מורכבת משני שלבים:
- בניית אוסף אובייקטים שנקראים שמות-\( P \) שנוצרים במסגרת \( \mathcal{M} \) באמצעות \( P \).
- בניית \( \mathcal{M}\left[G\right] \) על ידי מתן ערך לכל שם-\( P \) באמצעות \( G \).
ההגדרה היא רקורסיבית: שם-\( P \) הולך להיות קבוצה של זוגות \( \left(\sigma,p\right) \) כך ש-\( \sigma \) הוא שם-\( P \) פשוט יותר ו-\( p\in P \) הוא “תגית” שמוצמדת אל \( \sigma \). כשנותנים לשם \( P \) ערך זה נעשה רקורסיבית, על ידי לקיחת קבוצת ה-\( \sigma \)-ות שבתוך השם שתויגו על ידי איברים מ-\( G \), והחלפה שלהן בערך ש-\( G \) נותן להן.
כרגיל בהגדרות רקורסיביות, כדי שזה יעבוד צריכה להיות מין היררכייה על האיברים שעובדים איתם: שם-\( P \) חייב להיבנות משמות פשוטים יותר. לכן ההגדרה שלנו תכלול בתוכה את יצירת ההיררכייה הזו.
עכשיו, בואו נראה פורמלית את שני השלבים הללו. זה די קצר:
אנחנו מגדירים סדרה טרנספיניטית של קבוצות \( N_{0},N_{1},\ldots,N_{\alpha},\ldots \) כך שיש לנו קבוצה \( N_{\alpha} \) לכל סודר \( \alpha\in\mathcal{M} \). אברי הקבוצות הללו נקראים כולם שמות-\( P \) (או בקיצור, שמות), ועבור שם \( \tau \) הדרגה שלו היא הסודר \( \alpha \) המינימלי כך ש-\( \tau\in N_{\alpha} \).
כל קבוצה \( N_{\alpha} \) מוגדרת באופן רקורסיבי. אברי \( N_{\alpha} \) הם כל הקבוצות \( \tau\in\mathcal{M} \) כך ש:
- אברי \( \tau \) הם זוגות סדורים מהצורה \( \left(\sigma,p\right) \) כך ש-\( p\in P \) ואילו \( \sigma\in N_{\beta} \) עבור \( \beta<\alpha \).
- אם \( q \) הוא הרחבה של \( p \) וגם \( \left(\sigma,p\right)\in\tau \) אז \( \left(\sigma,q\right)\in\tau \).
שלב ב’: לכל שם \( \tau \) אנו מגדירים את הערך שלו, \( \tau^{G} \), ברקורסיה על הדרגה של \( \tau \):
\( \tau^{G}=\left\{ \sigma^{G}\ |\ \exists p\in G:\left(\sigma,p\right)\in\tau\right\} \)
וכעת מגדירים
\( \mathcal{M}\left[G\right]=\left\{ \tau^{G}\ |\ \tau\in\bigcup N_{\alpha}\right\} \)
זה הכל! זו ההגדרה המפחידה שכל כך התלוננתי עליה! אם היא ברורה לכם, יופי! לי היא בכלל לא הייתה ברורה! אני יוצא מנקודת הנחה שגם לכם היא לא כזו ברורה, אז בואו ננסה להסביר אותה.
נתחיל עם ההגדרה של שמות-\( P \). כמו כל הגדרה רקורסיבית, קשה להבין מה הולך בה אם קשה להבין מאיפה זה מתחיל בכלל, אז בואו נראה מה קורה בשלבים הראשונים. ראשית, \( N_{0} \). אם \( \tau\in N_{0} \), זה אומר שכל אברי \( \tau \) הם מהצורה \( \left(\sigma,p\right) \) כך ש-\( \sigma\in N_{\beta} \) שעבורו \( \beta<0 \)… אין דבר כזה. אז אין שום דבר שיכול להיות איבר של \( \tau \). זה אומר ש-\( \tau=\emptyset \). השם היחיד מדרגה 0 הוא פשוט הקבוצה הריקה: \( N_{0}=\left\{ \emptyset\right\} \).
למרבה המזל, ב-\( N_{1} \) כבר יש דברים מעניינים הרבה יותר. לכל שם ששייך ל-\( N_{1} \) יש הרבה איברים פוטנציאליים אפשריים: כל זוג מהצורה \( \left(\sigma,p\right) \) כך ש-\( \sigma\in N_{0} \) ו-\( p\in P \). מכיוון ש-\( N_{0}=\left\{ \emptyset\right\} \), אנחנו מדברים רק על איברים מהצורה \( \left(\emptyset,p\right) \), אבל גם כאלו יכולים להיות לא מעט, ואנחנו לוקחים את כל הקבוצות של איברים מהצורה הזו - כל עוד הן שייכות ל-\( \mathcal{M} \). חשוב להדגיש את זה: אנחנו כל הזמן עובדים במסגרת \( \mathcal{M} \) כשאנחנו בונים שמות. הפעולה שתחריג אותנו ותוציא אותנו החוצה תהיה שלב השמת הערכים בהתאם ל-\( G \).
איך נראה איבר של \( N_{2} \)? כאן אנחנו כבר נתקלים בדברים מסובכים למדי. עבור \( \tau\in N_{2} \) יש לנו קבוצה שכל איבר של הוא מהצורה \( \left(\sigma,p\right) \) עבור \( \sigma\in N_{1} \) או \( \sigma\in N_{0} \). אם \( \sigma\in N_{0} \) אנחנו יודעים שהזוג הוא \( \left(\emptyset,p\right) \) אבל אם הוא ב-\( N_{1} \) הוא כבר יכול להיות הרבה דברים. למשל \( \left(\left\{ \left(\emptyset,p_{1}\right)\right\} ,p\right) \); או למשל \( \left(\left\{ \left(\emptyset,p_{1}\right),\left(\emptyset,p_{2}\right)\right\} ,p\right) \); או אפילו אולי \( \left(\left\{ \left(\emptyset,p_{1}\right),\left(\emptyset,p_{2}\right),\ldots\right\} ,p\right) \) עבור \( \sigma \) אינסופית שמכילה את כל ה-\( P \)-ים. בקיצור, יש כאן הרבה גמישות וחופש בחירה, אבל בסופו של דבר כשמסתכלים על כל \( \tau \) כזה רואים המון זוגות סדורים, בקינונים שונים ומשונים, כך שלכל איבר מסובך \( \sigma \) מתלווה איזו תווית פשוטה \( p \). כאמור, אני אתייחס אל \( p \) בתור תיוג פה ושם מכאן והלאה; זה סתם שם לא פורמלי שעוזר לאינטואיציה שלי.
כדי להבין מה קורה עכשיו, כדאי להיזכר באקסיומת ההפרדה. אקסיומת ההפרדה היא הדרך שלנו לקחת קבוצה גדולה \( A \) אבל אולי לא הכי מורכבת בעולם, ובעזרת קריטריון \( \psi \) כלשהו לבנות מתוכה קבוצה מעניינת יותר: \( \left\{ a\in A\ |\ \psi\left(a\right)=\text{T}\right\} \). הקבוצה המעניינת היא קטנה יותר מ-\( A \) במובן זה שיש בה פחות איברים, אבל המבנה שלה עשוי להיות הרבה יותר מורכב. כך גם אצלנו - הרעיון עכשיו הוא לקחת את השם \( \tau \) ו”לסנן” ממנו את כל הדברים שלא מתוייגים בעזרת אברי \( G \), כדי לקבל קבוצות עם מבנה מעניין שלא נכללו ב-\( \mathcal{M} \) עצמה (כאן אנחנו רואים יתרון של השימוש בשם מסנן כדי לתאר את \( G \) - שימוש שהוא כאמור נפוץ בספרות, יחד עם היפוך טרמינולוגי מסוים, והעדפתי להימנע ממנו).
בואו נסתכל כעת שוב על השמת הערך ל-\( \tau \):
\( \tau^{G}=\left\{ \sigma^{G}\ |\ \exists p\in G:\left(\sigma,p\right)\in\tau\right\} \)
אנחנו בעצם עושים כאן שני דברים: ראשית, אנחנו מסננים מ-\( \tau \) החוצה את כל האיברים \( \left(\sigma,p\right) \) כך ש-\( p\notin G \). אחרי שלב הסינון הזה התגית שמחוברת ל-\( \sigma \) ששרדו היא “מיותרת” כי את הסינון עבורם כבר עשינו. אז אנחנו נפטרים מהתגית, נשארים רק עם \( \sigma \), ואז באופן רקורסיבי אנחנו נותנים ל-\( \sigma \) הזה ערך בעזרת \( G \) ומקבלים את \( \sigma^{G} \) שהוא מה שהולך להיכנס לגרסה הסופית של \( \tau^{G} \).
בשביל שההגדרה הזו תעבור, אני צריך שהדרגה של \( \sigma \) תהיה קטנה מהדרגה של \( \tau \), כך שאפשר יהיה להניח באינדוקציה שכשאני בא לתת ערך ל-\( \tau \) הערך של \( \sigma^{G} \) כבר נקבע. אבל זה ברור: נסתכל על ה-\( \alpha \) המינימלי כך ש-\( \tau\in N_{\alpha} \). על פי ההגדרה, אברי \( \tau \) הם \( \left(\sigma,p\right) \) כך שכל \( \sigma\in N_{\beta} \) כך ש-\( \beta<\alpha \), ובפרט הדרגה של \( \sigma \) היא לכל היותר \( \beta \), כך שההגדרה עובדת.
אבל מה בעצם קיבלנו?
בואו נניח שהבנו בערך איך ההגדרה עובדת. עדיין לא ברור הדבר המרכזי - מה זה בעצם \( \mathcal{M}\left[G\right] \) הזה? ובכן, זו קבוצה; קבוצה שנבנית מתוך האיברים של \( \mathcal{M} \) אבל עם תת-קבוצות חדשות שלא היו שם קודם. בפרט, \( \mathcal{M\subseteq}\mathcal{M}\left[G\right] \) וגם \( G\in\mathcal{M}\left[G\right] \). ואני רוצה שיהיה ברור, כי האנלוגיות שנתתי קודם אולי יוצרות רושם שגוי בנקודה הזו - כשאני אומר \( \mathcal{M\subseteq}\mathcal{M}\left[G\right] \) אני לא מתכוון שיש איזה עותק איזומורפי של \( \mathcal{M} \) בתוך \( \mathcal{M}\left[G\right] \) או משהו. אני מתכוון שכל האיברים של \( \mathcal{M} \) נמצאים כמות שהם בתוך \( \mathcal{M}\left[G\right] \). וגם לא קשה לראות את זה.
בתור שלב ראשון, אני רוצה להראות שלכל \( x\in\mathcal{M} \) יש שם כלשהו \( \sigma \) כך שכאשר מבצעים את ההשמה \( \sigma^{G} \) מקבלים \( x=\sigma^{G} \). אני אסמן את השם שמחזיר כך את \( x \) בתור \( \check{x} \). הדרך שבה אני רוצה להוכיח את קיום את כל ה-\( \check{x} \)-ים הללו היא באינדוקציה על-סופית, וכאן אני משתמש במושג של ההיררכייה המצטברת שהצגתי בפוסט על אינדוקציה ורקורסיה על-סופיות. גם אם לא זוכרים מה אמרתי שם, לא נורא; בפועל מה שאני משתמש בו הוא שאני יכול להניח, כשאני בא להוכיח משהו על \( x \), שאותו משהו כבר הוכח לכל האיברים של \( x \).
אוקיי, אז בואו ניקח \( x\in\mathcal{M} \) כלשהו. מה יהיה השם \( \check{x} \) שמתאים לו? האינטואיציה אומרת - מכיוון ש-\( x \) כבר שייך ל-\( \mathcal{M} \) ו-\( \mathcal{M} \) טרנזיטיבית, גם כל האיברים של \( x \) כבר שייכים ל-\( \mathcal{M} \) ולכן אפשר להניח באינדוקציה שיש להם שמות שמתאימים להם; כל מה שנשאר לעשות הוא לוודא שהשמות הללו לא מושמדים כשאנחנו מכניסים את \( G \) לתמונה, אז פשוט נתייג שם כזה עם כל \( p\in P \) אפשרי:
\( \check{x}=\left\{ \left(\left(\check{y},p\right)\ |\ y\in x\wedge p\in P\right)\right\} \)
האם \( \check{x} \) הוא בכלל שם חוקי? ובכן, שם צריך לקיים שתי דרישות. ראשית, שכל אבריו יהיו מהצורה \( \left(\sigma,p\right) \) כאשר \( \sigma \) הוא בעצמו שם - זה בהחלט מתקיים על פי ההגדרה. שנית, צריך להתקיים שאם \( q \) הוא הרחבה של \( p \) וגם \( \left(\sigma,p\right)\in\tau \) אז \( \left(\sigma,q\right)\in\tau \). כמובן שגם זה מתקיים כי לכל \( \check{y} \) לקחנו את כל האיברים מהצורה \( \left(\check{y},p\right) \) לכל \( p\in P \) כולל \( q \).
אז זה שם חוקי, אבל לא מספיק לקיים את הקריטריונים, גם צריך שיתקיים \( \check{x}\in\mathcal{M} \) (זוכרות? כל השמות הם איברים של \( \mathcal{M} \); זו ההשמה לתוכם שיוצרת דברים שאינם ב-\( \mathcal{M} \)). אם אנחנו מניחים באינדוקציה ש-\( \check{y}\in\mathcal{M} \) אז אנחנו מסודרים בזכות זה ש-\( \mathcal{M} \) מקיימת את \( \text{ZFC} \): בעזרת הפרדה על הקבוצה \( \mathcal{M} \) אנחנו בונים את הקבוצה \( A=\left\{ \check{y}\in\mathcal{M}\ |\ y\in x\right\} \), ואז \( \check{x}=A\times P \) - ומכפלה קרטזית של שתי קבוצות ששייכות ל-\( \mathcal{M} \) שייכת בעצמה ל-\( \mathcal{M} \) כי אפשר לבנות מכפלה קרטזית בעזרת ZFC.
עכשיו, מה קורה בשלב השמת הערך? \( \check{x}^{G}=\left\{ \check{y}^{G}\ |\ \exists p\in G:\left(\check{y},p\right)\in\dot{x}\right\} =\left\{ \check{y}^{G}\ |\ y\in x\right\} \) כשהמעבר השני נובע מכך ש-\( G \) לא מפלטר שום דבר כי בנינו את \( \check{x} \) כך שכל איבר שלו יופיע עם כל התיוגים האפשריים ובפרט כאלו ששייכים אל \( G \). כעת, נניח באינדוקציה שכבר ראינו \( \check{y}^{G}=y \) ונקבל \( \check{x}^{G}=\left\{ \check{y}^{G}\ |\ y\in x\right\} =\left\{ y\ |\ y\in x\right\} =x \), כפי שרצינו. אז אנחנו רואים ש-\( \mathcal{M}\subseteq\mathcal{M}\left[G\right] \) בצורה פשוטה למדי.
עכשיו בואו נראה שגם יצרנו משהו חדש: ש-\( G\in\mathcal{M}\left[G\right] \). מי יהיה השם שמתאים ל-\( G \)? כבר ראינו שלכל \( x\in\mathcal{M} \) יש שם \( \check{x} \) שנותן אותו; בפרט לכל \( p\in P \) מתקיים \( p\in\mathcal{M} \) אז לכל \( p \) כזה יש שם \( \check{p} \) מתאים. אז נגדיר:
\( \Gamma=\left\{ \left(\check{p},q\right)\ |\ p,q\in P\wedge p\subseteq q\right\} \)
כלומר, לכל שם \( \check{p} \) שכבר יצרנו, אנחנו מתייגים אותו עם כל ה-\( q \)-ים שהם הרחבות של \( p \). למה אני קורא לזה \( \Gamma \) ולא, נאמר, \( \check{G} \)? ובכן, כי הבניה הזו לא נובעת מ-\( G \) בשום צורה; \( G \) יצוץ רק בשלב השמת הערכים. אם היינו עובדים עם אידאל גנרי אחר, בשלב השמת הערכים \( \Gamma \) הייתה הופכת אליו.
למה הגדרנו את זה ככה? ובכן, ההגדרה הכי פשוטה היא \( \Gamma=\left\{ \left(\check{p},p\right)\ |\ p\in P\right\} \). עם ההגדרה הזו, ברור ש-\( \Gamma^{G}=\left\{ \check{p}^{G}\ |\ p\in G\right\} =\left\{ p\ |\ p\in G\right\} =G \) כי כבר ראינו ש-\( \check{p}^{G}=p \) (זה נכון לכל איבר של \( \mathcal{M} \)) ובעצם פשוט סיננו החוצה את האיברים של \( P \) שאינם ב-\( G \). אבל הגדרתי עם ה-\( q \) כדי לשמור על כך שהתכונה השניה של שמות-\( P \) תתקיים. זה לא יכול להכניס ל-\( \Gamma^{G} \) איברים שאינם ב-\( G \), כי \( G \) היא אידאל, ואידאלים הם בעלי תכונת סגירות כלפי מטה: אם \( q\in G \) ו-\( p\subseteq q \) אז גם \( p\in G \). לכן אם \( p\in\Gamma^{G} \), כלומר אם קיים \( q\in G \) כך ש-\( \left(\check{p},q\right)\in\Gamma \), אז על פי הגדרת \( \Gamma \) מתקיים \( p\subseteq q \) ולכן \( p\in G \).
האם סיימנו? הו לא, אנחנו רק מתחילים!
עולם חדש מופלא
מה שעשינו עד כה היה לבנות מ-\( \mathcal{M} \) ו-\( G \) את \( \mathcal{M}\left[G\right] \), שהיא קבוצה שמכילה את \( \mathcal{M} \) ואת \( G \). אבל כדי שהבניה הזו תועיל לנו, צריך ש-\( \mathcal{M}\left[G\right] \) תקיים את התכונות היפות ש-\( \mathcal{M} \) קיימה; היא הייתה קבוצה טרנזיטיבית בת מניה שקיימה את כל אקסיומות ZFC. נצטרך להראות שהכל עובד גם ב-\( \mathcal{M}\left[G\right] \). חלק מזה יהיה קל, וחלק… לא קל.
להוכיח ש-\( \mathcal{M}\left[G\right] \) היא טרנזיטיבית ובת מניה זה קל. בשביל החלק של בת מניה, שימו לב ש-\( \mathcal{M}\left[G\right] \) נוצרת ממתן ערך לכל שמות ה-\( P \) מעל \( \mathcal{M} \), כך שאם יש מספר בן מניה של שמות-\( P \) גם \( \mathcal{M}\left[G\right] \) תהיה בת מניה, אבל שמות-\( P \) מלכתחילה הוגדרו בתור איברים של \( \mathcal{M} \) שמקיימים תכונות מסוימות, אז בוודאי שאם \( \mathcal{M} \) בת מניה גם הם בני מניה.
כדי לראות ש-\( \mathcal{M}\left[G\right] \) טרנזיטיבית, בואו ניקח איבר שלה, \( \tau^{G}\in\mathcal{M}\left[G\right] \). מי האיברים של \( \tau^{G} \)? בואו נפתח שוב את ההגדרה:
\( \tau^{G}=\left\{ \sigma^{G}\ |\ \exists p\in G:\left(\sigma,p\right)\in\tau\right\} \)
ניקח \( \sigma^{G} \) שכזה: הוא עצמו מתן ערך לשם-\( P \) \( \sigma \), ולכן על פי הגדרה, \( \sigma^{G}\in\mathcal{M}\left[G\right] \), אז גם עניין הטרנזיטיביות היה קל. נשארה רק ZFC על שלל האקסיומות שלה. אפשר לחלק את האקסיומות לשני סוגים: אלו שממש קל להראות שמתקיימות גם ב-\( \mathcal{M}\left[G\right] \), ואלו שנצטרך עבודת הכנה בדמות משפט מהותי מאוד על האופי של \( \mathcal{M}\left[G\right] \) לפני שנוכל להוכיח. אז נתחיל ממה שממש קל: אקסיומות ההיקפיות, הזיווג, האיחוד, האינסוף והיסוד (מה שמשאיר לנו את קבוצת החזקה, ההפרדה, ההחלפה והבחירה).
על אקסיומת היסוד אין מה לדבר בכלל: כל איבר של \( \mathcal{M}\left[G\right] \) הוא קבוצה, כלומר מקיים את אקסיומות ZFC בגרסה הלא יחסית שלהן, ולכן מקיים את אקסיומת היסוד. זה עשוי להישמע טריוויאלי למדי, למה אי אפשר להשתמש באותו טיעון כדי להראות שהיקפיות מתקיימת, למשל? כי כזכור, היקפיות אומרת ששתי קבוצות \( A,B \) הן שוות אם ורק אם לכל \( x \), \( x\in A \) אם ורק אם \( x\in B \), אבל כשאנחנו עוברים לדבר על הגרסה היחסית, \( x \) הוא לא איבר כלשהו אלא רק של העולם שאנחנו מדברים עליו, במקרה הנוכחי \( \mathcal{M}\left[G\right] \). למרבה המזל, העולם הספציפי הזה הוא טרנזיטיבי, כפי שכבר ראינו, אז אם \( A\in\mathcal{M}\left[G\right] \) ואם \( x\in A \) אז בפרט \( x\in\mathcal{M}\left[G\right] \) ולכן הוא משתתף בהגדרה של היקפיות - ואנחנו מקבלים שהיקפיות פירושה “שתי קבוצות שוות אם יש להן בדיוק את אותם איברים” גם בהקשר הצר של \( \mathcal{M}\left[G\right] \).
אקסיומת האינסוף נובעת מכך ש-\( \mathcal{M} \) מקיימת אותה ו-\( \mathcal{M}\subseteq\mathcal{M}\left[G\right] \), כפי שכבר ראינו.
אקסיומת הזיווג מתחילה להיות טריקית. אנחנו לוקחים \( \tau_{1}^{G},\tau_{2}^{G}\in\mathcal{M}\left[G\right] \) והמטרה שלנו היא להראות שגם \( \left\{ \tau_{1}^{G},\tau_{2}^{G}\right\} \in\mathcal{M}\left[G\right] \), כלומר ממש צריך לעבוד קצת עם הידיים ולבנות משהו. אבל טיפה חשיבה וקל לראות מה המשהו. נגדיר שם-\( P \) באופן הבא:
\( \tau_{\left\{ 1,2\right\} }=\left\{ \left(\sigma,p\right)\ |\left(\sigma=\tau_{1}\vee\sigma=\tau_{2}\right)\wedge p\in P\right\} \)
כלומר, \( \tau_{\left\{ 1,2\right\} } \) פשוט מכיל את השמות \( \tau_{1},\tau_{2} \) כשהם מתוייגים על ידי כל אברי \( P \), ולכן ברור ש-\( \tau_{\left\{ 1,2\right\} }^{G}=\left\{ \tau_{1}^{G},\tau_{2}^{G}\right\} \). ברור גם ש-\( \tau_{\left\{ 1,2\right\} } \) הוא שם-\( P \) חוקי על פי ההגדרה, בזכות זה שהתיוגים נלקחים מכל \( P \). מה שקצת פחות ברור הוא למה \( \tau_{\left\{ 1,2\right\} }\in\mathcal{M} \) בכלל, אבל זה נובע מכך ש-\( \mathcal{M} \) מקיימת את ZFC. הרי \( \tau_{\left\{ 1,2\right\} }=\left\{ \tau_{1}\right\} \times P\cup\left\{ \tau_{2}\right\} \times P \) ואת הבניה הזו קל לבצע במסגרת ZFC.
נשארה לנו האקסיומה הקשה ביותר מבין אלו הקלות: איחוד. זה “קשה” בעיקר כי כשיש לנו איחוד צריך לדבר על איבר-של-איבר-של-איבר של משהו. אנחנו לוקחים איבר של \( \mathcal{M}\left[G\right] \) וצריכים להראות שיש ב-\( \mathcal{M}\left[G\right] \) קבוצה שהאיברים שלה הם כל האיבר-של-איבר של אותו איבר של \( \mathcal{M}\left[G\right] \) שהתחלנו ממנו.
ובכן, איבר כללי של \( \mathcal{M}\left[G\right] \) הוא מהצורה \( \tau^{G} \) עבור שם-\( P \) כלשהו \( \tau \). האיברים של \( \tau^{G} \) הזה הם, על פי הגדרה, כל מני \( \sigma^{G} \)-ים כך ש-\( \left(\sigma,p\right)\in\tau \) עבור \( p\in G \). מה שאנחנו צריכים להראות הוא קבוצה ב-\( \mathcal{M}\left[G\right] \) שהאיברים שלה הם אותם איברים של כל ה-\( \sigma^{G} \) הללו. כלומר, הם איברים מהצורה \( \upsilon^{G} \) כך ש-\( \left(\upsilon,q\right)\in\sigma \) עבור \( q\in G \) כלשהו.
עכשיו, מכיוון שאיבר כללי של \( \mathcal{M}\left[G\right] \) נבנה על ידי לקיחת שם-\( P \) ואז מתן ערך עבורו, אנחנו בעצם צריכים להגדיר שם-\( P \) שיתורגם אל הקבוצה הזו. בואו נסמן אותו ב-\( \overline{\tau} \) כדי שיהיה ברור הקשר ל-\( \tau \) המקורי. הנה נסיון לתת הגדרה על בסיס הפסקה הקודמת:
\( \overline{\tau}=\left\{ \left(\upsilon,q\right)\ |\ \exists\left(\sigma,p\right):\left(\left(\upsilon,q\right)\in\sigma\wedge\left(\sigma,p\right)\in\tau\right)\right\} \)
הבעיה היא שההגדרה הזו לא תעבוד. היא לא תעבוד בגלל בעיה עדינה, כמו שקורה המון בהוכחות כאן. דווקא בגלל זה אני רוצה שנתחיל את ההוכחה ונראה איפה אנחנו נתקעים.
ובכן, להוכחה יש שני כיוונים, וכשכתבתי את ההגדרה של \( \overline{\tau} \) חשבתי רק על אחד מהם - על לקחת איבר של \( \bigcup\tau^{G} \) ולהראות שהוא שייך ל-\( \overline{\tau}^{G} \). אז בואו נתחיל מלנסות את הכיוון השני דווקא: ניקח איבר של \( \overline{\tau}^{G} \) וננסה להראות שהוא שייך אל \( \bigcup\tau^{G} \).
ובכן, יהא \( \upsilon^{G}\in\overline{\tau}^{G} \) כלשהו (מנין לי שהצורה של איבר כללי של \( \overline{\tau}^{G} \) היא השמה-לשם-\( P \)? כי ככה הוגדר \( \mathcal{M}\left[G\right] \)). אני רוצה להראות שקיים \( \sigma^{G} \) כך שמתקיימת השרשרת \( \upsilon^{G}\in\sigma^{G}\in\tau^{G} \), אז אני מסתכל על מה שנובע מהנתון שלי, כלומר מ-\( \upsilon^{G}\in\overline{\tau}^{G} \); שייכות כזו מתקיימת אם \( \left(\upsilon,q\right)\in\overline{\tau} \) עבור \( q\in G \) כלשהו. כלומר, לפי הגדרת \( \overline{\tau} \), קיים זוג \( \left(\sigma,p\right) \) כך ש-\( \left(\upsilon,q\right)\in\sigma \) וגם \( \left(\sigma,p\right)\in\tau \). מכך ש-\( \left(\upsilon,q\right)\in\sigma \) אני יכול להסיק ש-\( \upsilon^{G}\in\sigma^{G} \), אבל מכך ש-\( \left(\sigma,p\right)\in\tau \) אני לא יכול להסיק \( \sigma^{G}\in\tau^{G} \) ופה אני נתקע. למה? כי כדי להסיק את זה צריך שיתקיים \( p\in G \), אבל שום דבר לא אומר לי ש-\( p\in G \); כל מה שאני יודע הוא ש-\( p \) הוא איבר כלשהו של \( P \) וזה לא עוזר לי לדעת שהוא שייך אל \( G \).
אז מה צריך לעשות כדי לתקן את ההגדרה? משהו די פשוט: להשתמש באותו איבר גם ל-\( q \) וגם ל-\( p \), כלומר להגדיר
\( \overline{\tau}=\left\{ \left(\upsilon,p\right)\ |\ \exists\sigma:\left(\left(\upsilon,p\right)\in\sigma\wedge\left(\sigma,p\right)\in\tau\right)\right\} \)
ההגדרה הזו סבבה. אין ספק שהקבוצה הזו קיימת (אפשר לבנות אותה מהאקסיומות בתוך \( \mathcal{M} \)) ובדיקה מהירה מראה שהיא מקיימת את הדרישות משם-\( P \). ועכשיו, השלב בהוכחה שנתקע לא ייתקע, כי עכשיו מכך ש-\( \left(\sigma,p\right)\in\tau \) אני יכול להסיק ש-\( \sigma^{G}\in\tau^{G} \), וזה מסיים את הכיוון הזה.
כמובן, המחיר של התיקון הוא שעכשיו הכיוון השני יהיה טיפה יותר בעייתי - צריך להראות שההגדרה של \( \overline{\tau} \) לא הפכה לחזקה מדי, עד כדי כך שעכשיו מתפספסים איברים ששייכים לאיחוד אבל לא משתייכים אל \( \overline{\tau}^{G} \). כדי לראות את זה אני לוקח שרשרת \( \upsilon^{G}\in\sigma^{G}\in\tau^{G} \). מה שאני יכול להסיק ממנה הוא שקיימים \( p,q \) כך ש-\( \left(\sigma,p\right)\in\tau \) ו-\( \left(\upsilon,q\right)\in\sigma \), ואני גם יכול להסיק ששניהם מקיימים \( p,q\in G \), אבל אני לא יכול להסיק שהם שווים. לכאורה כאן נתקעתי, אבל למרבה המזל לא נגמרו ההגדרות שאפשר לשלוף מהשרוול.
בואו ניזכר ש-\( G \) הזה הוא לא סתם קבוצה, הוא מה שנקרא “אידאל”, שמקיים בין היתר את התכונה הבאה שאני מצטט מהפוסט הקודם:
“מכוונת: אם \( p_{1},p_{2}\in G \) אז קיים \( q\in G \) כך ש-\( p_{1},p_{2}\subseteq q \)”
ובכן, במקרה שלנו מכך ש-\( p,q\in G \) אני יכול להסיק שקיים \( r\in G \) כך ש-\( p,q\subseteq r \). ועכשיו, תכונה 2 של שמות-\( P \) מבטיחה לי שאם \( \left(\sigma,p\right)\in\tau \) ו-\( \left(\upsilon,q\right)\in\sigma \) אז גם \( \left(\sigma,r\right)\in\tau \) ו-\( \left(\upsilon,r\right)\in\sigma \), ולכן \( \left(\upsilon,r\right)\in\overline{\tau} \) על פי הגדרה, וקיבלנו \( \upsilon^{G}\in\overline{\tau}^{G} \), כפי שרצינו. זה מסיים את ההוכחה הזו, וגם סוף סוף נותן לנו קצת תחושה של למה צריך חלק מהתכונות שהופיעו בהגדרות וטרם נגענו בהן.
זה מסיים את הפוסט הזה, אבל עדיין לא סיימנו עם הסיפור של בניית \( \mathcal{M}\left[G\right] \), ובפוסט הבא נעסוק במה שנזדקק לו לצורך הוכחת יתר האקסיומות.
נהניתם? התעניינתם? אם תרצו, אתם מוזמנים לתת טיפ: