בעקבות השערת הרצף, חלק ז’: המשפט היסודי של תורת הכפיה (המקרה הפרטי שהוא עיקר העבודה)

מבוא

בפוסט הקודם ראינו את ההגדרה המרכזית של תורת הכפיה, והפעם נראה את המשפט המרכזי של תורת הכפיה. ההגדרה המרכזית הייתה האופן שבו בהינתן ה”עולם” \( \mathcal{M} \) שלנו ואידאל גנרי \( G \) בו, אנחנו בונים מתוכם את ההרחבה \( \mathcal{M}\left[G\right] \), שהיא קבוצה שמכילה את \( \mathcal{M} \) ואת \( G \) (את אלו ראינו) ומקיימת את אותן תכונות יפות כמו \( \mathcal{M} \): היא בת מניה, טרנזיטיבית ומקיימת את אקסיומות ZFC.

כזכור, \( \mathcal{M}\left[G\right] \) נבנתה בתהליך דו-שלבי. בשלב הראשון הגדרנו משהו שנקרא שמות-\( P \), ובשלב השני לכל שם-\( P \) \( \sigma \) התאמנו ערך \( \sigma^{G} \) והגדרנו את \( \mathcal{M}\left[G\right] \) בתור הקבוצה של כל ה-\( \sigma^{G} \) הללו לכל שמות ה-\( P \) הקיימים מעל \( \mathcal{M} \). הבניה של שמות ה-\( P \) וההגדרה של השמת הערך עבורם היו רקורסיביים. שם-\( P \) \( \tau \) היה קבוצה של זוגות מהצורה \( \left(\sigma,p\right) \) כך ש-\( p\in P \) ואילו \( \sigma \) הוא שם-\( P \) שכבר הוגדר קודם, ובנוסף הייתה לנו דרישה לפיה אם \( q \) הוא הרחבה של \( p \) וגם \( \left(\sigma,p\right)\in\tau \) אז \( \left(\sigma,q\right)\in\tau \). ההגדרה של השמת ערך הייתה \( \tau^{G}=\left\{ \sigma^{G}\ |\ \exists p\in G:\left(\sigma,p\right)\in\tau\right\} \).

עבור הבניה הזו ראינו איך מתקיימות חלק מהאקסיומות: היקפיות, זיווג, איחוד, אינסוף ויסוד. עד כאן הכל טוב, אבל בשביל לטפל ביתר האקסיומות אני צריך משהו חזק יותר. הרבה יותר.

המשהו הזה כל כך חזק שהוא נקרא המשפט היסודי של תורת הכפיה והוא אומר, בגדול, שקבוצת תנאי הכפיה \( P \) קובעת את המבנה \( \mathcal{M}\left[G\right] \) בצורה כל כך חזקה, שעבור כל נוסחה \( \phi\left(\tau_{1},\ldots,\tau_{n}\right) \) קיים תנאי כפיה \( p \) כך שלכל \( G \) שמכיל את \( p \), אנו יודעים ש-\( \mathcal{M}\left[G\right] \) יספק את \( \phi \). במילים אחרות, תנאי הכפיה הבודד \( p\in G \) כופה על \( \mathcal{M}\left[G\right] \) לקיים את הנוסחה.

להבין את הניסוח המדויק של המשפט יכול להיות קצת מעצבן, אז בואו נפתח עם דוגמא - דוגמא חשובה במיוחד, כי היא מצד אחד המקרה הפרטי הבסיסי ביותר של המשפט, ומצד שני ההוכחה שלה תהיה החלק הקשה ביותר בהוכחה של המשפט כולו והיא תתפרש על כל הפוסט הזה ותדרוש הרבה פרטים טכניים. הדוגמא היא הנוסחה האטומית \( x_{1}=x_{2} \).

הנוסחה האטומית הזו כוללת שני משתנים חופשיים, \( x_{1},x_{2} \). אין לה ערך אמת בפני עצמה ב-\( \mathcal{M}\left[G\right] \); אנחנו צריכים לבחור השמה של ערכים לשני המשתנים הללו. השמה פירושה לבחור איברים של \( \mathcal{M}\left[G\right] \) ולהציב אותם בנוסחה במקום המשתנים, כלומר נקבל משהו כמו \( \tau_{1}^{G}=\tau_{2}^{G} \), וזו טענה שיכולה להיות נכונה אך ורק אם \( \tau_{1}^{G} \) ו-\( \tau_{2}^{G} \) הם אותם איברים בדיוק. אז איפה בעצם נכנסים תנאי הכפייה לתמונה? מה המשפט פה בכלל?

בשביל לראות את זה צריך לקחת צעד אחורה ולא לחשוב על \( \mathcal{M}\left[G\right] \) בתור משהו קבוע. השאלה שאנחנו שואלים את עצמנו עכשיו היא - עבור ערכים שונים של \( G \), מה קובע האם הנוסחה תתקיים? אבל גם זו נדמית כמו שאלה חסרת משמעות: הנוסחה \( x_{1}=x_{2} \) מתקיימת אם ורק אם מציבים בשני המשתנים שלה את אותו איבר, סוף הסיפור.

לכן אנחנו שואלים שאלה קצת שונה. אנחנו מתחילים עם שני שמות-\( P \), \( \tau_{1},\tau_{2} \). בפני עצמם, השמות הללו הם בסך הכל איברים של \( \mathcal{M} \). אם נבחר \( G \) נוכל להעביר אותם תהליך של השמה שיחזיר מהם ערך שהוא איבר ב-\( \mathcal{M}\left[G\right] \), אבל הם קיימים גם בלי שיהיה \( G \) אחד ספציפי ברקע. עכשיו אני יכול “להציב” אותם ב-\( x_{1}=x_{2} \) ולקבל את הנוסחה \( \tau_{1}=\tau_{2} \). אני חושב על זה בתור סימון בלבד, מין תבנית שמחכה שנבחר \( G \) ספציפי ואז נקבל מהנוסחה הזו את \( \tau_{1}^{G}=\tau_{2}^{G} \). והשאלה שאנחנו שואלים היא: מה צריך \( G \) לקיים כדי שהנוסחה \( \tau_{1}^{G}=\tau_{2}^{G} \) תהיה בעלת ערך T? התשובה היא שעבור \( \tau_{1},\tau_{2} \) הללו קיים תנאי כפיה \( p \) כך שאם \( p\in G \), מובטח ש-\( \tau_{1}^{G}=\tau_{2}^{G} \) היא אכן בעלת ערך T.

בואו נעבור לנסח את זה פורמלית, ולהבין איך בכלל תלך ההוכחה.

מנסחים את זה פורמלית ומבינים איך בכלל הולכת ההוכחה

מושג המפתח שעליו אנחנו מדברים כאן הוא מתי תנאי כפיה \( p \) כופה משהו על נוסחה ושמות-\( P \) שמופיעים בה. אז תהא \( \phi\left(x_{1},\ldots,x_{n}\right) \) נוסחה כלשהי עם משתנים חופשיים \( x_{1},\ldots,x_{n} \) ויהיו \( \tau_{1},\ldots,\tau_{n} \) שמות-\( P \) כלשהם, ויהא \( p\in P \) תנאי כפיה כלשהו. אני אגיד ש-\( p \) כופה את \( \phi\left(\tau_{1},\ldots,\tau_{n}\right) \) ואסמן זאת \( p\Vdash\phi\left(\tau_{1},\ldots,\tau_{n}\right) \) אם לכל אידאל גנרי \( G \) כך ש-\( p\in G \), מתקיים ש-\( \mathcal{M}\left[G\right]\models\phi\left(\tau_{1}^{G},\ldots,\tau_{n}^{G}\right) \), דהיינו הפסוק \( \phi\left(x_{1},\ldots,x_{n}\right) \) מקבל ערך T במודל של \( \mathcal{M}\left[G\right] \) תחת ההשמה שנותנת למשתנים את הערכים \( \tau_{1}^{G},\ldots,\tau_{n}^{G} \) (שימו לב: ב-\( \phi \) יכולים להיות גם משתנים מכומתים, והרעיון הוא שהערכים המכומתים הללו מגיעים מתוך \( \mathcal{M}\left[G\right] \)). הנקודה העדינה שצריך לשים לב אליה היא שכפיה לא תלויה רק בתנאי \( p \) ובפסוק \( \phi \) אלא גם בשמות ספציפיים \( \tau_{1},\ldots,\tau_{n} \), כלומר \( p \) לא סתם כופה את הפסוק \( \phi \) אלא את ה”תבנית” \( \phi\left(\tau_{1},\ldots,\tau_{n}\right) \) שהיא ערבוב של הפסוק והשמות.

המשפט הכללי שאני רוצה להוכיח - “המשפט היסודי של תורת הכפיה”, הוא זה: לכל אידאל גנרי \( G \), נוסחה \( \phi\left(x_{1},\ldots,x_{n}\right) \) ושמות-\( P \) \( \tau_{1},\ldots,\tau_{n} \), מתקיים ש-\( \mathcal{M}\left[G\right]\models\phi\left(\tau_{1}^{G},\ldots,\tau_{n}^{G}\right) \) אם ורק אם קיים \( p\in G \) כך ש-\( p \) כופה את \( \phi\left(\tau_{1},\ldots,\tau_{n}\right) \). בניסוח הפורמלי המלא בפוסט הבא יהיה עוד חלק חשוב לא פחות שעוסק ביכולת שלנו להגדיר את יחס הכפיה במסגרת \( \mathcal{M} \), אבל בינתיים אני חושב שזה יכול רק לבלבל אז בואו נראה איך זה צץ מעצמו כשאנחנו מוכיחים את המשפט.

כיוון אחד של המשפט הוא טריוויאלי: מן הסתם אם יש ב-\( G \) איבר \( p \) שכופה את \( \phi\left(\tau_{1},\ldots,\tau_{n}\right) \) אז נובע מכך מייד ש-\( \mathcal{M}\left[G\right]\models\phi\left(\tau_{1}^{G},\ldots,\tau_{n}^{G}\right) \) כי זה נובע מיידית מההגדרה של \( p\Vdash\phi\left(\tau_{1},\ldots,\tau_{n}\right) \). מה שמעניין הוא הכיוון השני: שאם \( \phi\left(\tau_{1}^{G},\ldots,\tau_{n}^{G}\right) \) מקבלת T במודל הספציפי \( \mathcal{M}\left[G\right] \), זה אומר שאפשר “לזקק” את \( G \) לכדי איבר בודד \( p\in G \) שהוא זה שאחראי לזה.

כרגע אני רוצה להסתפק ביעד הצנוע של להוכיח את זה עבור הנוסחה \( x_{1}=x_{2} \). כלומר, יהיו \( \tau_{1},\tau_{2} \) שני שמות-\( P \); אני רוצה להראות שאם עבור אידאל גנרי \( G \) מתקיים \( \tau_{1}^{G}=\tau_{2}^{G} \) , אז קיים \( p\in G \) כך ש-\( p\Vdash\tau_{1}=\tau_{2} \), דהיינו לכל אידאל גנרי \( G^{\prime} \) כך ש-\( p\in G^{\prime} \) יתקיים \( \tau_{1}^{G^{\prime}}=\tau_{2}^{G^{\prime}} \). זו המטרה, וזו לא תהיה מטרה קלה בכלל, אבל נסתדר.

לפני שמדברים על מה קורה בתוך אידאלים גנריים, אנחנו צריכים לענות לשאלה יותר בסיסית - האם אנחנו יכולים, עבור \( \tau_{1},\tau_{2} \), “לתפוס” את אותם \( p \)-ים שכופים את השוויון שלהם? זה יצריך מאיתנו בניה לא טריוויאלית וזהירה, אבל התשובה היא כן.

כזכור, את שמות ה-\( P \) בנינו באופן היררכי; בנינו סדרה \( N_{\alpha} \) של קבוצות, שמאונדקסות על ידי הסודרים שמופיעים ב-\( \mathcal{M} \), כך שכל שם-\( P \) השתייך לאחת הקבוצות. הדרגה של שם-\( P \) הייתה האינדקס המינימלי \( \alpha \) של קבוצה כזו שבה הוא מופיע; האיברים שלו התבססו על שמות-\( P \) מדרגה נמוכה יותר. בהיררכייה הזו נשתמש כדי ליצור את היחס \( p\Vdash\tau_{1}=\tau_{2} \). יחס כזה הוא אוסף של שלשות מהצורה \( \left(p,\tau_{1},\tau_{2}\right) \); ונבנה את אוסף השלשות הזה בצורה רקורסיבית. לכל סודר \( \alpha\in\mathcal{M} \) נגדיר קבוצה \( \mathcal{F}_{\alpha} \) שכוללת חלק מהשלשות הללו, בהתאם לדרגה של \( \tau_{1},\tau_{2} \). פורמלית, \( \mathcal{F}_{\alpha}\subseteq P\times N_{\alpha}\times N_{\alpha} \), כלומר ב-\( \mathcal{F}_{\alpha} \) יופיעו אותם שמות-\( P \) שהם לכל היותר מדרגה \( \alpha \).

בואו נסמן את הדרגה של שם-\( P \) כלשהו ב-\( \text{rank}\left(\tau\right) \) ועבור שני שמות, נסמן \( \text{rank}\left(\tau_{1},\tau_{2}\right)=\text{max}\left\{ \text{rank}\left(\tau_{1}\right),\text{rank}\left(\tau_{2}\right)\right\} \). עכשיו אפשר סוף סוף להגדיר פורמלית את \( \mathcal{F}_{\alpha} \): \( \left(p,\tau_{1},\tau_{2}\right)\in\mathcal{F}_{\alpha} \) אם מתקיימים שני התנאים הבאים (שהם בעצם ניסוחים סימטריים של אותו דבר):

לכל \( \left(\sigma_{1},q_{1}\right)\in\tau_{1} \) כך ש-\( p\subseteq q_{1} \), קיים \( \left(\sigma_{2},q_{2}\right)\in\tau_{2} \) כך ש-\( q_{1}\subseteq q_{2} \) ו-\( \left(q_{2},\sigma_{1},\sigma_{2}\right)\in\mathcal{F}_{\text{rank}\left(\sigma_{1},\sigma_{2}\right)} \).
לכל \( \left(\sigma_{2},q_{2}\right)\in\tau_{2} \) כך ש-\( p\subseteq q_{2} \), קיים \( \left(\sigma_{1},q_{1}\right)\in\tau_{1} \) כך ש-\( q_{2}\subseteq q_{1} \) ו-\( \left(q_{1},\sigma_{1},\sigma_{2}\right)\in\mathcal{F}_{\text{rank}\left(\sigma_{1},\sigma_{2}\right)} \).

לא לגמרי ברור בשלב הזה מה הרעיון בהגדרה ולמה זה עובד - נקדיש לא מעט עבודה טכנית בשביל זה. אבל בשלב הזה אפשר כבר להשתכנע שהשימוש ברקורסיה פה הוא תקין: אנחנו מגדירים את \( \mathcal{F}_{\alpha} \) תוך הסתמכות על כך ש-\( \mathcal{F}_{\text{rank}\left(\sigma_{1},\sigma_{2}\right)} \) כבר הוגדר לכל \( \sigma_{1},\sigma_{2} \) שמופיעים בתוך \( \tau_{1},\tau_{2} \) בהתאמה. זה עובד, כי \( \text{rank}\left(\sigma_{i}\right)<\text{rank}\left(\tau_{i}\right)\le\alpha \) (ממש על פי הגדרה; שם-\( P \) מדרגה מסוימת מוגדר על ידי אוסף זוגות שנבנים משמות שדרגתם קטנה יותר) ולכן \( \text{rank}\left(\sigma_{1},\sigma_{2}\right)<\alpha \).

מוכיחים שזה עובד - החימום

לפני שאני אגיע להוכחה המרכזית, אני צריך להוכיח כמה טענות עזר שיהיו קריטיות במהלכה. הן עצמן פשוטות למדי ומרגישות כמו משחק בהגדרות.

ראשית, בואו נוכיח שאם \( G \) הוא אידאל גנרי ו-\( D\in\mathcal{M} \) היא קבוצה \( D\subseteq P \), כך שלכל איבר של \( G \) יש הרחבה משותפת עם איבר של \( D \), אז \( G\cap D\ne\emptyset \) (כזכור, הרחבה משותפת של \( p_{1},p_{2} \) היא \( q \) כך ש-\( p_{1}\subseteq q \) וגם \( p_{2}\subseteq q \)).

למה הטענה נכונה? בשביל זה צריך להיזכר בהגדרה של אידאל גנרי: “אידאל \( G \) הוא גנרי ביחס ל-\( \mathcal{M} \) אם לכל קבוצה צפופה \( D\subseteq P \) כך ש-\( D\in\mathcal{M} \), החיתוך של \( G \) ו-\( D \) אינו ריק, \( G\cap D\ne\emptyset \).” רואים? הנה הגיעה לה \( D \) וגם ה-\( G\cap D\ne\emptyset \) המבוקש. רק צריך להראות ש-\( D \) צפופה. ומה זה צפופה? נפלא, בואו ניזכר גם בהגדרה הזו, “תת-קבוצה \( D\subseteq P \) היא צפופה אם לכל \( p\in P \) קיימת הרחבה ב-\( D \).”

אוקיי, יש לנו בעיה: ההגדרה של צפופה חזקה מדי, לא מובטח ש-\( D \) תקיים אותה. אז בואו נרחיב את \( D \) לקבלת קבוצה \( D^{\prime} \) שתהיה צפופה, באופן הבא: נוסיף ל-\( D^{\prime} \) את כל האיברים שמרחיבים איבר כלשהו ב-\( D \), כלומר את הקבוצה \( \left\{ q\in P\ |\ \exists p\in D:p\subseteq q\right\} \). לרוע המזל, גם זה לא מספיק טוב. מה עם איברים \( p\in P \) שאין להם שום הרחבה משותפת עם אף איבר של \( D \)? אוקיי, בואו נוסיף גם אותם אל \( D^{\prime} \). זה כבר מבטיח ש-\( D^{\prime} \) צפופה, כי אם \( p\in P \) יש שתי אפשרויות: או שאין ל-\( p \) הרחבה משותפת עם אף איבר של \( D \), ואז מההגדרה הוא שייך אל \( D^{\prime} \); או שיש לו הרחבה משותפת ואז ההרחבה הזו כבר מצאה את דרכה אל \( D^{\prime} \) כשרק הגדרנו אותו. קיבלנו ש-\( D^{\prime} \) אכן צפופה ולכן \( G\cap D^{\prime}\ne\emptyset \).

עכשיו, אנחנו יודעים שלכל איבר של \( G \) יש הרחבה משותפת עם איבר של \( D \), כלומר אם \( p\in G\cap D^{\prime} \) אז \( p \) שייך לחצי הראשון של \( D^{\prime} \), של אותם איברים שהתקבלו מהרחבת איברים של \( D \). זה עוזר לנו, כי אנחנו יודעים מההגדרה של אידאל שאם איבר שייך אליו, כך גם כל מי שמוכל בו:

“סגורה כלפי מטה: אם \( q\in G \) ועבור \( p\in P \) כלשהו מתקיים \( p\subseteq q \) אז \( p\in G \).”

אז במקרה שלנו, \( p \) שייך לאידאל \( G \) ומרחיב איבר של \( D \) ולכן אותו איבר של \( D \) שייך ל-\( G \) בעצמו, וסיימנו.

עכשיו בואו נוכיח בעזרת הטענה שזה עתה ראינו עוד משהו. אני אומר על קבוצה \( D\in\mathcal{M} \) שהיא צפופה מעל \( p \) כלשהו אם לכל הרחבה של \( p \) קיימת הרחבה ב-\( D \) (כלומר לכל \( p\subseteq q \) קיים \( q^{\prime}\in D \) כך ש-\( q\subseteq q^{\prime} \)). זו גרסה מקומית של ההגדרה הכללית של צפיפות שפשוט דרשה שלכל איבר תהיה הרחבה ששייכת ל-\( D \).

עכשיו, אם \( G \) הוא אידאל גנרי ו-\( D \) צפופה מעל \( p\in G \) כלשהו, אני רוצה להסיק מכך ש-\( G\cap D\ne\emptyset \). אז מן הסתם אנסה לבצע רדוקציה לטענה הקודמת, מה שמצריך אותי להוכיח שלכל איבר של \( G \) יש הרחבה משותפת עם איבר של \( D \). אבל זה קל, כי בואו ניקח \( p^{\prime}\in G \). מההגדרה של אידאל קיים \( q\in G \) כך ש-\( p,p^{\prime}\subseteq q \), ולכן אנחנו יודעים שיש \( q^{\prime}\in D \) כך ש-\( p^{\prime}\subseteq q\subseteq q^{\prime} \) וה-\( q^{\prime} \) הזה הוא הרחבה משותפת של \( p^{\prime} \) ושל עצמו. לכן אפשר להסיק ש-\( G\cap D\ne\emptyset \).

לבסוף, עוד דבר אחד שאזדקק לו הוא זה: שאם \( G\subseteq A\in\mathcal{M} \) אז קיים \( p\in G \) כך שכל הרחבה של \( p \) שייכת ל-\( A \). בשלב הזה אנחנו כנראה לא מספיק בהכרה כדי “להרגיש” מה זה אומר בכלל, אבל כשאני חושב על זה רגע זה לא משהו מובן מאליו. הרחבות של איברים הן בדרך כלל משהו שמתפרע לו ואין לנו שליטה עליו, לא? באידאל ה”שליטה” שיש לנו היא לכיוון ההפוך - אם איבר שייך לאידאל, אז כל מי שהוא מרחיב גם כן שייך לאידאל. כאן סוג של קורה הכיוון השני, כך שזה מעין קסם. הסיבה לקסם הזה היא ש-\( A\in\mathcal{M} \) וזה איכשהו מבטיח שהמבנה שלו יהיה “נחמד” מספיק, להבדיל מהמבנה היותר מסובך של \( G \) שגורם לכך ש-\( G \) לא תהיה ב-\( \mathcal{M} \).

אוקיי, אז איך מוכיחים את זה? מכיוון ש-\( G\subseteq A \) אז \( G\cap P\backslash A=\emptyset \). ראינו לפני רגע את הטענה שאם \( D\in\mathcal{M} \) היא קבוצה \( D\subseteq P \), כך שלכל איבר של \( G \) יש הרחבה משותפת עם איבר של \( D \), אז \( G\cap D\ne\emptyset \). במקרה שלנו ניקח \( D=P\backslash A \) (מכיוון ש-\( P,A\in\mathcal{M} \) ו-\( \mathcal{M} \) מקיימת את ZFC אז גם \( P\backslash A\in\mathcal{M} \)) ולכן מכך שהטענה לא מתקיימת נוכל להסיק את השלילה של התנאים שלה, כלומר שקיים איבר \( p\in G \) שאין לו הרחבה משותפת עם אף איבר של \( D \). זה כמובן ה-\( p \) שאנחנו רוצים; כל הרחבה של \( p \) הזה בהכרח לא שייכת ל-\( D \) אחרת היינו מקבלים הרחבה משותפת ל-\( p \) ולאיבר של \( D \) (הוא עצמו). המסקנה היא ש-\( p\in A \) ובכך סיימנו את ההוכחה של טענות העזר ואפשר לעבור להוכחה של המשפט המרכזי.

מוכיחים שזה עובד - ההוכחה

הנה המשפט שאני רוצה להוכיח. אני אוכיח אותו באינדוקציה על הסודרים של \( \mathcal{M} \), והוא כולל שני חלקים, שכל אחד מהם, כשמשתמשים בו בתור הנחת האינדוקציה, עוזר להוכיח את השני. הנה מה שהוא אומר:

בהינתן סודר \( \alpha\in\mathcal{M} \), לכל זוג שמות-\( P \) \( \tau_{1},\tau_{2} \) שהם מדרגה \( \alpha \) לכל היותר, מתקיים:

אידאל גנרי \( G \) של \( P \) מקיים \( \tau_{1}^{G}=\tau_{2}^{G} \) אם ורק אם קיים \( p\in G \) שכופה את \( \tau_{1}=\tau_{2} \).
איבר \( p\in P \) כופה את \( \tau_{1}=\tau_{2} \) אם ורק אם \( \left(p,\tau_{1},\tau_{2}\right)\in\mathcal{F}_{\alpha} \)

כאמור, ההוכחה תהיה באינדוקציה; אנחנו נוכל להניח שהטענה הוכחה לכל זוג \( \sigma_{1},\sigma_{2} \) של שמות שהם מדרגה נמוכה מ-\( \alpha \) (כלומר, כל שם שמופיע ב-\( \tau_{1} \) או \( \tau_{2} \)). תחת ההנחה הזו, אני הולך להוכיח טענת עזר שהיא הדבר המרכזי שנזדקק לו כאן, ומן הסתם תתבסס על הטענות שהוכחנו בחלק של “החימום”. אני אגדיר קבוצה \( A\subseteq P \) באופן הבא: \( q_{1}\in A \) אם לכל \( \sigma_{1} \) כך ש-\( \left(\sigma_{1},q_{1}\right)\in\tau_{1} \) קיים \( \left(\sigma_{2},\tau_{2}\right)\in\tau_{2} \) כך ש-\( q_{1}\subseteq q_{2} \) ו-\( q_{2} \) כופה את \( \sigma_{1}=\sigma_{2} \). עכשיו אני טוען ש-\( A \) מקיימת את שתי התכונות הבאות, לכל אידאל גנרי \( G \):

אם \( \tau_{1}^{G}\subseteq\tau_{2}^{G} \) אז \( G\subseteq A \).
אם יש \( p\in G \) שכל הרחבה שלו שייכת ל-\( A \), אז \( \tau_{1}^{G}\subseteq\tau_{2}^{G} \).

במקום להוכיח את שתי התכונות הללו מייד, בואו נראה איך הן משמשות אותנו להוכחת המשפט המרכזי, כי בלי זה לא ברור למה הן כאן בכלל ובשביל מה כל זה טוב.

ראשית בואו נטפל בהוכחה של טענה 1. כבר אמרנו שכיוון אחד טריוויאלי: אם קיים \( p\in G \) שכופה את \( \tau_{1}=\tau_{2} \) אז בוודאי ש-\( G \) מקיים \( \tau_{1}^{G}=\tau_{2}^{G} \) (וזה מתקיים לכל אידאל שיכיל את \( p \) הזה, לא רק \( G \)). אז מה שמעניין אותנו הוא הכיוון השני, זה שבשבילו הכנסנו לתמונה את ההגדרה של \( \mathcal{F}_{\alpha} \) מלכתחילה: איך אני הולך למצוא את ה-\( p \) הכופה הקסום הזה, רק מתוך הידיעה ש-\( \tau_{1}^{G}=\tau_{2}^{G} \)?

ובכן, טענת העזר נחלצת לעזרתנו: \( \tau_{1}^{G}=\tau_{2}^{G} \) בפרט אומר \( \tau_{1}^{G}\subseteq\tau_{2}^{G} \), ולכן ש-\( G\subseteq A \). עכשיו הנה עניין טיפה טריקי שאנפנף בו בידיים: אני טוען ש-\( A\in\mathcal{M} \) (השייכות הזו ל-\( \mathcal{M} \) הייתה קריטית בטענות העזר). למה? כי אפשר להגדיר את \( A \) באמצעות הנוסחה

\( A=\left\{ q_{1}\in P:\forall\sigma_{1}\left(\sigma_{1},q_{1}\right)\in\tau_{1}\to\exists\left(\sigma_{2},q_{2}\right)\in\tau_{2}\left(q_{1}\subseteq q_{2}\wedge q_{2}\Vdash\sigma_{1}=\sigma_{2}\right)\right\} \)

כלומר, אני יכול לקבל את \( A \) בעזרת אקסיומת ההפרדה, בתנאי שאפשר לנסח את כל התנאי המסובך של הקבוצה במסגרת \( \mathcal{M} \). מה שלא ברור שאפשר לנסח הוא \( q_{2}\Vdash\sigma_{1}=\sigma_{2} \), התנאי שאומר “\( q_{2} \) כופה את \( \sigma_{1}=\sigma_{2} \)”, אבל כאן נחלצת לעזרתי הנחת האינדוקציה שאומרת שזה קורה אם ורק אם \( \left(q_{2},\sigma_{1},\sigma_{2}\right)\in\mathcal{F}_{\beta} \) עבור \( \beta<\alpha \) כלשהו, ואת זה אפשר להגדיר במסגרת \( \mathcal{M} \).

עכשיו, מכיוון ש-\( G\subseteq A\in\mathcal{M} \) אז מהטענה שראינו קודם קיים \( p\in G \) כך שכל הרחבה של \( p \) שייכת ל-\( A \). עכשיו מגיע החלק הקסום. כזכור, אני מבטיח שאוכיח את הטענה הבאה על \( A \):

אם יש \( p\in G \) שכל הרחבה שלו שייכת ל-\( A \), אז \( \tau_{1}^{G}\subseteq\tau_{2}^{G} \).

העניין הוא שהטענה הזו נכונה לכל אידאל גנרי \( G \) שמכיל את \( G \), לא רק לאידאל שהתחלנו ממנו את הכיוון הזה של ההוכחה. זו בדיוק הקפיצה שמאפשרת לנו לעבור מ-“מתקיים \( \tau_{1}^{G}=\tau_{2}^{G} \)” אל “יש איבר שכופה את \( \tau_{1}=\tau_{2} \)”. פורמלית, ניקח \( G^{\prime} \) כלשהו כך ש-\( p\in G^{\prime} \), אז מכיוון שכל הרחבה של \( p \) שייכת ל-\( A \), קיבלנו ש-\( \tau_{1}^{G^{\prime}}\subseteq\tau_{2}^{G^{\prime}} \). המסקנה? \( p \) כופה את \( \tau_{1}\subseteq\tau_{2} \) שזה… לא בדיוק מה שרצינו, אבל זה קרוב מאוד.

בואו נחדד את מה שהוכחנו: ראינו שאם \( \tau_{1}^{G}=\tau_{2}^{G} \) אז קיים \( p_{1}\in G \) שכופה את \( \tau_{1}\subseteq\tau_{2} \). באופן סימטרי לגמרי קיים \( p_{2}\in G \) שכופה את \( \tau_{2}\subseteq\tau_{1} \) (ומוכיחים את זה דרך קבוצה \( A \) שונה, “של \( p_{2} \)”). מכיוון ש-\( G \) הוא אידאל, קיים \( p\in G \) כך ש-\( p_{1},p_{2}\subseteq p \). כל הרחבה של \( p \) הזה היא גם הרחבה של \( p_{1} \) ולכן שייכת ל-\( A \) של \( p_{1} \). לכן גם \( p \) כופה את \( \tau_{1}\subseteq\tau_{2} \), ובאותו אופן הוא גם כופה את \( \tau_{2}\subseteq\tau_{1} \) ומשני אלו קיבלנו שהוא כופה את \( \tau_{1}=\tau_{2} \), וזה בדיוק מה שרצינו!

אבל לא סיימנו את ההוכחה עדיין, כי צריך להוכיח גם את חלק 2 של המשפט:

איבר \( p\in P \) כופה את \( \tau_{1}=\tau_{2} \) אם ורק אם \( \left(p,\tau_{1},\tau_{2}\right)\in\mathcal{F}_{\alpha} \)

החלק הזה היה קריטי עבורנו קודם, בשלב שבו רצינו להוכיח ש-\( A\in\mathcal{M} \). באותו אופן, ההוכחה של החלק הזה תסתמך אינדוקטיבית על מה שזה עתה הוכחנו:

אידאל גנרי \( G \) של \( P \) מקיים \( \tau_{1}^{G}=\tau_{2}^{G} \) אם ורק אם קיים \( p\in G \) שכופה את \( \tau_{1}=\tau_{2} \).

בואו נראה איך. כאן יש לנו שני כיוונים שאף אחד מהם לא טריוויאלי לגמרי. ראשית נניח ש-\( p \) כופה את \( \tau_{1}=\tau_{2} \) ונוכיח ש-\( \left(p,\tau_{1},\tau_{2}\right)\in\mathcal{F}_{\alpha} \). כזכור, שייכות ליחס הזה דורשת שתי טענות סימטריות כך שמספיק לי להוכיח את הראשונה, שהיא

לכל \( \left(\sigma_{1},q_{1}\right)\in\tau_{1} \) כך ש-\( p\subseteq q_{1} \), קיים \( \left(\sigma_{2},q_{2}\right)\in\tau_{2} \) כך ש-\( q_{1}\subseteq q_{2} \) ו-\( \left(q_{2},\sigma_{1},\sigma_{2}\right)\in\mathcal{F}_{\text{rank}\left(\sigma_{1},\sigma_{2}\right)} \)

התנאי הזה דומה באופן מובהק ולא מקרי בעליל להגדרה של \( A \):

\( q_{1}\in A \) אם לכל \( \sigma_{1} \) כך ש-\( \left(\sigma_{1},q_{1}\right)\in\tau_{1} \) קיים \( \left(\sigma_{2},\tau_{2}\right)\in\tau_{2} \) כך ש-\( q_{1}\subseteq q_{2} \) ו-\( q_{2} \) כופה את \( \sigma_{1}=\sigma_{2} \).

ליתר דיוק, התנאי של שייכות ל-\( \mathcal{F}_{\alpha} \) בעצם אומר “לכל הרחבה \( q_{1} \) של \( p \), מתקיים ש-\( q_{1}\in A \)” (אני משתמש כאן בהנחת האינדוקציה במובלע כשאני מתייחס אל \( \left(q_{2},\sigma_{1},\sigma_{2}\right)\in\mathcal{F}_{\text{rank}\left(\sigma_{1},\sigma_{2}\right)} \) בתור “\( q_{2} \) כופה את \( \sigma_{1}=\sigma_{2} \)”). זה מה שאנחנו רוצים להוכיח. לשם כך אני אגייס את אחת מהתכונות של \( A \) שהבטחתי להוכיח וטרם עשיתי זאת:

אם \( \tau_{1}^{G}\subseteq\tau_{2}^{G} \) אז \( G\subseteq A \).

המהלך הלוגי הוא כזה: ניקח הרחבה \( q_{1} \) כלשהי של \( p \). אם \( G \) הוא אידאל גנרי כך ש-\( q_{1}\in G \) אז בגלל תכונת הסגירות מטה של אידאלים, \( p\in G \). מכיוון ש-\( p \) כופה את \( \tau_{1}=\tau_{2} \) הרי ש-\( \tau_{1}^{G}\subseteq\tau_{2}^{G} \) ולכן \( q_{1}\in G\subseteq A \) וקיבלנו ש-\( q_{1}\in A \), מה שמסיים את הכיוון הזה… אבל רק אם קיים אידאל גנרי \( G \) כך ש-\( q_{1}\in G \). הענין הוא שבאמת קיים, הוכחנו את זה בשעתו, כשהוכחתי קיום של אידאל גנרי; ההוכחה הייתה “בואו נראה שלכל תנאי כפיה \( p\in P \) קיים אידאל גנרי שמכיל אותו”, והנה זה מסייע לנו עכשיו.

נשאר הכיוון השני, שבו אני מניח ש-\( \left(p,\tau_{1},\tau_{2}\right)\in\mathcal{F}_{\alpha} \) ומוכיח ש-\( p \) כופה את \( \tau_{1}=\tau_{2} \). את זה נעשה ישירות מההגדרה: ניקח אידאל גנרי \( G \) כך ש-\( p\in G \) ונוכיח \( \tau_{1}^{G}=\tau_{2}^{G} \). את זה נקבל מטענת העזר שטרם הוכחנו

אם יש \( p\in G \) שכל הרחבה שלו שייכת ל-\( A \), אז \( \tau_{1}^{G}\subseteq\tau_{2}^{G} \).

ותנאי ה”כל הרחבה שלו שייכת ל-\( A \)” זה בדיוק מה שראינו קודם - האופן שבו התנאי שמגדיר את \( \mathcal{F}_{\alpha} \) אומר “לכל הרחבה \( q_{1} \) של \( p \), מתקיים ש-\( q_{1}\in A \)”. לכן \( \tau_{1}^{G}\subseteq\tau_{2}^{G} \) ובאותו אופן גם \( \tau_{2}^{G}\subseteq\tau_{1}^{G} \) וקיבלנו את \( \tau_{1}^{G}=\tau_{2}^{G} \) כפי שרצינו. זה משלים את המשפט, למעט טענות העזר.

טענות העזר

כמעט סיימנו! רק נותרו לנו טענות העזר שהתבססנו עליהן שוב ושוב. שתיהן כזכור נגעו לקבוצה \( A \) כלשהי. אז הנה התזכורת:

הגדרת \( A \): \( q_{1}\in A \) אם לכל \( \sigma_{1} \) כך ש-\( \left(\sigma_{1},q_{1}\right)\in\tau_{1} \) קיים \( \left(\sigma_{2},\tau_{2}\right)\in\tau_{2} \) כך ש-\( q_{1}\subseteq q_{2} \) ו-\( q_{2} \) כופה את \( \sigma_{1}=\sigma_{2} \).
טענה 1: אם \( \tau_{1}^{G}\subseteq\tau_{2}^{G} \) אז \( G\subseteq A \).
טענה 2: אם יש \( p\in G \) שכל הרחבה שלו שייכת ל-\( A \), אז \( \tau_{1}^{G}\subseteq\tau_{2}^{G} \).

נתחיל מטענה 1. נניח ש-\( \tau_{1}^{G}\subseteq\tau_{2}^{G} \) וניקח \( q_{1}\in G \) כלשהו. אנחנו רוצים להראות ש-\( q_{1}\in A \). אז יהא \( \sigma_{1} \) כלשהו כך שמתקיים \( \left(\sigma_{1},q_{1}\right)\in\tau_{1} \): המטרה שלנו היא למצוא \( \left(\sigma_{2},\tau_{2}\right)\in\tau_{2} \) כך ש-\( q_{2} \) שמרחיב את \( q_{1} \) וכופה את \( \sigma_{1}=\sigma_{2} \).

מכיוון ש-\( \left(\sigma_{1},q_{1}\right)\in\tau_{1} \) אז \( \sigma_{1}^{G}\in\tau_{1}^{G} \) (זוכרים? האיברים של \( \tau_{1}^{G} \) הם בדיוק שמות ה-\( P \) שעוברים את הפילטר של \( G \) ואז אנחנו רקורסיבית מחשבים את הערך ש-\( G \) נותן להם) ולכן \( \sigma_{1}^{G}\in\tau_{2}^{G} \). זה אומר שבין שמות ה-\( P \) שמרכיבים את \( \tau_{2} \) חייב להיות אחד שהערך ש-\( G \) נותן לו הוא \( \sigma_{1}^{G} \); במילים אחרות, יש \( \left(\sigma_{2},q_{2}\right)\in\tau_{2} \) כך ש-\( q_{2}\in G \) וגם \( \sigma_{2}^{G}=\sigma_{1}^{G} \).

עכשיו, מכיוון ש-\( q_{1},q_{2}\in G \) יש להם הרחבה משותפת \( q \), וכזכור (?) דרישה שלנו משמות-\( P \) הייתה שאם \( \left(\sigma_{2},q_{2}\right)\in\tau_{2} \) ו-\( q \) מרחיב את \( q_{2} \) אז גם \( \left(\sigma_{2},q\right)\in\tau_{2} \). זה מאפשר לנו להניח בלי הגבלת הכלליות ש-\( q_{1}\subseteq q_{2} \) (אחרת נחליף את \( q_{2} \) בהרחבה משותפת שלו ושל \( q_{1} \)).

צריך לזכור שאנחנו עדיין בהקשר של הוכחת המשפט המרכזי באינדוקציה. מה שאומר שאפשר להיעזר בהנחת האינדוקציה:

אידאל גנרי \( G \) של \( P \) מקיים \( \sigma_{1}^{G}=\sigma_{2}^{G} \) אם ורק אם קיים \( p\in G \) שכופה את \( \sigma_{1}=\sigma_{2} \).

כאשר הנחת האינדוקציה הזו מופעלת לא על \( \tau_{1},\tau_{2} \) (האובייקטים עליהם אנחנו מנסים עכשיו להוכיח משהו) אלא על מי שבאים לפניהם בהיררכייה, כלומר שייכים אליהם, כלומר בפרט \( \sigma_{1},\sigma_{2} \); לכן ניסחתי את ההנחה באמצעותם.

מה מצאנו? ראינו כבר ש-\( \sigma_{2}^{G}=\sigma_{1}^{G} \) ולכן קיים \( p\in G \) שכופה את \( \sigma_{1}=\sigma_{2} \). אנחנו יכולים לקחת הרחבה משותפת של \( p \) ושל \( q_{2} \) וגם ההרחבה המשותפת הזו תכפה את \( \sigma_{1}=\sigma_{2} \) מנימוק שכבר ראינו קודם: כל אידאל שמכיל את ההרחבה המשותפת הזו יכיל גם את \( p \) עצמו, ולכן \( p \) יכפה את השוויון באותו אידאל. זה מסיים את ההוכחה של טענה 1.

נשארה רק טענה 2: ניקח \( p\in G \) שכל הרחבה שלו שייכת ל-\( A \), ונראה ש-\( \tau_{1}^{G}\subseteq\tau_{2}^{G} \). בשביל להראות את ההכלה, ניקח איבר כלשהו ב-\( \tau_{1}^{G} \); הצורה שלו היא \( \sigma_{1}^{G} \) כאשר \( \left(\sigma_{1},q_{1}\right)\in\tau_{1} \) עבור \( q_{1} \) כלשהו. אפשר להניח ש-\( p\subseteq q_{1} \) אחרת נחליף את \( q_{1} \) בהרחבה המשותפת שלו ושל \( p \). בסיטואציה הזו, כל הרחבה \( q_{1}^{\prime} \) של \( q_{1} \) שייכת ל-\( A \). עכשיו, בואו נסמן ב-\( D \) את קבוצת כל ה-\( q_{2} \)-ים שכופים את \( \sigma_{1}=\sigma_{2} \) עבור \( \sigma_{2} \) כלשהו שמקיים \( \left(\sigma_{2},q_{2}\right)\in\tau_{2} \). פורמלית

\( D=\left\{ q_{2}\in P\ |\ \exists\left(\sigma_{2},q_{2}\right)\in\tau_{2}:q_{2}\Vdash\sigma_{1}=\sigma_{2}\right\} \)

כמו קודם, ההגדרה הזו מראה ש-\( D\in\mathcal{M} \) כי אפשר לנסח אותה במסגרת \( \mathcal{M} \) באמצעות אקסיומת ההפרדה, תוך שימוש בהנחת האינדוקציה שמאפשרת לנו לנסח את \( q_{2}\Vdash\sigma_{1}=\sigma_{2} \) בלשון של שייכות ל-\( \mathcal{F}_{\beta} \).

עכשיו, על פי ההגדרה של \( A \) והעובדה שכל הרחבה של \( q_{1} \) שייכת ל-\( A \), קיבלנו שלכל הרחבה של \( q_{1} \) קיימת הרחבה ב-\( D \). זה מתקשר להגדרה שהצגתי קודם:

אני אומר על קבוצה \( D\in\mathcal{M} \) שהיא צפופה מעל \( p \) כלשהו אם לכל הרחבה של \( p \) קיימת הרחבה ב-\( D \)

כלומר \( D \) צפופה מעל \( q_{1} \), בהינתן שאוכיח ש-\( D\in\mathcal{M} \). זה טוב לנו כי קודם הראיתי את טענת העזר

אם \( G \) הוא אידאל גנרי ו-\( D \) צפופה מעל \( p\in G \) כלשהו, אז \( G\cap D\ne\emptyset \)

מה שמסיים את ההוכחה כי אז ה-\( p\in G\cap D \) הזה כופה את \( \sigma_{1}^{G}=\sigma_{2}^{G} \). זה אומר שלקחנו איבר כללי \( \sigma_{1}^{G}\in\tau_{1}^{G} \) והראינו שהוא שייך ל-\( \tau_{2}^{G} \), מה שמוכיח את \( \tau_{1}^{G}\subseteq\tau_{2}^{G} \) המבוקש. זה מסיים את כל מה שנשאר לנו מההוכחה!

סיכום ביניים לפני שממשיכים הלאה

מה הלך בפוסט הזה? אפשר לסכם אותו בשלוש נקודות עיקריות:

ראינו את מושג הכפייה: \( p\Vdash\phi\left(\tau_{1},\ldots,\tau_{n}\right) \) (\( p \) כופה את \( \phi\left(\tau_{1},\ldots,\tau_{n}\right) \)) אם לכל אידאל גנרי \( G \) כך ש-\( p\in G \), מתקיים ש-\( \mathcal{M}\left[G\right]\models\phi\left(\tau_{1}^{G},\ldots,\tau_{n}^{G}\right) \)
ראינו את המשפט היסודי של תורת הכפייה: לכל אידאל גנרי \( G \), נוסחה \( \phi\left(x_{1},\ldots,x_{n}\right) \) ושמות-\( P \) \( \tau_{1},\ldots,\tau_{n} \), מתקיים ש-\( \mathcal{M}\left[G\right]\models\phi\left(\tau_{1}^{G},\ldots,\tau_{n}^{G}\right) \) אם ורק אם קיים \( p\in G \) כך ש-\( p \) כופה את \( \phi\left(\tau_{1},\ldots,\tau_{n}\right) \).
הוכחנו את המשפט היסודי למקרה הפרטי של הנוסחה \( \phi\left(x_{1},x_{2}\right) \) שמתארת שוויון, \( x_{1}=x_{2} \).

ההוכחה של המקרה הפרטי הייתה ארוכה, מסובכת ועם שלל טענות עזר ושימושים בהגדרות שראינו עד כה - כל מה שעשינו עד עכשיו התרכז לנקודה הזו, בעצם. למרות שאין פה משהו קשה באמת קל מאוד ללכת לאיבוד בפרטים; עבורי כתיבת הפוסט הזה הייתה הפעם הראשונה שבה הצלחתי (אני מקווה…) לעקוב לגמרי אחרי כל המעברים, אז ממש לא קריטי אם הולכים לאיבוד.

מה נשאר לנו?

להוכיח את המשפט למקרה הכללי: זה יהיה יותר קל מאשר מה שקרה עד כה, אינטואיטיבית בגלל שכאן "התחלנו מאפס" ובהמשך נוכל להסתמך על מה שהוכחנו כאן.
להראות איך המשפט מוכיח לנו שההרחבה הגנרית \( \mathcal{M}\left[G\right] \) (זוכרים שהיה פעם משהו כזה?) מקיימת את כל אקסיומות ZFC.
להשתמש בתוצאות הללו כדי להראות איך בונים \( \mathcal{M}\left[G\right] \) אחד שבו השערת הרצף מתקיימת ו-\( \mathcal{M}\left[G\right] \) אחר שבו השערת הרצף לא מתקיימת.

כל אלו עדיין ידרשו עבודה, אבל עבודה פחות טכנית ועם יותר הבנה של התמונה הגדולה. אז קדימה לדרך!

נהניתם? התעניינתם? אם תרצו, אתם מוזמנים לתת טיפ: