משפטי נקודת השבת של בנך וברואר

מבוא

בואו נתחיל עם סיפור קצרצר בן פסקה אחת של חורחה לואיס בורחס בשם “על הדיוק במדע” שאני מביא פה בתרגום יורם ברונובסקי:

...באימפריה זו הגיעה אמנות כתיבת המפות למידת שלמות כזו, שמפתו של מחוז אחד השתרעה על פני עיר שלמה ואילו מפתה של האימפריה כולה - על פני המחוז כולו. ברבות הימים לא סיפקו עוד מפות ענק אלה את התשובות וועדות כותבי המפות החלו להכין את מפת האימפריה שגודלה כגודל האימפריה עצמה, והיא זהה עמה בכל נקודה ונקודה. הדורות הבאים היו אדוקים פחות במדע כתיבת המפות, הם גרסו שמפה נרחבת זו היא מיותרת והפקידו אותה לאכזריות השמש והחורף. במדבריות המערב שרדו כמה חורבות של המפה, שם שוכנים חיות בר וקבצנים, בארץ כולה לא היו שרידים נוספים של מדע כתיבת הארץ. (מתוך "מסעות אנשי החיל" לסוארס מיראנדה, ספר רביעי, פרק מ"ה, לרידה, 1658.)

לא, אל תחפשו את “מסעות אנשי החיל” לסוארס מיראנדה, הוא קיים בערך כמו ספר מפורסם אחר של אחד, ס. מורגנשטרן.

איך כל זה קשור למתמטיקה? ובכן, על משמעות כלליות מהסיפור אפשר לדבר בפעם אחרת, הפעם הבאתי אותו כי המוטיבציה שלי לכתיבת הפוסט היא דבר אחר, דומה, שגם כן מערב מפות: ההבחנה שאם ניקח מפה של ארץ כלשהי (לא בהכרח 1:1 כמו המפה של בורחס) ונניח אותה על הקרקע של הארץ שמתוארת בה, אז תהיה נקודה על המפה שנמצאת בדיוק מעל הנקודה על הקרקע הפיזית שהנקודה הזו במפה מתארת. תמיד. וגם אם נזיז קצת את המפה - עדיין תהיה. וכן, גם אם ננסה בכוונה להניח את המפה על הקרקע כך שזה לא יקרה, זה יקרה. וגם אם נסובב את המפה - זה יקרה. ומה שנחמד פה כל כך הוא שהתוצאה הזו היא המחשה יפה של משפט נקודת השבת של בנך; והמשפט הזה גם מצביע על הדרך שבה אפשר למצוא את הנקודה שבה זה קורה.

משפט נקודת השבת של בנך הוא הדבר העיקרי שאני רוצה להראות בפוסט הזה, ברמת הניסוח המלא וההוכחה. על הדרך אני גם אנצל את ההזדמנות ואסביר כמעט כל מושג שבו אני משתמש, כי המשפט הזה הוא הזדמנות טובה עבורנו לחזור על מושגי הבסיס הללו.

אפשר לחשוב על משפט נקודת השבת של בנך בתור “כמעט מקרה פרטי” של משפט מפורסם עוד יותר, משפט נקודת השבת של ברואר (למה רק “כמעט”? אדבר על ההבדלים המדויקים בהמשך). גם למשפט של ברואר יש אילוסטרציות נחמדות: נניח שאתם מערבבים כוס משקה, אז מובטח שתהיה נקודה אחת בכוס שאחרי כל הערבובים חזרה למקום שבו התחילה. או אילוסטרציה אחרת: קחו שני דפים מאותו הגודל, שימו אחד על השני, ואז קמטו את הדף שלמעלה כמה שתרצו - עדיין תהיה נקודה אחת לפחות בדף המקומט שנמצאת בדיוק מעל הנקודה שמתאימה לה בדף שמתחת. על המשפט של ברואר אני אגניב כמה מילים בסוף אבל לא אוכיח אותו הפעם, כי זו לא הוכחה כמעט-מיידית כמו של בנך.

משפט נקודת השבת של בנך

מה הרעיון במפה? מפה היא עותק מוקטן של פני השטח במציאות (אלא אם אנחנו בסיפור של בורחס). אם תרצו, אנחנו מכווצים את המרחב שלנו אל תת-מרחב ספציפי, במובן זה שהמרחק בין נקודות הופך לקטן יותר. משפט נקודת השבת של בנך עוסק בדיוק בסיטואציה הזו - העתקה ממרחב לעצמו שהיא מכווצת. זה דורש ממני להגדיר מה הכוונה ב”מרחב” ואיך אני מודד “מרחק” וכדומה, ויש לי תשובות שונות ומשונות לזה בהתאם להיכרות שיש לכם עם מתמטיקה. נתחיל עם הדוגמא הפשוטה: המרחב שלנו הוא פשוט המישור, \( X=\mathbb{R}^{2} \), אוסף הנקודות מהצורה \( \left(a,b\right) \) כאשר \( a,b\in\mathbb{R} \). האופן שבו מודדים מרחק בין שתי נקודות במישור הוא על ידי הנוסחה \( d\left(\left(a_{1},a_{2}\right),\left(b_{1},b_{2}\right)\right)=\sqrt{\left(a_{1}-b_{1}\right)^{2}+\left(a_{2}-b_{2}\right)^{2}} \) (זה בעצם משפט פיתגורס בפעולה).

זה נותן לנו מרחב קונקרטי להתייחס אליו, אבל למה לעצור שם? האם המשפט לא יעבוד גם עבור תת-קבוצה של המרחב הזה, נאמר ריבוע היחידה \( X=\left[0,1\right]\times\left[0,1\right] \)? והאם הוא לא יעבוד עבור \( X=\mathbb{R}^{3} \)? ומה אם אנחנו מודדים מרחק בדרך קצת שונה, למשל \( d\left(\left(a_{1},a_{2}\right),\left(b_{1},b_{2}\right)\right)=\left|a_{1}-b_{1}\right|+\left|a_{2}-b_{2}\right| \)? המשפט ימשיך לעבוד בכל המקרים הללו, ולכן כדי לדבר על כולן בבת אחת אנחנו מדברים על מושג שנקרא מרחב מטרי. מרחב מטרי \( \left(X,d\right) \) כולל קבוצה \( X \) ופונקציית מרחק \( d:X^{2}\to\mathbb{R}^{\ge0} \) כך שלכל \( a,b,c\in X \):

\( d\left(a,b\right)=0 \) אם ורק אם \( a=b \)
\( d\left(a,b\right)=d\left(b,a\right) \) (סימטריה)
\( d\left(a,b\right)\le d\left(a,c\right)+d\left(c,b\right) \) (אי-שוויון המשולש)

ההגדרה הפשוטה הזו מאפשרת דיבור אחיד על כל המקרים שציינתי קודם ואינספור מקרים אחרים, וזה ההקשר שבו נכון לתאר את משפט נקודת השבת של בנך; אבל למי שמתקשים עם הדיבור האבסטרקטי על מרחבים מטריים, אפשר לחשוב כל הזמן על המקרה הקונקרטי \( X=\mathbb{R}^{2} \) ו-\( d\left(\left(a_{1},a_{2}\right),\left(b_{1},b_{2}\right)\right)=\sqrt{\left(a_{1}-b_{1}\right)^{2}+\left(a_{2}-b_{2}\right)^{2}} \) שהזכרתי קודם. עובד באותה מידה.

דרישה אחת מהמרחב כדי שהמשפט יעבוד היא שהוא יהיה שלם. מרחב מטרי שלם הוא מרחב שבו כל סדרת קושי מתכנסת, אבל אם זה לא אומר לכם שום דבר כרגע זה לא צריך לעצור אתכם - בהמשך נבין בדיוק מה זו סדרת קושי ולמה היא מעניינת אותנו. \( \mathbb{R}^{2} \) הוא מרחב שלם, כך שהמשפט יהיה תקף לגביו. דוגמא למרחב לא שלם היא \( \mathbb{Q} \) - שם המחסור בנקודות כמו \( \sqrt{2} \) ו-\( \pi \) יוצר בעיה של ממש (אפשר לקבל משהו בסגנון “נקודת השבת צריכה להיות \( \sqrt{2} \) אבל היי, רגע, מה הולך פה, לאן היא נעלמה?”)

עכשיו צריך להכניס לתמונה פונקציה, \( f:X\to X \). אם רוצים לקשר את זה לדוגמת המפה שאיתה פתחתי, אפשר לחשוב על פונקציה שפועלת כך: בהינתן נקודה בארץ שהמפה מתארת (הארץ הזו היא \( X \)), הפונקציה מאתרת את הנקודה המתאימה על המפה, הולכת אל הנקודה הזו ומחזירה את הנקודה על הקרקע של הארץ “האמיתית” שנוגעת בנקודה הזו במפה. באופן הזה קיבלנו פונקציה מ-\( X \) אל \( X \) (ולא מ-\( X \) אל “מפה שמתארת את \( X \)”).

עכשיו, פונקציה היא מכווצת אם היא מקטינה את המרחק בין נקודות, אבל לא סתם ברמה “כלשהי” אלא ברמה שנותנת חסם כפלי כלשהו - “מקטינה פי 2” או “מקטינה פי שבע שמיניות” וכן הלאה. פורמלית צריך להיות קיים קבוע \( 0<q<1 \) כך שלכל \( a,b\in X \) מתקיים \( d\left(f\left(a\right),f\left(b\right)\right)\le q\cdot d\left(a,b\right) \) (באופן כללי פונקציה שבה המרחק בין פלטים של הפונקציה חסום על ידי קבוע כלשהו כפול המרחק בין הקלטים נקראת ליפשיצית, וכאשר הקבוע הזה קטן מאחד אז היא נקראת “מכווצת”). ומה היה קורה אם לא היה קבוע כזה אלא “סתם” היה מתקיים \( d\left(f\left(a\right),f\left(b\right)\right)\le d\left(a,b\right) \) לכל \( a,b\in X \)? ובכן, לא רק שההוכחה שתכף אציג לא הייתה עובדת, גם המשפט כלל לא היה נכון.

אבל מה המשפט בעצם? עוד לא ניסחתי אותו! ובכן, אם \( f \) היא פונקציה מכווצת שכזו ממרחב מטרי שלם לעצמו, אז קיימת נקודה יחידה \( a^{*}\in X \) כך ש-\( f\left(a^{*}\right)=a^{*} \). הפתעה! (טוב, אולי העובדה שהנקודה הזו יחידה היא מפתיעה) אבל יותר מכך, אפשר תמיד למצוא אותה באופן הבא: ניקח נקודה \( a_{0}\in X \) באופן שרירותי לחלוטין (לא משנה מאיפה נתחיל) ונגדיר סדרה \( a_{n+1}=f\left(a_{n}\right) \), אז מובטח לנו שיתקיים \( \lim_{n\to\infty}a_{n}=a^{*} \) (פורמלית: לכל \( \varepsilon>0 \) ממשי קיים \( N \) טבעי כך שאם \( n>N \) אז \( d\left(a_{n},a^{*}\right)<\varepsilon \)). כפי שנראה, אפשר יהיה גם להגיד משהו על קצב ההתכנסות של הסדרה הזו אל \( a^{*} \).

עיקר ההוכחה של המשפט היא חישוב טכני לא נוראי במיוחד של המרחק בין שתי נקודות כלשהן בסדרה שכזו. כלומר, נניח ש-\( n<m \) ונחשב חסם עבור \( d\left(a_{n},a_{m}\right) \). הרעיון פה הוא שעבור שתי נקודות שבאות זו אחר זו בסדרה קל לנו לתת חסם מפורש, ואז אפשר להעריך את המרחק בין \( a_{n} \) ו-\( a_{m} \) על ידי שימוש באי-שוויון המשולש כדי לחסום את המרחק ביניהן על ידי נקודות ביניים שהן כל האיברים מ-\( a_{n} \) עד \( a_{m} \).

נתחיל עם דוגמאות פשוטות: את המרחק \( d\left(a_{0},a_{1}\right) \) אין לנו איך לחסום; זו “נקודת המוצא” שלנו. ככל ש-\( a_{0} \) יותר קרוב ל-\( a_{1} \) (כלומר, ככל ש-\( a_{0} \) יותר קרוב אל \( f\left(a_{0}\right) \)) כך החסם על ההתכנסות של הסדרה יהיה טוב יותר.

את המרחק \( d\left(a_{1},a_{2}\right) \) לעומת זאת אפשר לחסום: \( a_{1}=f\left(a_{0}\right) \) ואילו \( a_{2}=f\left(a_{1}\right) \) ולכן

\( d\left(a_{1},a_{2}\right)=d\left(f\left(a_{0}\right),f\left(a_{1}\right)\right)\le qd\left(a_{0},a_{1}\right) \)

באופן דומה:

\( d\left(a_{2},a_{3}\right)=d\left(f\left(a_{1}\right),f\left(a_{2}\right)\right)\le qd\left(a_{1},a_{2}\right)\le q^{2}d\left(a_{0},a_{1}\right) \)

וכבר אפשר להמשיך עם זה באינדוקציה ולקבל את הטענה הכללית שנכונה לכל \( k\ge0 \):

\( d\left(a_{k},a_{k+1}\right)\le q^{k}d\left(a_{0},a_{1}\right) \)

חמושים בידע הנוסף הזה אפשר להעריך את \( d\left(a_{n},a_{m}\right) \) גם עבור נקודות לא סמוכות. הרעיון הוא להסתכל על כל סדרת הנקודות \( a_{n},a_{n+1},a_{n+2},\dots,a_{m-1},a_{m} \) (הנחנו ש-\( n<m \)) - מאי-שוויון המשולש אנו יודעים שמתקיים

\( d\left(a_{n},a_{m}\right)\le d\left(a_{n},a_{n+1}\right)+\dots+d\left(a_{m-1},a_{m}\right) \)

אפשר לכתוב את אותו הדבר בקיצור כך:

\( d\left(a_{n},a_{m}\right)\le\sum_{i=0}^{m-n-1}d\left(a_{n+i},a_{n+i+1}\right) \)

וכעת, ממה שמצאנו קודם אנו יודעים ש-\( d\left(a_{n+i},a_{n+i+1}\right)\le q^{n+i}d\left(a_{0},a_{1}\right) \) ולכן נקבל

\( d\left(a_{n},a_{m}\right)\le\sum_{i=0}^{m-n-1}q^{n+i}d\left(a_{0},a_{1}\right)=q^{n}d\left(a_{0},a_{1}\right)\cdot\sum_{i=0}^{m-n-1}q^{i} \)

הסכום שנשאר לנו הוא טור הנדסי רגיל. אני תמיד אוהב להזכיר איך אנחנו יודעים מה הסכום של טור הנדסי: אם אני צריך לחשב את \( 1+q+q^{2}+\dots+q^{n} \) אני כופל ב-\( \left(q-1\right) \) ומקבל הרבה איברים שמצטמצמים ובסוף נשאר \( q^{n+1}-1 \). נחלק ב-\( q-1 \) שבו כפלתי, ונקבל שסכום הטור הוא \( \frac{q^{n+1}-1}{q-1} \). לכן במקרה שלנו:

\( \sum_{i=0}^{m-n-1}q^{i}=\frac{q^{m-n}-1}{q-1} \)

אפשר לפשט את זה טיפה עבורנו - \( \sum_{i=0}^{m-n-1}q^{i}<\sum_{i=0}^{\infty}q^{i}=\frac{1}{1-q} \) (תחשבו שאני מציב 0 במקום \( q^{m-n} \)), ולכן נקבל

\( d\left(a_{n},a_{m}\right)\le\frac{d\left(a_{0},a_{1}\right)}{1-q}\cdot q^{n} \)

וזו כבר תוצאה מצויינת. תזכרו ש-\( 0<q<1 \), ולכן ככל ש-\( n \) גדול יותר כך \( q^{n} \) קטן יותר. לכן מה שקיבלנו הוא שהמרחק בין \( a_{n} \) לבין כל נקודה שבאה אחריה בסדרה שווה למספר הקבוע \( \frac{d\left(a_{0},a_{1}\right)}{1-q} \) כפול משהו (\( q^{n} \)) שהולך וקטן ככל שאנחנו לוקחים \( a_{n} \) גדול יותר. חישוב לא מסובך מראה שלכל \( \varepsilon>0 \) אנחנו מסוגלים למצוא \( N \) כך שאם \( n>N \) מתקיים \( \frac{d\left(a_{0},a_{1}\right)}{1-q}\cdot q^{n}<\varepsilon \). כלומר, לכל \( m>n>N \) יתקיים \( d\left(a_{n},a_{m}\right)<\varepsilon \). זה מראה שהסדרה \( \left\{ a_{n}\right\} \) היא סדרת קושי.

סדרת קושי, אינטואיטיבית, היא סדרה שככל שמתקדמים בה יותר כך המרחק בין כל שני איברים בה (לאו דווקא כאלו שסמוכים זה לזה בסדרה) הולך וקטן. פורמלית זה בדיוק מה שתיארנו: לכל \( \varepsilon \) קיים \( N \) כך שלכל \( m>n>N \) מתקיים \( d\left(a_{n},a_{m}\right)<\varepsilon \). החשיבות של התכונה הזו של “להיות סדרת קושי” היא בכך שהיא מצביעה על כך שהסדרה אמורה להתכנס לגבול קונקרטי; כלומר, “צריך” להיות \( a^{*} \) כך שלכל \( \varepsilon>0 \) קיים \( N \) כך שאם \( n>N \) אז \( d\left(a_{n},a^{*}\right)<\varepsilon \). ה”צריך” הזה לא תמיד מתקיים בפועל; במקרה של \( \mathbb{R} \) הוא מתקיים, אבל במקרה של \( \mathbb{Q} \), למשל, הוא לאו דווקא מתקיים (תסתכלו על הסדרה \( 3,3.1,3.14,3.141,\dots \) ש”אמורה להתכנס אל \( \pi \)” אבל הרי \( \pi \) אינו רציונלי למרות שאברי הסדרה כן). מרחב מטרי שבו כל סדרת קושי היא מתכנסת נקרא מרחב מטרי שלם, והנחנו ש-\( X \) הוא מרחב מטרי שלם כחלק מתנאי משפט נקודת השבת של בנך.

לסיכום, הראינו ש-\( \left\{ a_{n}\right\} \) היא סדרת קושי ולכן קיים \( a^{*}\in X \) כך ש-\( a_{n}\to a^{*} \). אבל מה זה עוזר לנו, בעצם? האם זה מוכיח ש-\( a^{*} \) היא נקודת שבת? ובכן, כן, אבל הנימוק יצריך מאיתנו לראות את היעילות של מושג בסיסי נוסף: רציפות.

הנה מה שאני רוצה להגיד: אנחנו יודעים ש-\( \lim_{n\to\infty}a_{n}=a^{*} \). עכשיו, את מהסדרה \( a_{0},a_{1},a_{2},\dots \) אפשר לסלק את האיבר הראשון, ואז לכתוב את הסדרה שנותרה בתור \( f\left(a_{0}\right),f\left(a_{1}\right),\dots \). כלומר, הסדרות \( \left\{ a_{n}\right\} \) ו-\( \left\{ f\left(a_{n}\right)\right\} \) הן אותה סדרה למעט האיבר הראשון, והאיבר הראשון לא באמת משפיע על גבול הסדרה. לכן גם \( \lim_{n\to\infty}f\left(a_{n}\right)=a^{*} \).

כעת, הייתי רוצה להגיד משהו כזה: \( \lim_{n\to\infty}f\left(a_{n}\right)=f\left(\lim_{n\to\infty}a_{n}\right) \). אם הייתי יכול לומר את זה, אז הייתי מקבל:

\( a^{*}=\lim_{n\to\infty}f\left(a_{n}\right)=f\left(\lim_{n\to\infty}a_{n}\right)=f\left(a^{*}\right) \)

מה שהיה מוכיח ש-\( a^{*} \) היא אכן נקודת שבת של \( f \). אז בואו נתמקד שוב במה שאני רוצה שיקרה:

\( \lim_{n\to\infty}f\left(a_{n}\right)=f\left(\lim_{n\to\infty}a_{n}\right) \)

במילים: הגבול של סדרת הפלטים של \( f \) על \( a_{n} \) הוא אותו דבר כמו הפלט של \( f \) על הגבול של \( a_{n} \). הפעולות של “חישוב הגבול של הסדרה” ו”הפעלת \( f \)” הן קומוטטיביות - אפשר להחליף את הסדר ביניהן ועדיין לקבל את אותה התוצאה. אם \( f \) היא פונקציה רציפה אז הדבר הזה מתקיים. מה זו פונקציה רציפה? בנפנוף ידיים כלשהו - פונקציה שעבור קלטים קרובים מספיק מחזירה פלטים שהם גם כן קרובים.

הנה הגדרה פורמלית: \( f \) רציפה בנקודה \( x_{0} \) אם לכל \( \varepsilon>0 \) קיים \( \delta>0 \) כך ש-\( d\left(x,x_{0}\right)<\delta \) (“קלטים קרובים”) גורר \( d\left(f\left(x\right),f\left(x_{0}\right)\right)<\varepsilon \) (“פלטים קרובים”). שימו לב שדיברתי פה על רציפות בנקודה מסויימת; אומרים על \( f \) שהיא רציפה בכל המרחב \( X \) אם היא רציפה לכל \( x_{0}\in X \). בהגדרה הזו, ה-\( \delta \) שמוצאים בתגובה ל-\( \varepsilon \) יכול להיות תלוי גם בנקודה \( x_{0} \); יש הגדרה חזקה יותר של רציפות שנקראת רציפות במידה שווה שבה עבור \( \varepsilon \) אפשר למצוא \( \delta \) ש”עובד לכל הנקודות ב-\( X \) בו זמנית”; לא אצטרך את ההגדרה הזו כאן.

רציפות היא תכונה חשובה עם שלל משמעויות שנובעות ממנה, אבל כאן אני אסתפק בזו שרלוונטית לנו: \( \lim_{n\to\infty}f\left(a_{n}\right)=f\left(\lim_{n\to\infty}a_{n}\right) \). כזכור, אנחנו מסמנים \( a^{*}=\lim_{n\to\infty}a_{n} \), כך שמה שאשתמש בו הוא הרציפות של \( f \) בנקודה \( a^{*} \). כדי להוכיח \( f\left(a^{*}\right)=\lim_{n\to\infty}f\left(a_{n}\right) \) אני לוקח \( \varepsilon>0 \) וצריך למצוא \( N \) כך שלכל \( n>N \) מתקיים \( d\left(f\left(a^{*}\right),f\left(a_{n}\right)\right)<\varepsilon \). ובכן, מכיוון ש-\( f \) רציפה, קיים \( \delta>0 \) כך שאם \( d\left(a^{*},a_{n}\right)<\delta \) אז \( d\left(f\left(a^{*}\right),f\left(a_{n}\right)\right)<\varepsilon \). כעת, מכיוון ש-\( a^{*}=\lim_{n\to\infty}a_{n} \) אז קיים \( N \) כך שאם \( n>N \) אז מתקיים \( d\left(a^{*},a_{n}\right)<\delta \) - ומכאן ש-\( d\left(f\left(a^{*}\right),f\left(a_{n}\right)\right)<\varepsilon \), כמו שרצינו.

לסיכום: הראינו שאם \( f \) רציפה אז \( a^{*} \) היא אכן נקודת שבת. אבל למה \( f \) רציפה? זו תכונה שמשותפת לכל פונקציה ליפשיצית: אם \( d\left(f\left(a\right),f\left(b\right)\right)\le q\cdot d\left(a,b\right) \) עבור \( 0<q \) אז בהינתן \( \varepsilon>0 \) נבחר \( \delta=\frac{\varepsilon}{q} \) ואז עבור \( a,b \) כך ש-\( d\left(a,b\right)<\delta \) יתקיים

\( d\left(f\left(a\right),f\left(b\right)\right)\le q\cdot d\left(a,b\right)<q\cdot\frac{\varepsilon}{q}=\varepsilon \)

זה מסיים את שלב הקיום של משפט נקודת השבת של בנך. הראינו שאם לוקחים נקודה שרירותית כלשהי ומפעילים את \( f \) עליה שוב ושוב, מתכנסים אל נקודת שבת. למה לא ייתכן שנתכנס אל שתי נקודות שבת שונות אם נתחיל במקומות שונים? הטיעון כאן הוא כמעט טריוויאלי: כי אם \( f \) לא משנה שתי נקודות, אז המרחק בין התמונות שלהן לא יהיה קטן מהמרחק ביניהן, בסתירה לכך ש-\( f \) מכווצת. פורמלית, אם \( a^{*},b^{*} \) הן שתי נקודות שבת אז

\( d\left(a^{*},b^{*}\right)=d\left(f\left(a^{*}\right),f\left(b^{*}\right)\right)\le qd\left(a^{*},b^{*}\right)\le d\left(a^{*},b^{*}\right) \)

בפרט, \( qd\left(a^{*},b^{*}\right)=d\left(a^{*},b^{*}\right) \) ומכיוון ש-\( 0<q<1 \) זה קורה רק אם \( d\left(a^{*},b^{*}\right)=0 \) כלומר אם \( a^{*}=b^{*} \). זה מסיים את משפט נקודת השבת של בנך.

משפט נקודת השבת של ברואר

משפט נקודת השבת של ברואר אומר שכל פונקציה רציפה מכדור היחידה ה-\( n \) ממדי לעצמו היא בעלת נקודת שבת. ההוכחה שלו היא מסובכת יחסית ולא אציג אותה בפוסט הזה, אבל בואו ננסה להבין במה הוא דומה ושונה למשפט נקודת השבת של בנך.

ראשית, המשפט של ברואר מפורסם יותר ושימושי יותר במתמטיקה, ולכן בכלל הזכרתי אותו למרות שמטרת הפוסט הייתה משפט נקודת השבת של בנך; אני לא חושב שנכון לדבר על משפטי נקודות שבת בלי להזכיר את ברואר בכלל.

שנית, ברואר מדבר על נקודת שבת בפונקציה רציפה כלשהי. אצל בנך הדרישה הרבה יותר קיצונית: לא רק שהפונקציה צריכה להיות רציפה, היא צריכה להיות ליפשיצית, עם קבוע ליפשיץ קטן מ-1 (“מכווצת”). במובן זה ברואר מכסה מחלקה רחבה בהרבה של פונקציות.

עוד הבדל, הפעם לטובת בנך, הוא שמשפט בנך תקף במרחב מטרי שלם כלשהו, לא רק במרחב מטרי שחי ב-\( \mathbb{R}^{n} \). ברואר מתעסק בתנאים מגבילים יותר. אפשר טיפה למתוח את מה שברואר אומר - אם למרחב טופולוגי כלשהו יש את התכונה שלכל פונקציה רציפה מעליו יש נקודת שבת, אז כך גם לכל תמונה הומיאומורפית שלו (מרחב אחר כך שיש בינם התאמה חח”ע ועל שמשמרת את הטופולוגיה של המרחב). זה אומר שאפשר להשתמש בברואר לכל קבוצה קומפקטית קמורה ב-\( \mathbb{R}^{n} \), אבל עדיין אנחנו “חיים” ב-\( \mathbb{R}^{n} \); אם תרצו, ברואר הוא אחד ממשפטי האפיון הבסיסיים של “מה זה \( \mathbb{R}^{n} \) בכלל ומה מייחד אותו כמרחב”.

ועוד הבדל לטובת בנך הוא שמשפט ברואר הוא לא קונסטרוקטיבי - הוא לא נותן לנו דרך למצוא את נקודת השבת, רק מוכיח שהיא קיימת. זאת בשונה ממשפט בנך, שמראה דרך מפורשת “לבנות” אותה בתור גבול של סדרה. למעשה, העובדה שהמשפט המפורסם שלו עצמו לא קונסטרוקטיבי הייתה אחת מהדברים שגרמו לברואר לאמץ את הגישה האינטואיציוניסטית לפילוסופיה של המתמטיקה, שבה הוכחות לא קונסטרוקטיביות כאלו אינן מתקבלות בברכה (וכמובן, ראויה לפוסט משל עצמה שמי יודע אם אי פעם אכתוב).

נהניתם? התעניינתם? אם תרצו, אתם מוזמנים לתת טיפ: