אינטגרלים כפולים, משולשים ו-d-ממדיים

בסדרת הפוסטים שלי על אנליזה וקטורית סיימנו לעת עתה לדבר על נגזרות, ואנחנו עוברים אל עמוד התווך השני של האנליזה - אינטגרלים. הדיון באינטגרלים מתחלק לשלושה שלבים: בשלב הראשון, שהוא מה שנעשה הפעם, אנחנו לוקחים את אינטגרל רימן התמים והנחמד מחדו”א בסיסית ורואים איך ההגדרות שלו מוכללות באופן טבעי ל-\( \mathbb{R}^{d} \) לכל \( d \) טבעי. בשלב השני אנחנו רואים שדרך ההתבוננות הזו היא צרה מדי ובעצם צריך לדבר על עוד סוגים של אינטגרלים שרלוונטיים למרחבים רב-ממדיים, ואז מתחיל לצוץ ערב-רב של משפטים שמחברים את סוגי האינטגרלים השונים (משפטי גרין, גאוס, וסטוקס). בשלב השלישי, המטורלל ביותר, אנחנו מרחיבים מאוד את נקודת המבט שלנו ומגיעים מכך למשפט כללי מאוד (משפט סטוקס הכללי) שמכליל את כל המשפטים הללו, ובאופן כללי אנחנו מצליחים לראות שכל סוגי האינטגרלים השונים הם בעצם היבטים שונים של אותו דבר. זה היעד שאני חותר אליו, אבל הרבה לפני שנגיע לשם, בואו נתחיל מלדבר על ההכללה הפשוטה של אינטגרל רימן, שאנחנו מקבלים על ידי כך שאנחנו לוקחים את ההגדרה הרגילה של אינטגרל רימן ומנסים להפעיל אותה ב-\( d \) ממדים. אנחנו נראה שההגדרות הן פשוטות למדי - אין כאן סיבוך רציני ביחס למה שקורה במימד אחד - אבל שהחישוב של אינטגרל כזה הוא מן הסתם מסובך יותר, ובדרך כלל מסתמך על היכולת שלנו לבצע רדוקציה לאינטגרלים במימד אחד.

אני מניח כאן שאתם כבר מכירים אינטגרלים במימד אחד ואין צורך לתת שיחת מוטיבציה מיוחדת או לחזור על ההגדרות במימד אחד. מי שמעוניין יכול לקרוא את הפוסט שלי בנושא. אז בואו נעבור ישר לאקשן - איך מגדירים את זה?

במימד אחד אינטגרל מוגדר על קטע \( \left[a,b\right] \). ב-\( d \)-מימדים הוא מוגדר מעל קוביה \( d \)-ממדית, שהיא קבוצה מהצורה \( Q=\left[a_{1},b_{1}\right]\times\dots\times\left[a_{d},b_{d}\right] \). כלומר, יש לנו פונקציה חסומה \( f:Q\to\mathbb{R} \) ואנו רוצים להגדיר את האינטגרל שלה. לקטע מאורך 1 היה אורך, \( b-a \); לקוביה כזו יש נפח, \( v\left(Q\right)\triangleq\prod_{i=1}^{d}\left(b_{i}-a_{i}\right) \). במימד אחד הרעיון היה לחלק את הקטע \( \left[a,b\right] \) לחלקים קטנים, לכפול את אורך כל חלק כזה בערך המקסימלי/מינימלי בקטע של הפונקציה שמאנטגרלים, ולסכום. חלוקה של \( \left[a,b\right] \) מסומנת בתור \( P \) (מלשון Partition) והיא סדרה סופית של נקודות בקטע \( \left[a,b\right] \) שכוללת את הקצוות, כלומר \( P=\left(x_{1},x_{2},\dots,x_{t}\right) \) כך ש-\( x_{1}=a,x_{t}=b \) ו-\( x_{1}<x_{2}<\dots<x_{t} \). דרך אחת לחלק קוביה \( d \)-ממדית להרבה קוביות קטנות היא על ידי כך שלוקחים חלוקה של כל אחד מהקטעים שמגדירים את הקוביה, \( \left(P_{1},\dots,P_{d}\right) \), כלומר \( P_{i} \) היא חלוקה של הקטע \( \left[a_{i},b_{i}\right] \). תחשבו על איך אנחנו מציירים טבלה בדו מימד - קווים אנכיים ואופקיים שחוצים זה את זה ויוצרים ריבועים. כמובן, יש עוד דרכים לחלק קוביה \( d \)-ממדית לקוביות קטנות, אבל אנחנו פשוט לא נזקקים להן. העיקר מבחינתנו הוא שבדרך החלוקה שלנו אפשר לקבל חלקים שקטנים עד לאינסוף.

בחלוקה \( P=\left(P_{1},\dots,P_{d}\right) \) אנחנו מקבלים תת-קוביות שהן מהצורה \( I_{1}\times\dots\times I_{d} \) כאשר \( I_{i} \) הוא קטע שמוגדר על ידי החלוקה \( P_{i} \). נסמן תת-קוביה ב-\( R \). נסמן את הנפח של הקוביה ב-\( v\left(R\right) \). עכשיו, זכרו שיש לנו פונקציה \( f:Q\to\mathbb{R} \); נסמן ב-\( M_{R}\left(f\right)=\sup\left\{ f\left(x\right)\ |\ x\in R\right\} \) את החסם העליון על הערך של \( f \) במלבן \( R \) ובדומה ב-\( m_{R}\left(f\right)=\sup\left\{ f\left(x\right)\ |\ x\in R\right\} \) את האינפימום (כאן העובדה ש-\( f \) חסומה באה לידי ביטוי, אחרת הערכים הללו לאו דווקא היו מוגדרים והיינו בצרות). עכשיו אפשר לחקות את ההגדרה של סכומי דארבו מאינטגרלים חד ממדיים: להגדיר סכום תחתון של הפונקציה \( f \) ביחס לחלוקה \( P \) בתור הסכום \( L\left(f,P\right)=\sum_{R}m_{R}\left(f\right)v\left(R\right) \) ואת הסכום העליון בתור \( U\left(L,P\right)=\sum_{R}M_{R}\left(f\right)v\left(R\right) \) כאשר בשני המקרים הסכום נלקח על כל תת-הקוביות שמוגדרות על ידי \( P \) - קל לראות שהמספר שלהן הוא סופי ולכן הסכום בוודאי מוגדר היטב. השלב האחרון הוא הגדרה של אינטגרל תחתון ועליון: \( \underline{\int_{Q}}f=\sup_{P}L\left(f,P\right) \) ו-\( \overline{\int_{Q}}f=\inf_{P}U\left(f,P\right) \). אם \( \underline{\int_{Q}}f=\overline{\int_{Q}}f \) אומרים ש-\( f \) אינטגרבילית מעל \( Q \) ומסמנים את הערך המשותף הזה פשוט ב-\( \int_{Q}f \).

השלב האחרון, של האינטגרל העליון והתחתון, דורש עוד הבהרה מסויימת כדי שיהיה ברור למה “נכון” לנקוט בו. לא קשה לראות שאם ניקח חלוקה קיימת \( P \) ונחלק אותה עוד קצת על ידי הוספת נקודות עד לקבלת חלוקה \( P^{\prime} \), אנחנו יכולים רק להגדיל את הסכום התחתון ולהקטין את הסכום העליון, כלומר \( L\left(f,P\right)\le L\left(f,P^{\prime}\right) \) ו-\( U\left(f,P\right)\ge U\left(f,P^{\prime}\right) \). למה? כי השטח הכולל שעליו אנחנו סוכמים לא משתנה, אבל ה-\( M_{R}\left(f\right),m_{R}\left(f\right) \) שלנו עשויים להשתנות ולהיות יותר מדוייקים. לדוגמה, נאמר שבתת-קוביה עם נפח 10 יש לנו \( m_{R}\left(f\right)=3 \), אז תת-הקוביה הזו תתרום לסכום 30; אבל עכשיו, אם נחלק אותה לשתי תת-קוביות שכל אחד מנפח 5, לא ייתכן שה-\( m_{R}\left(f\right) \) של אף אחד משתי תת-הקוביות הללו יהיה קטן יותר מ-3 (אחרת ה-\( m_{R}\left(f\right) \) המקורי היה נמוך יותר) ולכן ייתכן, למשל, שבאחת הקוביות הוא עדיין 3 אך בשניה הוא 4, ואז נקבל סכום כולל של \( 3\cdot5+4\cdot5=35 \), שגדול מ-30. עוד דבר שברור מייד הוא שעבור חלוקה \( P \) נתונה מתקיים \( L\left(f,P\right)\le U\left(f,P\right) \), פשוט כי \( \inf \) תמיד קטן או שווה ל-\( \sup \) שנלקח על אותה פונקציה ואותו תחום.

עכשיו, בואו ניקח שתי חלוקות \( P_{1},P_{2} \) כלשהן. אפשר לבנות מהן חלוקה חדשה שמתקבלת מאיחוד קבוצות הנקודות של שתיהן (חשבו על שתי טבלאות שונות שאנחנו שמים אחת על השניה תוך שימוש בנייר שקוף). נסמן את החלוקה שנקבל כך ב-\( P^{\prime} \). אז נקבל

\( L\left(f,P_{1}\right)\le L\left(f,P^{\prime}\right)\le U\left(f,P^{\prime}\right)\le U\left(f,P_{2}\right) \)

המסקנה: לכל שתי חלוקות, הסכום התחתון של האחת קטן מהסכום העליון של השניה. זה מצביע מייד על כך שהסכומים העליונים והתחתונים חסומים, ולכן האינטגרלים העליון והתחתון שהגדרתי אכן מוגדרים היטב, ושהאינטגרל העליון תמיד גדול או שווה מהאינטגרל התחתון, כלומר שניהם מהווים את הקירוב “הטוב ביותר” שאנחנו מסוגלים להשיג בשיטת האינטגרציה הנוכחית שלנו אל מה שאנחנו תופסים בתור האינטגרל של הפונקציה - קירוב אחד הוא מלמעלה והשניה מלמטה, ואם הם משתווים, מה טוב (ואם הם לא משתווים? יש שיטות אינטגרציה חכמות יותר - למשל, אינטגרל לבג - שהדיון בהן שייך לזמן אחר).

כדאי לתת עוד הערה קטנה על הסימון. אינטגרלים במימד אחד לרוב נכתבים בתור \( \int_{a}^{b}f\left(x\right)dx \). אנחנו שינינו שני דברים. הראשון הוא שאנחנו לא כותבים את הגבולות העליונים והתחתונים אלא סתם כותבים \( Q \); זה זהה לכך שבמימד אחד היינו כותבים \( \int_{\left[a,b\right]}f \). הדבר השני הוא שחיסלנו את ה-\( dx \) הזה שתקוע בתוך אינטגרלים במימד אחד. ליצור הזה יש במימד אחד שימוש פרקטי, של להגיד לנו מי משתנה האינטגרציה במקרה שבו ב-\( f \) יש גם פרמטרים; אבל יש לו גם משמעות מעבר לכך, שעדיין לא פירמלנו בהקשר שלנו ולכן בינתיים נוותר עליה לחלוטין.

עם זאת, יש כתיב מקובל לאינטגרלים עבור \( d=2 \) ו-\( d=3 \) שהכרחי להציג כי הוא מה שמשתמשים בו רוב הזמן בשימושים מעשיים. כאשר \( d=2 \) האינטגרל שהגדרנו נקרא אינטגרל כפול ומסומן ב-\( \iint_{Q}f\left(x,y\right)dxdy \), וכאשר \( d=3 \) הוא נקרא אינטגרל משולש ומסומן ב-\( \iiint_{Q}f\left(x,y,z\right)dxdydz \). זאת, כמובן, בנוסף לסימון ה”כללי” שכבר הצגתי.

עוד נקודה שכדאי להתייחס אליה כבר עכשיו היא ש-\( Q \) לא חייב להיות קוביה. אפשר להגדיר את האינטגרל על כל קבוצה חסומה \( S \), כאשר “חסומה” פירושו שקיימת קוביה \( Q \) שמכילה אותה. דהיינו, אם יש לנו פונקציה \( f:S\to\mathbb{R} \) יש משמעות לאינטגרל \( \int_{S}f \). בסיטואציה הזו אפשר להגדיר פונקציה \( f_{Q}:Q\to\mathbb{R} \) כאשר \( Q \) היא קוביה כלשהי שמכילה את \( S \), ומוגדרת על ידי \( f_{Q}\left(x\right)=\begin{cases}f\left(x\right) & x\in S\\0 & x\notin S\end{cases} \) ואז להגדיר \( \int_{S}f=\int_{Q}f_{Q} \). כמובן, נדרשת כאן הוכחה לכך שההגדרה הזו מוגדרת היטב - שעבור בחירות שונות של \( Q \) נקבל את אותו אינטגרל. אני קופץ על ההוכחה הזו כי אני מניח שהתוצאה אינטואיטיבית מספיק גם כך.

עכשיו עולות מאליהן שתי שאלות - הראשונה, באילו מצבים האינטגרל של \( f \) קיים? ראינו שהיות \( f \) חסומה היא תנאי הכרחי לכך שבכלל ננסה להגדיר את האינטגרל, אבל זה בוודאי לא תנאי מספיק. השאלה השניה היא - אם האינטגרל קיים, איך מחשבים אותו?

נתחיל מהשאלה הראשונה. הדוגמה הנגדית הקלאסית של פונקציה חסומה שאיננה אינטגרבילית היא פונקציית דיריכלה, שבמימד אחד מוגדרת להיות \( f\left(x\right)=\begin{cases}1 & x\in\mathbb{Q}\\0 & x\notin\mathbb{Q}\end{cases} \) - בניסוח אחר, זוהי הפונקציה המציינת של הרציונליים, \( \chi_{\mathbb{Q}} \). היא לא אינטגרבילית מכיוון שכל קטע לא מנוון מכיל גם רציונליים וגם אי רציונליים, ולכן \( m_{R} \) יוצא תמיד 0 ו-\( M_{R} \) יוצא תמיד 1 ולכן האינטגרל העליון יצא האורך של הקטע שעליו מבצעים את האינטגרציה והאינטגרל התחתון יצא תמיד 0; אותו דבר יקרה גם עבור גרסה \( d \)-ממדית של הפונקציה. עכשיו, אינטגרל לבג שהזכרתי למעלה פותר את הבעיה ויוצא שאינטגרל לבג של הפונקציה הזו הוא 0; האינטואיציה הוא ש-\( \mathbb{Q} \) היא קבוצה “קטנה” למדי מבחינת ה”נפח” (המידה שלה) ולכן היא לא משפיעה לנו על האינטגרל ואפשר לחשוב על האינטגרל כאילו הוא נלקח רק מעל האי-רציונליים, ומעליהם הפונקציה היא 0 (ברמה אינטואיטיבית יותר, אפשר לשנות כרצוננו את הערכים של הפונקציה על הרציונליים ועדיין לקבל את אותו אינטגרל, ולכן אם נשנה את ערכי הפונקציה ל-0 נקבל את הפונקציה הקבועה 0 ואין פלא שהאינטגרל יוצא 0).

מצד שני, די קל להוכיח שאם \( f \) היא רציפה, אז האינטגרל שלה קיים תמיד. ההוכחה מתבססת על כך שאם \( f \) היא רציפה בקבוצה סגורה וחסומה, אז היא רציפה בה במידה שווה. רציפות במידה שווה פירושה שאפשר לתת גודל כלשהו של תת-קוביות, כך שכל זוג נקודות בכל תת-מלבן מהגודל הזה יהיו בעלות התכונה שהתמונה של \( f \) עליהן היא יחסית קרובה. פורמלית, לכל \( \varepsilon>0 \) קיים \( \delta>0 \) כך שאם \( \left|x_{1}-x_{2}\right|<\delta \) אז \( \left|f\left(x_{1}\right)-f\left(x_{2}\right)\right|<\varepsilon \). המשמעות היא שככל ש-\( R \) נהיה קטן יותר ויותר, כך \( m_{R} \) ו-\( M_{R} \) הופכים לקרובים יותר ויותר, ולכן \( L\left(f,P\right) \) ו\( U\left(f,P\right) \) מתקרבים יותר ויותר וניתן להראות שהאינטגרלים העליון והתחתון ישתוו. בדרך כלל רואים את ההוכחה הזו עבור אינטגרל חד ממדי ואין טעם לחזור עליה כאן.

המשפט הכללי על אינטגרביליות רימן של \( f \) הוא מעין שילוב של שני הדברים שדיברנו עליהם לעיל: זה לא הכרחי שהפונקציה תהיה רציפה, אבל היא צריכה להיות כמעט רציפה. הניסוח הפורמלי הוא ש-\( f \) אינטגרבילית רימן ב-\( Q \) אם ורק אם קבוצת נקודות אי-הרציפות שלה ב-\( Q \) היא ממידה אפס. אני לא מוכיח את התוצאה הזו כאן כי לדעתי נכון לדבר עליה רק במסגרת דיון על מידת לבג (למרות שאפשר להגדיר את “מידה אפס” גם בלי להגדיר את מידת לבג הכללית, וזה מה שבדרך כלל עושים בספרי לימוד בנושא - קבוצה היא ממידה אפס אם לכל \( \varepsilon \) אפשר לכסות אותה על ידי סדרת קוביות שסכום נפחיה הכולל - וזה עשוי להיות סכום אינסופי - הוא קטן מ-\( \varepsilon \)). כל הדיון הזה מתבצע לרוב כבר עבור פונקציה חד ממדית; העניין הוא בכך ש-\( d \)-ממדים לא הופכים את הסיפור למסובך כמעט בכלל.

נעבור, אם כן, לשאלה של איך מחשבים אינטגרלים \( d \)-ממדים. וכאן זו כבר בעיה קשה בהרבה. התשובה הקצרה היא שלרוב עושים את זה על ידי רדוקציה למקרה החד-ממדי, כלומר מסתמכים בעיקר על כך שאנחנו יודעים לפתור אינטגרלים חד-ממדיים, אז כדאי להיזכר מה קורה במקרה החד-ממדי. גם במקרה החד-ממדי, חישוב אינטגרלים יכול להיות עניין קשה. עבור \( f \) שאינה רציפה, לרוב מפצלים את האינטגרל לסכום של כמה אינטגרלים שכל אחד מהם נוגע לתחום שבו \( f \) רציפה. כאשר \( f \) כן רציפה, יש לנו קסם, קסם מדהים לחלוטין, שנקרא המשפט היסודי של החדו"א. המשפט הזה אומר שאם \( f \) היא רציפה בקטע \( \left[a,b\right] \) ואם \( F \) היא פונקציה קדומה של \( f \), כלומר מתקיים \( F^{\prime}=f \) - הנגזרת של \( F \) היא \( f \) - אז \( \int_{a}^{b}f\left(x\right)dx=F\left(b\right)-F\left(a\right) \). בעיני זו תוצאה מדהימה לגמרי, וכבר מהפעם הראשונה שבה ראיתי אותה התקשיתי להאמין לה. ה”קסם” פה הוא שכדי לדעת מה האינטגרל של \( f \) על כל הקטע \( \left[a,b\right] \) אנחנו רק צריכים לדעת את הערכים של \( F \) בקצוות הקטע. איך זה אפשרי בכלל? האם \( f \) לא יכולה “להשתגע” בתוך הקטע? התשובה היא כמובן שהיא יכולה, אבל זה ישפיע על \( F \). איכשהו \( F \) “דוחסת” את כל המורכבות של \( f \) אל תוך קצוות הקטע. אחרי קצת מחשבה על הנושא המשפט נראה כמעט מובן מאליו - \( F\left(b\right) \) הוא בדיוק סכום כל השינויים שה”שיגועים” של \( f \) בתוך הקטע גרמו ל-\( F \), החל מהערך ההתחלתי \( F\left(a\right) \) - אבל זה שמבינים למה הקסם עובד לא מפחית מהמגניבות שלו, לטעמי.

למי שעדיין חושבים שהמשפט מגניב, הבשורה הטובה שלי היא שמשפט סטוקס - הדבר המאוד-כללי ומאוד-מאוד-מגניב שאני מבטיח שנגיע אליו כל הזמן - הוא בעצם הכללה אדירה של המשפט היסודי של החדו”א. דוגמה לכך היא במקרה פרטי פשוט במיוחד שלו, משפט גרין, שאומר שהאינטגרל הדו-ממדי של פונקציה בקטע שמוגדר על ידי עקום סגור במישור שווה לאינטגרל מסלולי על העקום הזה של משהו שהוא כמו פונקציה קדומה של הפונקציה הדו ממדית. נשמע מעורפל, נכון? כי אני מקדים את זמני ומדבר על הגדרות שעוד לא קיימות כמו “אינטגרל מסלולי”. נעזוב את זה לבינתיים.

ה”קסם” שנותן לנו המשפט היסודי של החדו”א לא בא בלי מחיר. בהינתן \( f \), זה יכול להיות קשה מאוד למצוא לה פונקציה קדומה \( F \). יש פונקציות תמימות למראה, כמו \( e^{x^{2}} \), שאין להן פונקציה קדומה שניתנת להצגה בצורה “נחמדה” בכלל. אין אלגוריתם כללי שמאפשר לנו למצוא פונקציה קדומה של פונקציה נתונה (בעוד שעבור נגזרת כן יש אלגוריתם עבור מחלקה רחבה מאוד של פונקציות). יש שלל טריקים מגניבים שמאפשרים להקל על החיפוש, אבל לא אכנס אליהם כרגע.

אם כן, יש לנו פתרון שמבוסס על רדוקציה למקרה החד-ממדי. אני אחזור עוד רגע לשאלה איך עושים את זה, ועם השאלה הזו נסיים את הפוסט, אבל אני כבר רוצה לרמוז אל המקום הבא שאני הולך אליו. הרבה פעמים לפני שמבצעים רדוקציה למקרה החד ממדי אנחנו רוצים להביא את האינטגרל לצורה פשוטה יותר, על ידי שינוי של \( f \) לפונקציה שיותר קל לנו לבצע לה אינטגרציה חד-ממדית. התעלול הזה נקרא החלפת משתנים (קצת מוקדם מדי להציג דוגמה). המשפט הרלוונטי לעניין מגדיר לנו מה זו “החלפת משתנים” לגיטימית, ואיך האינטגרל הולך להשתנות עקב כך - ההבדל העיקרי הוא שצריך יהיה לכפול את \( f \) ב”תיקון” כלשהו שמחושב מתוך הפונקציה שמבצעת את החלפת המשתנים. התוצאה יוצאת אלגנטית למראה ושימושית בצורה מטורפת; לרוע המזל, ההוכחה של המשפט הזה היא אחת מהקשות ביותר שבהן ניתן להיתקל בקורסי המבוא לנושא. אני אקח על עצמי לנסות ולהציג את ההוכחה כאן, ובתקווה לחפף כמה שפחות, אבל זה באמת שייך כבר לפוסט (או סדרת פוסטים) אחר.

בואו נעבור לדוגמה. נניח שאנחנו רוצים לחשב את האינטגרל של \( f\left(x,y\right)=x+y \) על המלבן \( Q=\left[0,1\right]\times\left[0,1\right] \). חשבו על המלבן הזה כאילו הוא מורכב מאינסוף קווים אופקיים דקים באורך 1 - קו לכל ערך של \( y \) בין 0 ל-1. על כל קו כזה, \( f\left(x,y\right) \) היא פונקציה במשתנה יחיד \( y \), כאשר \( x \) הוא פרמטר - אינטגרל חד ממדי של הדבר הזה אנחנו בוודאי יודעים לחשב לכל \( x \): \( \int_{0}^{1}\left(x+y\right)dy=\left[xy+\frac{y^{2}}{2}\right]_{0}^{1}=\frac{1}{2}+x \). עכשיו, \( f\left(x,y\right) \) מתאר כמה הערך של הפונקציה \( f \) בקואורדינטה \( \left(x,y\right) \) תורם לסכום שהאינטגרל מהווה (כמובן, זה לא שהערך \( f\left(x,y\right) \) מתווסף לסכום כמות שהוא; אינטואיטיבית, הוא מתווסף כשהוא משוקלל על פי ה”גודל” של הנקודה \( \left(x,y\right) \), שהוא אינפיניטסימלי. זה שאפשר לפרמל את האינטואיציה הזו ומקבלים משהו שעובד, זה מה שמגניב באינטגרל). באופן דומה, האינטואיציה היא ש-\( \frac{1}{2}+x \) כאן מתאר מה כל הקו האנכי עם קו רוחב \( x \) תורם לסכום. לכן כדי לדעת מה הסכום הכולל צריך לבצע אינטגרציה על הערכים הללו - להגדיר פונקציה \( I\left(x\right)=\frac{1}{2}+x \) ולחשב את האינטגרל \( \int_{0}^{1}I\left(x\right)dx=\int_{0}^{1}\left(\frac{1}{2}+x\right)=\left[\frac{1}{2}x+\frac{1}{2}x^{2}\right]_{0}^{1}=1 \).

את כל התהליך הזה אפשר לתאר אינטואיטיבית בעזרת המשוואה הבאה:

\( \iint_{Q}\left(x+y\right)dxdy=\int_{0}^{1}\left(\int_{0}^{1}\left(x+y\right)dy\right)dx \)

כלומר, אנחנו מפרקים את האינטגרל הכפול להפעלה כפולה של אינטגרל רגיל. הסימונים נבחרו בקפידה כדי שההפרדה הזו תיראה לנו טבעית ככל הניתן, אבל מן הסתם זו תוצאה לא טריוויאלית שצריך להוכיח. למרבה המזל, ההוכחה היא יחסית ישירה ולא יהיה לנו קושי לראות אותה כאן.

יש נקודה טכנית מעצבנת אחת שחייבים לתת עליה את הדעת לפני שאני מציג את הניסוח הכללי של המשפט, והיא שלפעמים פירוק לא יכול לעבוד בכלל. הנה דוגמה פשוטה: \( f\left(x,y\right)=\begin{cases}1 & x=0\wedge y\in\mathbb{Q}\\0 & \mbox{else}\end{cases} \). הפונקציה הזו היא 0 כמעט בכל מקום, למעט נקודות מהצורה \( \left(0,r\right) \) כאשר \( r \) הוא מספר רציונלי. אני רוצה להסתכל על האינטגרל שלה על \( \left[0,1\right]\times\left[0,1\right] \). בבירור הפונקציה אינטגרבילית; כל נקודות אי הרציפות שלה הן על הישר \( \left(0,y\right) \), ולכן הן ממידה אפס (לקו במישור יש מידה אפס, לא קשה להראות את זה). עם זאת, ה”חתך” \( f_{0}\left(y\right)=f\left(0,y\right) \) שמתקבל מהצבת \( x=0 \) הוא פונקציית דיריכלה שהזכרתי קודם, והיא לא אינטגרבילית. אז אני לא יכול לרשום פירוק כמו \( \iint_{Q}f\left(x,y\right)dxdy=\int_{0}^{1}\left(\int_{0}^{1}f\left(x,y\right)dy\right)dx \) מהטעם הפשוט שה-\( \int_{0}^{1}f\left(x,y\right)dy \) שבפנים לא בהכרח מוגדר (הפונקציה \( I\left(x\right)=\int_{0}^{1}f\left(x,y\right)dy \) לא מוגדרת לכל \( x \)).

פתרון אחד הוא לעבור לדבר על אינטגרל לבג שבו דברים מעצבנים כאלו לא קורים, אבל אין בכך צורך, אפשר לתקן את הבעיה על ידי שימוש באינטגרלים שכן מוגדרים תמיד - האינטרלים העליונים והתחתונים. באיזה מהם להשתמש? לא משנה, שניהם יעבדו. אם כן, בואו נעבור לניסוח הגרסה הכללית של המשפט - משפט פוביני: אם \( f:Q\to\mathbb{R} \) היא פונקציה אינטגרבילית, ו-\( Q=A\times B \) כך ש-\( A \)קוביה ב-\( \mathbb{R}^{k} \) ו-\( B \) קוביה ב-\( \mathbb{R}^{n} \), אז נסמן \( f\left(x,y\right) \) בתור הפונקציה \( f \) כאשר חילקנו את המשתנים שלה לשתי קבוצות, ה-\( x \)-ים וה-\( y \)-ים, עבור \( x\in A \) ו-\( y\in B \). אז

\( \int_{Q}f=\int_{x\in A}\underline{\int_{y\in B}}f\left(x,y\right)=\int_{x\in A}\overline{\int_{y\in B}}f\left(x,y\right) \)

ההוכחה היא לא הרבה יותר מאשר משחק זהיר עם קוביות וסכומים עליונים ותחתונים וכל שאר המושגים שראינו בפוסט - הזדמנות טובה לתרגל אותם.

כדי להקל לעצמנו על החיים, בואו נשתמש בסימון המקוצר \( \underline{I}\left(x\right)=\underline{\int_{y\in B}}f\left(x,y\right) \) ו-\( \overline{I}\left(x\right)=\overline{\int_{y\in B}}f\left(x,y\right) \). דהיינו, משפט פוביני אומר ש-\( \int_{A\times B}f\left(x,y\right)=\int_{x\in A}\underline{I}\left(x\right)=\int_{x\in A}\overline{I}\left(x\right) \). שימו לב למה שנאמר כאן באופן מובלע - ש-\( \underline{I}\left(x\right) \) ו-\( \overline{I}\left(x\right) \) הם אינטגרביליים מעל \( A \). נוכיח את השוויון ואת האינטגרביליות בבת אחת - התעלול יהיה להראות שאפשר לחסום סכומים עליונים ותחתונים של ה-\( I \)-ים בין סכומים עליונים ותחתונים של \( f \); מכיוון ש-\( f \) אינטגרבילית, הסכומים הללו יכולים להיות קרובים ככל שנרצה, ולכן כך יהיו הסכומים עבור ה-\( I \)-ים.

עכשיו, סכומים עליונים ותחתונים הם תמיד ביחס לחלוקה \( P \) של \( Q \). חלוקה של קוביה רב-ממדית מורכבת מחלוקות של הצירים, ולכן כל חלוקה \( P \) “מתפרקת” לזוג \( \left(P_{A},P_{B}\right) \) של החלוקות של ההיטלים \( A,B \) של \( Q \). אם נסמן קוביה כלשהי בחלוקה של \( A \) בתור \( R_{A} \), ובדומה \( R_{B} \) תהיה קוביה בחלוקה של \( B \), אז \( R_{A}\times R_{B} \) תהיה קוביה בחלוקה של \( Q \). מה שאני ארצה להוכיח הוא

\( L\left(f,P\right)\le L\left(\underline{I}\left(x\right),P_{A}\right)\le U\left(\underline{I}\left(x\right),P_{A}\right)\le U\left(f,P\right) \)

ובאופן דומה גם עבור \( \overline{I}\left(x\right) \). כמובן, אי השוויון האמצעי כבר ידוע לנו. למה אי השוויון הזה מסיים את ההוכחה? כי לכל \( \varepsilon>0 \) ניקח \( P \) כך ש-\( \left|U\left(f,P\right)-L\left(f,P\right)\right|<\varepsilon \) (קיים כזה \( P \) כי \( f \) אינטגרבילית). מאי השוויונים נקבל \( \left|U\left(\underline{I}\left(x\right),P_{A}\right)-L\left(\underline{I}\left(x\right),P_{A}\right)\right|<\varepsilon \) וזה מוכיח ש-\( \sup L\left(\underline{I}\left(x\right),P_{A}\right)=\inf U\left(\underline{I}\left(x\right),P_{A}\right) \).

אז בואו ננסה להבין למה \( L\left(f,P\right)\le L\left(\underline{I}\left(x\right),P_{A}\right) \). אם נבין את זה, גם אי השוויון האחר ינבע באותו האופן. בשביל זה נצטרך לרדת רמה אחת נוספת למטה, מרמת הסכום התחתון אל רמת הסכום על קוביה בודדת:

\( L\left(\underline{I}\left(x\right),P_{A}\right)=\sum_{R_{A}}m_{R_{A}}\left(\underline{I}\right)v\left(R_{A}\right) \)

\( L\left(f,P\right)=\sum_{R_{A}\times R_{B}}m_{R_{A}\times R_{B}}\left(f\right)v\left(R_{A}\times R_{B}\right)=\sum_{R_{A}}\sum_{R_{B}}m_{R_{A}\times R_{B}}\left(f\right)v\left(R_{A}\right)v\left(R_{B}\right) \)

לכן אי השוויון שאנחנו רוצים להוכיח הוא בעצם

\( \sum_{R_{A}}\sum_{R_{B}}m_{R_{A}\times R_{B}}\left(f\right)v\left(R_{A}\right)v\left(R_{B}\right)\le\sum_{R_{A}}m_{R_{A}}\left(\underline{I}\right)v\left(R_{A}\right) \)

ואפשר לחלק ב-\( v\left(R_{A}\right) \) ולקבל

\( \sum_{R_{A}}\left[\sum_{R_{B}}m_{R_{A}\times R_{B}}\left(f\right)v\left(R_{B}\right)\right]\le\sum_{R_{A}}m_{R_{A}}\left(\underline{I}\right) \)

מסקנה: מספיק אם נוכיח, עבור \( R_{A} \) כללי, ש-

\( \sum_{R_{B}}m_{R_{A}\times R_{B}}\left(f\right)v\left(R_{B}\right)\le m_{R_{A}}\left(\underline{I}\right) \)

יפה. בואו נתמקד לרגע ב-\( m_{R_{A}\times R_{B}}\left(f\right) \). זהו האינפימום של ערכי \( f \) על הקוביה \( R_{A}\times R_{B} \). לכן הוא קטן או שווה לכל ערך של \( f \) על הקוביה הזו; בפרט, אם נקפיא את \( x \) לרגע (ונסמן אותו \( x_{0}\in R_{A} \) כדי שיהיה ברור, ועכשיו \( f\left(x_{0},y\right) \) היא הפונקציה של \( y \) שמתקבלת מהצבה ב-\( f \) כאשר \( x_{0} \) “מוקפא”), אנחנו יודעים ש-\( m_{R_{A}\times R_{B}}\left(f\right)\le f\left(x_{0},y\right) \) עבור כל \( y\in R_{B} \). לכן אם ניקח את האינפימום של אגף ימין, אי השוויון ישתמר: \( m_{R_{A}\times R_{B}}\left(f\right)\le m_{R_{B}}\left(f\left(x_{0},y\right)\right) \)

בהינתן \( x_{0} \) קבוע, אי השוויון הזה נכון לכל קוביה \( R_{B} \). לכן הוא ישתמר גם אם נכפול את שני האגפים ב-\( v\left(R_{B}\right) \) ונסכום על כלל ה-\( R_{B} \)-ים. קיבלנו:

\( \sum_{R_{B}}m_{R_{A}\times R_{B}}\left(f\right)v\left(R_{B}\right)\le\sum_{R_{B}}m_{R_{B}}\left(f\left(x_{0},y\right)\right)v\left(R_{B}\right)=L\left(f\left(x_{0},y\right),P_{B}\right)\le\underline{\int_{y\in B}}f\left(x_{0},y\right)=\underline{I}\left(x_{0}\right) \)

האם סיימנו? כמעט. אגף ימין הוא מה שרצינו לקבל, אבל באגף שמאל צריך להיות \( m_{R_{A}}\left(\underline{I}\right) \). אבל זה מיידי: ראינו שאגף ימין קטן או שווה מכל ערך של \( \underline{I} \) על \( x \) ב-\( R_{A} \), ולכן אגף ימין יהיה קטן או שווה לאינפימום - וסיימנו.

כאן גם סיימנו עם ההוכחות הפשוטות. האתגר הבא שלי הוא להוכיח את משפט החלפת המשתנים, מה שידרוש לא מעט הכנה מוקדמת ועבודה טכנית. יהיה כיף.


נהניתם? התעניינתם? אם תרצו, אתם מוזמנים לתת טיפ:

Buy Me a Coffee at ko-fi.com