סדרות וטורים של פונקציות

מבוא

חור גדול שנותר עד היום בבלוג הוא אותו חלק של החשבון הדיפרנציאלי והאינטגרלי שמתעסק בטורים של פונקציות. לא רק שזה נושא מגניב בפני עצמו, אלא גם שהמחסור בו הוא המכשול הגדול ביותר בדרך שלי לסגירת עוד חור גדול בבלוג - אנליזה מרוכבת. אז בואו נסגור את החור הזה סוף סוף.

אני אניח פה שאנחנו מכירים את מושגי הבסיס הרלוונטיים בחדו”א, כי יש לי כבר פוסטים עליהם: על המושגים של גבול של פונקציה ופונקציות רציפות; על גבולות של סדרות; ועל טורים אינסופיים של מספרים. אבל אין סיבה עקרונית לא להזכיר את המושגים הללו בקיצור גם כאן, כי נשתמש בהם כל הזמן.

אנחנו בחדו”א עובדים מעל \( \mathbb{R} \), כלומר מתעסקים בסדרות שהאיברים שלהן הם מספרים ממשיים ופונקציות שמקבלות ממשיים ומחזירות ממשיים. על הממשיים מוגדר לנו מושג של מרחק בעזרת פונקציית הערך המוחלט: המרחק בין \( a \) ל-\( b \) הוא \( \left|a-b\right| \). הרעיון הכללי מאחורי גבול, המושג שעליו החדו”א המודרני נבנה, הוא שהאובייקט שלנו (סדרה או פונקציה) “מתקרב” אל ערך אחד ספציפי - הגבול - במובן זה שהמרחק ביניהם נהיה “קטן כרצוננו” אם מתמקדים בחלק של האובייקט שלנו שעליו אומרים שהוא שואף אל הגבול. בואו נראה איך זה בא לידי ביטוי בסדרות של מספרים ובפונקציות:

  • אומרים שהסדרה האינסופית \( \left\{ a_{n}\right\} _{n=0}^{\infty} \) שואפת לגבול \( L \) ומסמנים את זה \( \lim_{n\to\infty}a_{n}=L \) (או סתם \( a_{n}\to L \)) אם לכל \( \varepsilon>0 \) קיים \( N \) טבעי כך שלכל \( n>N \) מתקיים \( \left|a_{n}-L\right|<\varepsilon \)
  • אומרים שהפונקציה \( f\left(x\right):\mathbb{R\to\mathbb{R}} \) שואפת לגבול \( L \) כאשר \( x \) שואף לנקודה \( x_{0} \) ומסמנים את זה \( \lim_{x\to x_{0}}f\left(x\right)=L \) אם לכל \( \varepsilon>0 \) קיים \( \delta>0 \) כך שאם \( 0<\left|x-x_{0}\right|<\delta \) אז \( \left|f\left(x\right)-L\right|<\varepsilon \)

זו לא הגדרה קלה לעיכול ולכן אני ממליץ על הפוסטים שקישרתי אליהם (או המקורות הרבים האחרים שמסבירים את הנושא טוב ממני!) אם היא לא יושבת טוב כרגע. אני רוצה שננצל את ההזדמנות לכך ששתי הההגדרות יושבות זו לצד זו כדי לראות את הדמיון הרב ביניהן: בהגדרה הראשונה אנחנו מסתכלים על החלק של הסדרה שהוא “כל מה שגדול מ-\( N \)” ובהגדרה השניה אנחנו מסתכלים על החלק של הפונקציה שהוא “כל הפלטים של הפונקציה על סביבה בגודל \( \delta \) של \( x_{0} \) שלא כוללת את הקצוות או את \( x_{0} \) עצמה” ובשני המקרים אנחנו דורשים שכל מה שנמצא באותו איזור שאנחנו מסתכלים עליו יהיה קרוב ל-\( L \) עד כדי ה-\( \varepsilon \) השרירותי שהתחלנו ממנו.

ההגדרה של רציפות של פונקציה היא נקודתית - כלומר אומרים שפונקציה היא רציפה בנקודה ספציפית. כדי ש-\( f \) תהיה רציפה ב-\( x_{0} \) היא צריכה לקיים \( f\left(x_{0}\right)=\lim_{x\to x_{0}}f\left(x\right) \), כלומר שהפונקציה “תקיים את ההבטחה” של הגבול. אפשר גם להגדיר את זה ישירות: קיים \( L \) כך שלכל \( \varepsilon>0 \) קיים \( \delta>0 \) כך שאם \( \left|x-x_{0}\right|<\delta \) אז \( \left|f\left(x\right)-L\right|<\varepsilon \) (שימו לב שבעורמה רבה הסרתי את הדרישה המקילה \( 0<\left|x-x_{0}\right| \) ובכך אני מכריח את השוויון \( f\left(x_{0}\right)=L \) להתקיים).

לבסוף, ההגדרה של סכום של טור אינסופי של מספרים בעצם נבנית מעל ההגדרה של גבול של סדרה. הרעיון הוא כזה: יש לנו סדרה \( a_{0},a_{1},a_{2},\ldots \) ואנחנו רוצים לחבר את האיברים שלה - להסתכל על \( \sum_{n=0}^{\infty}a_{n} \) ולמצוא מספר שמתאים לאינטואיציה שלנו לגבי הסכום של אותם אינסוף מספרים. יש כמה גישות לנושא הזה - אין הגדרה אחת שהיא פשוט “ההגדרה הנכונה” אבל זו השימושית והנפוצה ביותר במתמטיקה משתמשת במשהו שנקרא סכומים חלקיים ומגדירה את סכום הטור בתור הגבול של הסכומים החלקיים הללו. פורמלית, אני מגדיר \( S_{n}=\sum_{k=0}^{n}a_{k} \) ואז אומר ש-\( \sum_{n=0}^{\infty}a_{n}=S \) אם \( \lim_{n\to\infty}S_{n}=S \).

אם קיים גבול לסדרת הסכומים החלקיים אומרים שהטור \( \sum_{n=0}^{\infty}a_{n} \) מתכנס ואחרת אומרים שהוא מתבדר. יש גם מושג של “התכנסות לאינסוף” אבל נעזוב את זה; תחשבו על זה בתור אחד מסוגי ההתבדרות. סוג אחר של התבדרות הוא של הטור \( 1-1+1-1+1-\ldots \) שהסכומים החלקיים שלו “מזפזפים” בין 0 ו-1; על פי ההגדרה שלנו אין לטור הזה סכום (על פי הגדרה אחרת, כללית יותר, שלוקחת את הגבול של הממוצע של סדרת הסכומים החלקיים, דווקא יש גבול והוא \( \frac{1}{2} \)).

בואו נראה שאנחנו מבינים מספיק מה הולך פה כדי להוכיח משהו! טענה בסיסית אבל מועילה מאוד - שאם \( \sum_{n=0}^{\infty}a_{n} \) מתכנס אז האיבר הכללי של הטור שואף לאפס, כלומר \( \lim_{n\to\infty}a_{n}=0 \) (שימו לב - זו לא סדרת הסכומים החלקיים!)

איך מוכיחים טענה כזו? כלל האצבע שלי לכל מי שנתקעים בהוכחות בחדו”א - קודם כל תתחילו מ”יהא \( \varepsilon>0 \)”. זה בדרך כלל עובד. ה-\( \varepsilon \) מציב בפנינו “אתגר” - הוא אומר לנו - עכשיו בואו תמצאו \( N \) כלשהו כך שאם \( n>N \) אז \( \left|a_{n}-0\right|<\varepsilon \), דהיינו פשוט \( \left|a_{n}\right|<\varepsilon \).

הרעיון הוא פשוט. מה נתון לנו? ש-\( \sum_{n=0}^{\infty}a_{n} \) מתכנס, כלומר קיים \( L \) כך ש-\( \lim_{n\to\infty}S_{n}=L \). אם הנתון שלנו הוא על הסכומים החלקיים \( S_{n} \) ואנחנו רוצים לומר משהו על האיברים \( a_{n} \), מה הקשר ביניהם? הוא פשוט: \( a_{n}=S_{n}-S_{n-1} \). לכן אפשר לנקוט בתעלול הבא, שהוא מאוד נפוצות בהוכחות חדו”א: מכך ש-\( S_{n} \) מתכנסת אל \( L \) נובע שקיים \( N^{\prime} \) כך שאם \( n>N^{\prime} \) אז \( \left|S_{n}-L\right|<\frac{\varepsilon}{2} \) (כלומר - באנו אל הטענה ש-\( S_{n} \) מתכנסת אל \( L \) ונתנו לה “אתגר” משלנו, עם \( \frac{\varepsilon}{2} \); היא ענתה לנו עם התשובה \( N^{\prime} \)). עכשיו נגדיר \( N=N^{\prime}+1 \). מה יצא לנו מזה? ניקח \( n>N \); זה אומר ש-\( n>N^{\prime} \) ובנוסף לכך גם \( n-1>N^{\prime} \), ולכן אנחנו מקבלים גם \( \left|S_{n}-L\right|<\frac{\varepsilon}{2} \) וגם \( \left|S_{n-1}-L\right|<\frac{\varepsilon}{2} \). וכעת הנה הקסם:

\( \left|a_{n}\right|=\left|S_{n}-S_{n-1}\right|=\left|\left(S_{n}-L\right)-\left(S_{n-1}-L\right)\right|\le \)

\( \le\left|S_{n}-L\right|+\left|S_{n-1}-L\right|<\frac{\varepsilon}{2}+\frac{\varepsilon}{2}=\varepsilon \)

עמדנו ביעד המקורי שלנו! שימו לב לטריקים שעשינו בהתחלה - הוספנו וחיסרנו \( L \) לביטוי שבתוך הערך המוחלט, והשתמשנו באי-שוויון המשולש כדי לפרק את הביטוי המסובך שבתוך הערך המוחלט לשני ביטויים שונים בערכים מוחלטים שתואמים בדיוק את מה שהיה נתון לנו. כאמור, הכל די סטנדרטי בחדו”א ואני אניח שאנחנו בסדר עם זה כי אני הולך לעשות את זה גם בהמשך.

סדרות של פונקציות

דיברנו על סדרות, ודיברנו על פונקציות. למה שלא נשלב את שני אלו? במקום לדבר על סדרה \( a_{0},a_{1},a_{2},\ldots \) של מספרים (איברים של \( \mathbb{R} \)) אפשר לדבר על סדרה \( f_{0}\left(x\right),f_{1}\left(x\right),f_{2}\left(x\right),\ldots \) של פונקציות, \( f_{n}\left(x\right):D\to\mathbb{R} \) שהתחום שלהן הוא תת-קבוצה כלשהי \( D\subseteq\mathbb{R} \) והטווח שלהן הוא \( \mathbb{R} \). עכשיו, אם יש לנו סדרה של פונקציות, אפשר לדבר על התכנסות שלה. עכשיו, כמו שסדרה של מספרים מתכנסת למספר, סדרה של פונקציות תתכנס לפונקציה \( f:D\to\mathbb{R} \).

אם ננסה לקחת את ההגדרה הרגילה של גבול של סדרה ולהשתמש בה פה, נקבל משהו כזה: נאמר שהסדרה \( \left\{ f_{n}\right\} _{n=0}^{\infty} \) מתכנסת אל \( f \) אם לכל \( \varepsilon>0 \) קיים \( N \) כך שלכל \( n>N \) מתקיים \( \left|f-f_{n}\right|<\varepsilon \). נשמע הגיוני? ובכן, זה אכן הגיוני אבל יש כאן משהו שלא הוגדר עד הסוף - ואם הולכים איתו עד הסוף מקבלים בעצם שלוש גישות שונות להגדרת גבול שכזה.

מה שלא ברור עד הסוף הוא מה הכוונה שלי בביטוי \( \left|f-f_{n}\right|<\varepsilon \). הרי הסימן \( \left|\cdot\right| \) (שני קווים אנכיים עם משהו בפנים) בא לתאר ערך מוחלט, שהוא משהו שמוגדר על מספרים, לא על פונקציות. קונספטואלית מה שאני רוצה פה הוא לדבר על המרחק בין \( f \) ובין \( f_{n} \) - כלומר להכניס לתמונה פונקצית מרחק חדשה, שונה מהערך המוחלט של מספרים ממשיים. יש תורה שלמה שעוסקת בדברים הללו; מה שבדרך כלל עושים הוא להגדיר נורמה, שהיא פונקציה שלוקחת איבר ומחזירה הערכה ל”גודל” שלו, ואז מגדירים מרחק על ידי הנורמה של ההפרש: \( \|f_{n}-f\| \). יש כל מני דרכים להגדיר נורמות של פונקציות וזה מוביל אותנו לתחום מרתק שנקרא אנליזה פונקציונלית ואני בשום פנים ואופן לא הולך לומר על כל זה שום דבר הפעם. זו פשוט לא ההגדרה שבה נתעסק.

הגישה האחרת שבה אפשר לנקוט היא להמשיך להשתמש בערך המוחלט “הרגיל”, על ידי כך שאנחנו משווים את הערכים ש-\( f_{n},f \) מחזירות. אלא שכאן אנחנו מתפצלים לשתי הגדרות שונות בהתאם לדקות הניסוח שלנו, ואני אציג את שתי ההגדרות בבת אחת כדי שיהיה קל לראות את הדקות הזו:

  • נאמר ש-\( f_{n} \) מתכנסת ("נקודתית") אל \( f \) אם לכל \( x\in D \), לכל \( \varepsilon>0 \) קיים \( N \) כך שאם \( n>N \) אז \( \left|f_{n}\left(x\right)-f\left(x\right)\right|<\varepsilon \)
  • נאמר ש-\( f_{n} \) מתכנסת במידה שווה (במ"ש) אל \( f \) אם לכל \( \varepsilon>0 \) קיים \( N \) כך שאם \( n>N \) אז \( \left|f_{n}\left(x\right)-f\left(x\right)\right|<\varepsilon \) לכל \( x\in D \)

מה ההבדל בין ההגדרות? המיקום של ה”לכל \( x \)”. צריך לחשוב על זה ככה: במקרה הראשון, כשנותנים לנו את האתגר של \( \varepsilon \) ואנחנו צריכים למצוא \( N \) עבורו, ה-\( N \) הזה צריך לעבוד רק עבור הערכים של הפונקציות ב-\( x \). זה בעצם אומר שלכל \( x\in D \), צריך להתקיים \( f\left(x\right)=\lim_{n\to\infty}f_{n}\left(x\right) \) כאשר כאן מה שיש לנו בגבול הוא סדרה של מספרים - הערכים שמקבלים כשמציבים את \( x \) בכל הפונקציות \( f_{n} \). לעומת זאת, במקרה השני באתגר של ה-\( \varepsilon \) אנחנו צריכים למצוא \( N \) שעובד עבור כל הערכים האפשריים של \( x \) בו זמנית. זה אתגר יותר גדול, ובאמת יש סיטואציות של סדרת פונקציות שמתכנסת אבל לא מתכנסת במידה שווה. בואו נראה דוגמא כזו - למרבה השמחה יש אחת פשוטה מאוד.

התחום שלנו יהיה \( D=\left[0,1\right] \) וסדרת הפונקציות תהיה \( f_{n}\left(x\right)=x^{n} \). עכשיו, אנחנו יודעים מחדו”א בסיסי שאם \( 0\le x<1 \) אז \( x^{n}\to0 \), אבל כמובן ש-\( 1^{n}\to1 \). כלומר, אם נגדיר \( f\left(x\right)=\lim_{n\to\infty}f_{n}\left(x\right) \) נקבל את הפונקציה

\( f\left(x\right)=\begin{cases} 0 & x\ne1\\ 1 & x=1 \end{cases} \)

האם \( f_{n} \) מתכנסת במידה שווה אל \( f \)? הנה טיעון טכני שמראה מה הבעיה, עם מספרים מהונדסים של מישהו שכבר יודע מה הוא מנסה להשיג וכל הכיף הרגיל של חדו”א: כדי להראות שאין התכנסות במ”ש אני אקח למשל \( \varepsilon=\frac{1}{e} \). ועכשיו נסתכל על \( N \) כלשהו ונראה שאפילו אם \( n>N \) אז עדיין לא לכל \( x\in D \) יתקיים \( \left|f_{n}\left(x\right)-f\left(x\right)\right|<\frac{1}{e} \). איך נראה את זה? אם \( x<1 \) אז \( \left|f_{n}\left(x\right)-f\left(x\right)\right|=\left|x^{n}-0\right|=\left|x^{n}\right|=x^{n} \). עכשיו, אין לנו שליטה על \( n \) אבל את \( x \) אנחנו יכולים להגדיל כרצוננו אל \( 1 \) עד שנעבור את \( \frac{1}{e} \). הנה האופן שבו אפשר למצוא \( x \) מתאים שכזה - בעזרת לוגריתמים. אני אחפש \( x \) שמקיים \( x^{n}=\frac{1}{e} \), כלומר \( \ln\left(x^{n}\right)=\ln\left(e^{-1}\right) \), כלומר \( n\ln x=-1\ln e=-1 \), כלומר \( \ln x=-\frac{1}{n} \). למרבה השמחה אני יודע ש-\( \ln x \) היא פונקציה מונוטונית עולה שמקיימת \( \lim_{x\to0}\ln x=-\infty \) ו-\( \ln1=0 \) ולכן קיים \( x\in D \) כך ש-\( \ln x=-\frac{1}{n} \), וה-\( x \) הזה שובר את הטענה על התכנסות במ”ש.

איך התכנסות במ"ש משמרת רציפות

הטיעון למעלה היה טכני למדי, אבל מה שנחמד הוא שאני לא באמת צריך אותו כי אפשר לראות ש-\( f_{n} \) לא מתכנסת במ”ש בקלות מתוך טענה כללית יותר ושימושית מאוד, שגם עוזרת לנו להבין מה הטעם בהגדרה הזו של התכנסות במ”ש. הטענה היא שאם כל \( f_{n} \) היא פונקציה רציפה ו-\( f_{n}\to f \) וההתכנסות היא במ”ש, אז גם \( f \) רציפה. זו דוגמא לסוג הטענות שמעניינות אותנו בכללי - אנחנו רוצים לומר משהו חכם על \( f \) אבל זה קשה לנו, אז אנחנו מוצאים סדרה פשוטה יחסית שמתכנסת אל \( f \) ועל האיברים שלה קל לנו יותר לומר משהו חכם, ואז מקווים ממש חזק שהמשהו החכם הזה יעבור מהסדרה אל \( f \) עצמה. במקרה שבו המשהו החכם הוא “רציפות” וההתכנסות היא במ”ש, זה גם עובד.

עבור הדוגמא שנתתי למעלה, \( f_{n}\left(x\right)=x^{n} \) היא בוודאי פונקציה רציפה, אבל \( f\left(x\right) \) שאליה הסדרה מתכנסת היא לא רציפה - היא 0 בכל מקום חוץ מ-\( x=1 \) ושם היא קופצת אל \( 1 \) - זו נקודת אי רציפות. לכן פשוט לא ייתכן שההתכנסות תהיה במ”ש; הרבה יותר פשוט מאשר להתחיל לערב בתמונה לוגריתמים וכדומה. בפועל? אנחנו מטאטאים את הסיבוך מתחת לשטיח עם הסתמכות על היכולת שלי לומר בקלילות ש-\( x^{n} \) “היא בוודאי פונקציה רציפה” - אם ננסה להוכיח את זה במפורש שוב נצטרך עבודה טכנית - אבל זה כל היופי, לבנות על הידע הטכני שכבר יש לנו ועל משפטים אבסטרקטיים כדי לקבל תוצאות טכניות חדשות בלי מאמץ טכני נוסף.

בואו נוכיח את הטענה: נתון לי ש-\( \left\{ f_{n}\right\} _{n=0}^{\infty} \) היא סדרה של פונקציות רציפות וש-\( f_{n}\to f \) בהתכנסות במ”ש, ואני צריך להוכיח ש-\( f \) רציפה. איך מוכיחים שמשהו הוא רציף? מתחילים כרגיל עם “יהא \( \varepsilon>0 \)” יחד עם נקודה ספציפית \( x_{0}\in D \). האתגר שלנו הוא למצוא \( \delta \) כך שלכל \( x\in D \) המקיים \( \left|x-x_{0}\right|<\delta \) מתקיים \( \left|f\left(x\right)-f\left(x_{0}\right)\right|<\varepsilon \). הנה האסטרטגיה שלנו: אנחנו נמצא פונקציה \( f_{n} \) שקרובה מספיק אל \( f \), ואז נשתמש בכך שהיא רציפה כדי לחסום את המרחק בין \( f_{n}\left(x\right),f_{n}\left(x_{0}\right) \) ונבנה על כך שהמרחקים של \( f_{n} \) בנקודות הללו מהנקודות המקבילות אצל \( f \) הם קטנים. כלומר, אנחנו צריכים ששלושה דברים יהיו קטנים:

  • \( \left|f_{n}\left(x\right)-f_{n}\left(x_{0}\right)\right| \)
  • \( \left|f_{n}\left(x\right)-f\left(x\right)\right| \)
  • \( \left|f_{n}\left(x_{0}\right)-f\left(x_{0}\right)\right| \)

מכיוון שיש לנו שלושה דברים שכפי שנראה בסוף איכשהו הכל יתבטא בסכום שלהם, שווה לנו לעבוד עם \( \frac{\varepsilon}{3} \). פורמלית, ניעזר בכך שההתכנסות \( f_{n}\to f \) היא במידה שווה, ונמצא \( N \) כך שלכל \( n>N \) ולכל \( x\in D \) מתקיים \( \left|f_{n}\left(x\right)-f\left(x\right)\right|<\frac{\varepsilon}{3} \). שימו לב שזה קריטי שזה יתקיים לכל \( x \) כי כרגע אין לנו בכלל ערך קונקרטי אחד של \( x \) שאנחנו רוצים לטפל בו - אנחנו נרצה לטפל בכל \( x \) שיהיה קרוב אל \( x_{0} \) עד כדי \( \delta \) (וה-\( \delta \) אפילו לא ידוע בשלב הזה). כלומר, בלי התכנסות במ”ש אין לי אפילו מאיפה להתחיל.

יופי, אז יש לנו \( n \) שעבורו \( \left|f_{n}\left(x\right)-f\left(x\right)\right|<\frac{\varepsilon}{3} \) לכל \( x\in D \). עכשיו נשתמש בכך ש-\( f_{n} \) רציפה בכל \( D \) ובפרט ב-\( x_{0}\in D \) כדי למצוא \( \delta \) בעל התכונה שאם \( \left|x-x_{0}\right|<\delta \) אז \( \left|f_{n}\left(x\right)-f_{n}\left(x_{0}\right)\right|<\frac{\varepsilon}{3} \). כלומר - השתמשנו בתכונת הרציפות תוך שה”אתגר” שאנחנו מציבים הוא עם \( \frac{\varepsilon}{3} \) (זו נקודה מבלבלת: כשאנחנו מוכיחים שרציפות מתקיימת, אנחנו מקבלים את האתגר ומחפשים \( \delta \) מתאים; כשאנחנו משתמשים ברציפות אנחנו נותנים את האתגר ומקבלים \( \delta \) מתאים).

עכשיו, יהא \( x\in D \) כלשהו שעבורו באמת מתקיים \( \left|x-x_{0}\right|<\delta \). אנחנו צריכים להוכיח \( \left|f\left(x\right)-f\left(x_{0}\right)\right|<\varepsilon \) ואת זה נעשה על ידי טכניקה סטנדרטית של חיבור/חיסור אותו איבר ואז פירוק הערך המוחלט לסכום של ערכים מוחלטים תוך שימוש באי-שוויון המשולש: טכניקות סטנדרטיות בחדו”א שלכל הפחות אני כבר מכיר מספיק טוב כדי ליהנות מהם ואני מקווה שזה המצב לא רק אצלי:

\( \left|f\left(x\right)-f\left(x_{0}\right)\right|=\left|f\left(x\right)-\left(f_{n}\left(x\right)-f_{n}\left(x\right)\right)-\left(f_{n}\left(x_{0}\right)-f_{n}\left(x_{0}\right)\right)-f\left(x_{0}\right)\right| \)

\( =\left|\left(f\left(x\right)-f_{n}\left(x\right)\right)+\left(f_{n}\left(x\right)-f_{n}\left(x_{0}\right)\right)+\left(f_{n}\left(x_{0}\right)-f\left(x_{0}\right)\right)\right| \)

\( \le\left|f\left(x\right)-f_{n}\left(x\right)\right|+\left|f_{n}\left(x\right)-f_{n}\left(x_{0}\right)\right|+\left|f_{n}\left(x_{0}\right)-f\left(x_{0}\right)\right| \)

\( \le\frac{\varepsilon}{3}+\frac{\varepsilon}{3}+\frac{\varepsilon}{3}=\varepsilon \)

מה שמסיים את ההוכחה הזו.

עד כמה התכנסות במ"ש משמרת אינטגרלים ונגזרות?

שני המושגים המרכזיים שהחדו”א עוסק בהם הם אינטגרלים (ספציפית, אינטגרל רימן) ונגזרות. על שניהם יש לי פוסטים כך שלא אגדיר אותם במפורש כאן אלא אשתמש רק במה שאני צריך. השאלה הבסיסית שלנו היא זו: נניח ש-\( f_{n}\to f \), האם זה אומר ש-\( \int_{a}^{b}f_{n}\to\int_{a}^{b}f \) עבור \( \left[a,b\right]\subseteq D \)? והאם זה אומר ש-\( f_{n}^{\prime}\to f^{\prime} \)? התשובה היא שהתכנסות במ”ש מבטיחה את המשפט לגבי האינטגרל, אבל לגבי הנגזרות… זה מסובך קצת יותר. אז בואו נתחיל עם האינטגרל.

ובכן, אני מניח ש-\( f_{n}\to f \) במ”ש ואני רוצה להוכיח \( \int_{a}^{b}f_{n}\to\int_{a}^{b}f \). איך מתחילים הוכחה כזו? האם הולכים להגדרת אינטגרל רימן, נאמר בעזרת הזוועה שנקראת “סכומי דארבו” ומתחילים לפרק את \( \left[a,b\right] \) לכל מני תת-חלוקות? לא… אנחנו בחדו”א, חבר’ה! מתחילים הכל כולל הכל קודם כל ב”יהי \( \varepsilon>0 \)” ואז כבר רואים איך להתקדם מזה! מה שאנחנו רוצים הוא להראות \( \int_{a}^{b}f_{n}\to\int_{a}^{b}f \), וזו התכנסות של סדרת מספרים; כלומר, לכל \( \varepsilon>0 \) אני צריך למצוא \( N \) כך שאם \( n>N \) אז \( \left|\int_{a}^{b}f\left(x\right)dx-\int_{a}^{b}f_{n}\left(x\right)dx\right|<\varepsilon \). בשביל להראות את זה אנחנו לא צריכים להיכנס לסכומי דארבו אבל כן צריכים כמה תכונות סטנדרטיות של אינטגרלים:

  • לינאריות של אינטגרל: \( \int_{a}^{b}f\left(x\right)dx+\int_{a}^{b}g\left(x\right)dx=\int_{a}^{b}\left[f\left(x\right)+g\left(x\right)\right]dx \)
  • אי שוויון המשולש האינטגרלי: \( \left|\int_{a}^{b}f\left(x\right)dx\right|\le\int_{a}^{b}\left|f\left(x\right)\right|dx \)
  • מונוטוניות של אינטגרל: אם \( f\left(x\right)\le g\left(x\right) \) ב-\( \left[a,b\right] \) אז \( \int_{a}^{b}f\left(x\right)dx\le\int_{a}^{b}g\left(x\right)dx \)
  • אינטגרל של קבוע: \( \int_{a}^{b}Adx=\left(b-a\right)\cdot A \)

יחד עם אלו, קל להתקדם: מכיוון ש-\( f_{n}\to f \) במ”ש, אז עבור \( \frac{\varepsilon}{b-a}>0 \) נמצא \( N \) כך שלכל \( n>N \) מתקיים \( \left|f_{n}\left(x\right)-f\left(x\right)\right|<\frac{\varepsilon}{b-a} \) לכל \( x\in D \) ובפרט לכל \( a\le x\le b \) (למה דווקא \( \frac{\varepsilon}{b-a} \)? אני מניח שאנחנו רגילים בשלב הזה לכך שאפשר קודם לנסות עבור \( \varepsilon^{\prime} \) כללי, לראות מה הערך שיוצא לנו טוב ואז לתקן רטרואקטיבית). עכשיו, בעזרת התכונות שציטטתי:

\( \left|\int_{a}^{b}f\left(x\right)dx-\int_{a}^{b}f_{n}\left(x\right)dx\right|=\left|\int_{a}^{b}\left[f\left(x\right)-f_{n}\left(x\right)\right]dx\right|\le \)

\( \le\int_{a}^{b}\left|f\left(x\right)-f_{n}\left(x\right)\right|dx\le\int_{a}^{b}\frac{\varepsilon}{b-a}=\left(b-a\right)\frac{\varepsilon}{b-a}=\varepsilon \)

מה שמסיים את ההוכחה עבור אינטגרלים (ליתר דיוק, עבור מה שנקרא “אינטגרל רימן”; אני לא אדבר על סוגים אחרים בפוסט הזה).

בואו נעבור לנגזרות. מה שהיינו רוצים שיקרה הוא שאם \( f_{n}\to f \) מתכנסת במ”ש, אז \( f_{n}^{\prime}\to f^{\prime} \) (התכנסות נקודתית). הבעיה היא שזה לא קורה. אני אתן דוגמא עוד מעט. זה קצת מתסכל, כי הרי יש לנו משפט דומה על אינטגרלים ונגזרת היא סוג של ההפך מאינטגרל, כפי שהמשפט היסודי של החדו“א מראה לנו, אבל זה בעצם העניין - מכיון שנגזרת היא “ההפך מאינטגרל”, אז כדי שהתוצאה החדשה תתאים למה שראינו על אינטגרלים צריך לא שהסדרה \( f_{n}\to f \) תתכנס במ”ש אלא שהסדרה \( f_{n}^{\prime}\to f^{\prime} \) תתכנס במ”ש.

בואו נחדד מה המשפט שאנחנו כן יודעים להוכיח: נניח ש-\( \left\{ f_{n}\right\} _{n=0}^{\infty} \) היא סדרת פונקציות גזירות על \( \left[a,b\right] \), ונניח גם שהנגזרות שלהם \( f_{n}^{\prime} \) הן אינטגרביליות על \( \left[a,b\right] \), ובנוסף לכך נניח ש-\( f_{n}\to f \) בהתכנסות נקודתית (לא צריך התכנסות במ”ש). עכשיו, בואו נניח ש-\( f_{n}^{\prime}\to g \) עבור \( g \) רציפה כלשהי בהתכנסות שהיא כן במ"ש, אז מה שאני יכול לומר הוא ש-\( f \) גזירה ו-\( f^{\prime}\left(x\right)=g \). אלו תנאים מסובכים למדי, אבל כשהם מתקיימים, המשפט הזה יכול להיות שימושי מאוד (כי בהחלט ייתכן שקל לנו לגזור את \( f_{n} \) ולהראות בקלות שהנגזרות מתכנסות במ”ש למשהו רציף, אפילו אם קשה לנו לגזור את \( f \) עצמה).

ההוכחה עצמה מאוד קלה, בהינתן אוסף התנאים שנתתי. ראשית, בואו נזכיר חלק ממה שהמשפט היסודי של החדו”א אומר: אם \( g\left(x\right) \) רציפה בקטע \( \left[a,b\right] \) אז הפונקציה \( G\left(x\right)=\int_{a}^{x}g\left(t\right)dt \) גזירה ומקיימת \( G^{\prime}\left(x\right)=g\left(x\right) \) בכל הקטע. אצלנו נתון ש-\( g \) אכן רציפה (בדיוק כדי שנוכל להשתמש בטענה הזו), אז מה שאנחנו רוצים להראות הוא ש-\( f\left(x\right) \) הוא \( G \) הזו עד כדי קבוע, כלומר \( f\left(x\right)=G\left(x\right)+C \). בואו נעשה את זה.

מכיוון ש-\( f_{n}^{\prime}\to g \) בהתכנסות במ”ש בתחום \( D=\left[a,b\right] \) אפשר לקחת \( x\in D \) שרירותי ולהשתמש במשפט על האינטגרל כדי להראות

\( \int_{a}^{x}f_{n}^{\prime}\left(t\right)dt\to\int_{a}^{x}g\left(t\right)dt \)

עכשיו, מה זה האינטגרל \( \int_{a}^{x}f_{n}^{\prime}\left(t\right)dt \)? כאן אנחנו משתמשים בנוסחת ניוטון-לייבניץ, שגם היא מסקנה מהמשפט היסודי: מכיוון ש-\( f_{n} \) היא פונקציה קדומה של \( f_{n}^{\prime} \) אז \( \int_{a}^{x}f_{n}^{\prime}\left(t\right)dt=f_{n}\left(x\right)-f_{n}\left(a\right) \) כלומר, אפשר גם לכתוב כך:

\( \int_{a}^{x}g\left(t\right)dt=\lim_{n\to\infty}\int_{a}^{x}f_{n}^{\prime}\left(t\right)dt \)

\( =\lim_{n\to\infty}\left(f_{n}\left(x\right)-f_{n}\left(a\right)\right)=f\left(x\right)-f\left(a\right) \)

כשבשורה האחרונה השתמשנו בהתכנסות הנקודתית של \( f_{n} \) אל \( f \).

אם כן, קיבלנו ש-\( G\left(x\right)=\int_{a}^{x}g\left(t\right)dt=f\left(x\right)-f\left(a\right) \) וזה בדיוק מה שרצינו: \( f\left(x\right)=G\left(x\right)+C \) כאשר \( C=f\left(a\right) \). זה מסיים את ההוכחה הזו, ומה שנשאר לנו לעשות הוא לראות דוגמא לכך שלא היינו יכולים ללכת על המשפט הפשוט יותר שהראיתי בהתחלה.

דרך פשוטה אחת ליצור דוגמא נגדית היא לקחת פונקציות “משוגעות”, כאלו שמשתנות בקצב מאוד מהיר ולכן הנגזרת שלהן בעייתית, אבל לכפול אותן בגורם “מרגיע” שיגרום לכך שהגודל שלהן שואף לאפס - זה נותן לנו סדרה שכל איבר בה הוא משוגע, אבל השגעונות הללו נעלמים כשעוברים לגבול.

סדרה אחת לדוגמא היא \( f_{n}\left(x\right)=\frac{1}{n}\sin\left(n^{2}x\right) \). כאן ה-\( \frac{1}{n} \) הוא הגורם המרגיע, אבל בתוך הסינוס יש לנו \( n^{2} \) ש”משגע” את הסינוס וגורם לכך שככל ש-\( n \) גדול יותר, הסינוס קופץ בין \( -1 \) ל-\( 1 \) בקצב גבוה יותר. העניין פה הוא שתמיד מתקיים \( \left|\sin\left(n^{2}x\right)\right|\le1 \) ולכן כש-\( n \) שואף לאינסוף \( f_{n}\left(x\right) \) שואפת לאפס במידה שווה: עבור \( \varepsilon>0 \) ניקח \( N=\frac{1}{\varepsilon} \) ונקבל שעבור \( n>N \) (ולכן \( \frac{1}{n}<\frac{1}{N} \)) לכל \( x \) מתקיים

\( \left|f_{n}\left(x\right)\right|=\frac{1}{n}\left|\sin\left(n^{2}x\right)\right|\le\frac{1}{n}<\frac{1}{N}=\varepsilon \)

מה שאומר ש-\( f_{n}\to0 \) ולכן אנחנו מצפים שיתקיים \( f_{n}^{\prime}\to0^{\prime}=0 \).

מה קורה בפועל? כשאני גוזר פונקציה בסדרה אני מקבל \( f_{n}^{\prime}\left(x\right)=\frac{1}{n}\cos\left(n^{2}x\right)\cdot n^{2}=n\cos\left(n^{2}x\right) \), ואם אני מציב \( x=0 \) אני מקבל \( f_{n}^{\prime}\left(0\right)=n \), כלומר \( f_{n}^{\prime}\left(0\right)\to\infty \) ובוודאי שהגבול הוא לא 0, כך שסדרת הנגזרות לא מתכנסת לנגזרת של גבול הסדרה המקורית. זה מסיים את הדוגמא הנגדית הזו.

טורים של פונקציות

כל מה שעשינו עד עכשיו התייחס לסדרות של פונקציות אבל כבר ראינו במקרה של סדרות של מספרים שהמעבר לטורים הוא כמעט מיידי. אם יש לנו סדרה של פונקציות \( u_{0}\left(x\right),u_{1}\left(x\right),u_{2}\left(x\right),\ldots \) אנחנו יכולים להגדיר פונקציות “סכום” \( f_{n}\left(x\right)=\sum_{k=0}^{n}u_{k}\left(x\right) \) ואז להגדיר את סכום הטור האינסופי של ה-\( u_{n} \)-ים בתור \( \sum_{n=0}^{\infty}u_{n}\left(x\right)=\lim_{n\to\infty}f_{n}\left(x\right) \). הדברים שראינו עבור סדרות של פונקציות עוברים אוטומטית בלי כמעט שום בעיה: יש לנו מושג של התכנסות במידה שווה של טור, שאומר שסדרת הסכומים החלקיים מתכנסת במידה שווה. אם טור של פונקציות רציפות מתכנס במידה שווה, אז הוא מתכנס לפונקציה רציפה (כי אם כל ה-\( u_{n} \)–ים רציפים אז גם כל \( f_{n} \) היא רציפה כי סכום סופי של פונקציות רציפות הוא פונקציה רציפה, ומכאן נשתמש בתוצאה על גבול של סדרות שכבר ראינו), והוא מקיים \( \int_{a}^{b}\sum_{n=0}^{\infty}u_{n}\left(x\right)=\sum_{n=0}^{\infty}\int_{a}^{b}u_{n}\left(x\right) \), כלומר אפשר “להחליף את סדר הסכום האינסופי והאינטגרל” - הכללה של תכונת הלינאריות של אינטגרל שעובדת עבור סכומים סופיים.

בנוסף יש לנו תוצאה דומה עבור נגזרות, שכפי שראינו דורשת תנאים קצת שונים: אם \( \sum_{n=0}^{\infty}u_{n} \) מתכנס נקודתית אל \( f \) ולכל \( u_{n} \) יש נגזרת אינטגרבילית \( u_{n}^{\prime} \) וטור הנגזרות \( \sum_{n=0}^{\infty}u_{n}^{\prime} \) מתכנס במ”ש, אז \( f^{\prime}=\sum_{n=0}^{\infty}u_{n}^{\prime} \), או בכתיב אחר - \( \left(\sum_{n=0}^{\infty}u_{n}\right)^{\prime}=\sum_{n=0}^{\infty}u_{n}^{\prime} \), כלומר אפשר להחליף את סדר הסכום האינסופי והנגזרת - הכללה של תכונת הלינאריות של נגזרת שעובדת עבור סכומים סופיים.

הנה דוגמא לאופן שבו משתמשים בזה. בפוסט שלי על בעיית איסוף הקופונים צץ באופן טבעי כחלק מהפתרון שלנו הסכום \( \sum_{n=0}^{\infty}nx^{n-1} \) שרצינו לחשב. מה שדי קופץ לעין כאן הוא שהאיבר הכללי של הסכום נראה כמו נגזרת: \( \left(x^{n}\right)^{\prime}=nx^{n-1} \). אז אני משתמש ב-\( \left(\sum_{n=0}^{\infty}u_{n}\right)^{\prime}=\sum_{n=0}^{\infty}u_{n}^{\prime} \) כדי “להוציא את הנגזרת החוצה”:

\( \sum_{n=0}^{\infty}nx^{n-1}=\sum_{n=0}^{\infty}\left(x^{n}\right)^{\prime}=\left(\sum_{n=0}^{\infty}x^{n}\right)^{\prime} \)

זה טוב, בגלל שיש לי את הנוסחה \( \sum_{n=0}^{\infty}x^{n}=\frac{1}{1-x} \) ואת הביטוי הזה קל לגזור: \( \left(\frac{1}{1-x}\right)^{\prime}=\frac{1}{\left(1-x\right)^{2}} \), מה שנותן לנו את התוצאה \( \sum_{n=0}^{\infty}nx^{n-1}=\frac{1}{\left(1-x\right)^{2}} \). אבל זה, כמובן, רק בתנאי שהתנאים של המשפט שלי מתקיימים: רק בתנאי שהטור \( \sum_{n=0}^{\infty}nx^{n-1} \) מתכנס, ושהטור \( \sum_{n=0}^{\infty}x^{n} \) מתכנס במ”ש. עכשיו, ברור שאם נציב \( x=1 \) ב-\( \sum_{n=0}^{\infty}x^{n} \) נקבל את הטור \( \sum_{n=0}^{\infty}1 \) שלא מתכנס בכלל, אז אני צריך מלכתחילה להגביל את עצמי לתחום \( \left|x\right|<1 \) - אבל גם בתחום הזה, איך אני יודע שהטורים מתכנסים?

ספציפית עבור שני הטורים שאני מדבר עליהם כאן יש תורה שלמה ומרתקת שמתעסקת בהתכנסות שלהם שאגיע אליה בפוסט הבא, אבל עוד לפני שנגיע לתיאוריה של טורים ספציפיים יש משפט מועיל במיוחד שצריך להזכיר פה: מבחן ה-M של ויירשטראס.

הרעיון במבחן ה-M הוא פשוט: בואו נמיר את שאלת ההתכנסות במ”ש של טור פונקציות שהיא מסובכת, בשאלת התכנסות של טור מספרים שגם היא מסובכת אבל פחות.

המשפט אומר כך: נניח שיש לנו את טור הפונקציות \( \sum_{n=0}^{\infty}u_{n} \) ויש סדרה \( \left\{ M_{n}\right\} _{n=0}^{\infty} \)של מספרים אי שליליים כך ש-\( \left|u_{n}\left(x\right)\right|\le M_{n} \) לכל \( x\in D \) (כשכזכור \( D \) הוא התחום שעליו כל ה-\( u_{n} \) מוגדרות) ואם בנוסף לזה מתקיים שהטור \( \sum_{n=0}^{\infty}M_{n} \) מתכנס (התכנסות רגילה של טורי מספרים) אז \( \sum_{n=0}^{\infty}u_{n} \) מתכנס במ”ש ב-\( D \).

איך מוכיחים את זה? ראשית צריך להראות ש-\( \sum_{n=0}^{\infty}u_{n} \) בכלל מתכנס אל משהו. ניקח \( x\in D \) כלשהו ונסתכל על טור המספרים \( \sum_{n=0}^{\infty}\left|u_{n}\left(x\right)\right| \). עכשיו נשלוף שני דברים מהתורה של סכומים אינסופיים של מספרים:

  • מבחן ההשוואה: אם \( 0\le a_{n}\le b_{n} \) לכל \( n \) והטור \( \sum_{n=0}^{\infty}b_{n} \) מתכנס, אז הטור \( \sum_{n=0}^{\infty}a_{n} \) מתכנס.
  • אם \( \sum_{n=0}^{\infty}\left|a_{n}\right| \) מתכנס אז \( \sum_{n=0}^{\infty}a_{n} \) מתכנס (התכנסות בהחלט של טור גוררת התכנסות שלו).

אצלנו \( 0\le\left|u_{n}\left(x\right)\right|\le M_{n} \) בשילוב עם ההתכנסות של \( \sum_{n=0}^{\infty}M_{n} \) ומבחן ההשוואה מראים שהטור \( \sum_{n=0}^{\infty}\left|u_{n}\left(x\right)\right| \) מתכנס (עבור \( x\in D \) ספציפי), ולכן \( \sum_{n=0}^{\infty}u_{n}\left(x\right) \) גם מתכנס. זה מאפשר לנו להגדיר פונקציה \( f\left(x\right)=\sum_{n=0}^{\infty}u_{n}\left(x\right) \) לכל \( x\in D \), ורק נשאר להראות ש-\( \sum_{n=0}^{\infty}u_{n} \) מתכנס במ”ש אל \( f \); כלומר, שאם נגדיר \( f_{n}\left(x\right)=\sum_{k=0}^{n}u_{k}\left(x\right) \) אז סדרת הפונקציות \( f_{n} \) מתכנסת במ”ש אל \( f \).

נוכיח את זה בצורה הרגילה: נאמר “יהא \( \varepsilon>0 \)” ועכשיו נרצה למצוא \( N \) כך שאם \( n>N \) אז \( \left|f\left(x\right)-f_{n}\left(x\right)\right|<\varepsilon \) לכל \( x\in D \). זה דורש חישוב די ישיר:

\( \left|f\left(x\right)-f_{n}\left(x\right)\right|=\left|\sum_{n=0}^{\infty}u_{n}\left(x\right)-\sum_{k=0}^{n}u_{k}\left(x\right)\right|= \)

\( =\left|\sum_{k=n+1}^{\infty}u_{k}\left(x\right)\right|\le\sum_{k=n+1}^{\infty}\left|u_{k}\left(x\right)\right|\le\sum_{k=n+1}^{\infty}M_{k} \)

עכשיו, מכיוון ש-\( \sum_{n=0}^{\infty}M_{n} \) מתכנס, הזנב של הטור שואף לאפס (כי אם סכום הטור הוא \( L \), הזנב הוא הסדרה \( L-S_{n} \) ומכיוון ש-\( S_{n}\to L \) הסדרה הזו שואפת לאפס), כלומר לכל \( \varepsilon>0 \) קיים \( N \) כך שאם \( n>N \) אז \( \left|\sum_{k=n+1}^{\infty}M_{k}\right|\le\varepsilon \), מה שמסיים את ההוכחה (כי ה-\( M_{k} \)-ים הם אי שליליים ולכן \( \left|\sum_{k=n+1}^{\infty}M_{k}\right|=\sum_{k=n+1}^{\infty}M_{k} \)).

אם כן, אלו התוצאות הכלליות שבדרך כלל מציגים בתחילת הדיון על הנושאים הללו. בפוסט הבא אני אקפוץ אל סוג ספציפי של טורי פונקציות, שגם מתנהגים יפה יותר מאשר במקרה הכללי, והם גם שימושיים בצורה יוצאת מן הכלל - טורי חזקות.


נהניתם? התעניינתם? אם תרצו, אתם מוזמנים לתת טיפ:

Buy Me a Coffee at ko-fi.com