נעים להכיר - סינוס וקוסינוס (גרסת המשוואה הדיפרנציאלית)

שרשרת הפוסטים הקודמים שלי, שהחלה ביום פאי, יועדה למטרה אחת - הגדרה של סינוס וקוסינוס באופן שהוא לחלוטין בלתי קשור לגאומטריה בשום צורה שהיא - ומכאן גם הכנסה של פאי למשחק המתמטי בדרך שהיא לחלוטין בלתי קשורה לגאומטריה בשום צורה שהיא. מנת הפתיחה שלי הייתה הגדרת פונקצית האקספוננט באופן בלתי גאומטרי שכזה, כשהמוטיבציה מגיעה מפתרון משוואות דיפרנציאליות; ובפוסט האחרון הגעתי למשוואה דיפרנציאלית שבה האקספוננט הממשי אינו מסוגל להועיל לנו עוד - המשוואה \( f^{\prime\prime}=-f \). זוהי נקודת המוצא למה שאעשה בפוסט הזה, שיהיה דומה למדי למה שעשיתי בפוסט על האקספוננט - נתחיל מכך שקיימים פתרונות למשוואה הזו, נחקור את תכונותיהם ובסוף נגיע למסקנה שאלו הם הסינוס והקוסינוס המוכרים לנו זה לא מכבר. חשוב להבהיר שמה שנעשה יהיה לצאת להרפתקאה בג’ונגל - זו לא הדרך הקצרה או הפשוטה ביותר, וגם לא רואים בה את הנוף באופן הטוב ביותר, וגם נשרטים כל הזמן מקוצים וענפים וצריך להיזהר מחיות טרף - אבל אני חושב שזו הרפתקאה טובה שכן היא מעניקה לנו נקודת מבט שונה וזרה על הנושא מזו שניתן לראות כאשר פוסעים בשבילים המוכרים.

ובכן, הבה וניגש לעבודה. כפי שאמרתי בפוסט הקודם, למשוואות דיפרנציאליות מסדר שני יש משפט קיום ויחידות שמבטיח למשוואה \( f^{\prime\prime}=-f \) קיים פתרון יחיד אם דורשים גם שני תנאי התחלה מהצורה \( f\left(0\right)=a,f^{\prime}\left(0\right)=b \) עבור \( a,b \) ממשיים כלשהם (תנאי ההתחלה לא חייב להיות באפס, אבל זה יהיה הכי נוח עבורנו). כתמיד, נרצה שתנאי ההתחלה יהיו פשוטים ככל הניתן; תנאי ההתחלה \( f\left(0\right)=f^{\prime}\left(0\right)=0 \) מניב בבירור את הפתרון \( f\left(x\right)=0 \) שאיננו מעניין, ולכן הנסיון הבא יהיה לקבוע את אחד מתנאי ההתחלה להיות 1. נאמר, \( f\left(0\right)=0,f^{\prime}\left(0\right)=1 \). משפט הקיום והיחידות מבטיח שקיימת פונקציה שעונה על תנאים אלו - בואו נסמן אותה בסימון הבלתי צפוי לחלוטין \( f \). ומה יקרה אם נבחר דווקא תנאי התחלה שב-\( 0 \) נותן לפונקציה 1, ולנגזרתה יתן \( 0 \)? אין שום בעיה - נסמן פתרון זה ב-\( g \). השלב הראשון בהרפתקאה שלנו יהיה להבין את הקשר שבין \( f \) ו-\( g \).

הבה ונתבונן רגע על הפונקציה \( f^{\prime} \). אמנם, הפונקציה הזו היא בראש ובראשונה הנגזרת של \( f \), אבל יש לה חיים משל עצמה. אם גוזרים אותה מקבלים את \( f^{\prime\prime} \), שכידוע שווה ל-\( -f \); ואם גוזרים אותה שוב, מקבלים את \( -f^{\prime} \). במילים אחרות, גם \( f^{\prime} \) מקיימת את המשוואה הדיפרנציאלית שממנה התחלנו. עם אילו תנאי התחלה היא מקימת אותם? ובכן, \( f^{\prime}\left(0\right)=1 \), כי כך קבענו את \( f \) מלכתחילה; ו-\( \left(f^{\prime}\right)^{\prime}\left(0\right)=f^{\prime\prime}\left(0\right)=-f\left(0\right)=0 \) - אבל אלו בדיוק תנאי ההתחלה של \( g \)! מכאן ש-\( f^{\prime}=g \). כבר צץ הקשר הראשון בין שני הפתרונות ה”מעניינים” של המשוואה עם תנאי ההתחלה הפשוטים ביותר שהצלחנו למצוא.

הצעד הבא פשוט: \( g^{\prime}=\left(f^{\prime}\right)^{\prime}=f^{\prime\prime}=-f \). כלומר, בעוד ש-\( g \) הייתה הנגזרת של \( f \), הרי ש-\( -f \) הוא הנגזרת של \( g \). שימו לב כמה מעט היינו צריכים להניח בשביל לקבל את “חוק הטבע” הזה ואת הא-סימטריה שטבועה בשתי הפונקציות הללו - האחת מניבה את חברתה, ואילו השניה מניבה את מינוס חברתה. לכן כל אחת מהפונקציות מעניינת בזכות עצמה ויש מקום לדבר על שתיהן בבת אחת.

עכשיו, משיש לנו מידע יותר מלא על מהן כל הנגזרות של \( f \) ו-\( g \), ניתן לבצע את אותו ניתוח שביצענו גם עבור אקספוננט - מציאת טורי הטיילור המתאימים לפונקציות. כזכור, עבור \( f \) טור הטיילור יהיה טור מהצורה \( \sum_{n=0}^{\infty}\frac{f^{\left(n\right)}\left(0\right)}{n!}x^{n} \). החישוב אינו מסובך במיוחד: \( f^{\left(0\right)}\left(0\right)=0 \) על פי הגדרה; \( f^{\left(1\right)}\left(0\right)=g\left(0\right)=1 \); \( f^{\left(2\right)}\left(0\right)=-f\left(0\right)=0 \); \( f^{\left(3\right)}\left(0\right)=-g\left(0\right)=-1 \); ואילו \( f^{\left(4\right)}=f \), ולכן הסדרה תתחיל לחזור על עצמה משם ואילך. במילים אחרות, סדרת הערכים שמתקבלת היא \( 0,1,0,-1,0,1,0,-1,\dots \) (להבדיל מאקספוננט, שבה היא הייתה פשוט \( 1,1,1,\dots \)). לכן הטור יהיה מהצורה \( x-\frac{x^{3}}{3!}+\frac{x^{5}}{5!}-\frac{x^{7}}{7!}+\dots \). ניתוח דומה עבור \( g \) מניב את הסדרה \( 1,0,-1,0,1,0,-1,0,\dots \) ולכן את הטור\( 1-\frac{x^{2}}{2!}+\frac{x^{4}}{4!}-\frac{x^{6}}{6!}+\dots \). כפי שניתן לראות, שני הטורים “משלימים” זה את זה; בפרט, אם נהפוך את סימני המינוס לפלוס ונחבר את הטורים, נקבל את הטור של \( e^{x} \). תופעה זו היא שמובילה לנוסחת אוילר, \( e^{i\theta}=\cos\theta+i\sin\theta \), אך דיה לצרה בשעתה.

כמובן, זה שכתבנו את טור הטיילור של \( f,g \) עדיין לא אומר שהטור אכן מתכנס אליהן - בשביל זה צריך לדבר על גודל השארית, כמו שעשיתי במקרה של אקספוננט. שם הראיתי שדי להצביע על כך שיש חסם על הערך שכל הנגזרות של \( \exp \)יכולות לקבל בתחום \( \left[0,x_{0}\right] \) כדי להוכיח שהטור מתכנס לפונקציה, וכדי לראות זאת פשוט שמנו לב לכך שגם כאשר גוזרים את \( \exp \) מקבלים אותה עצמה, ולכן חסם על \( \exp \) בתחום הזה (שקיים, כי היא רציפה והתחום סגור) מוביל לחסם על כל הנגזרות. אותו שיקול עובד גם כאן - אמנם, הנגזרת של \( f \) היא \( g \) ושל \( g \) היא \( -f \), אבל ניתן למצוא חסם על \( g,f \) “בו זמנית”, ולכן גם על כל נגזרותיהן. מסקנה: שני הטורים שכתבתי לעיל אכן מתארים נכונה את \( f,g \). לאלו מכם שמכירים את הטורים הללו כבר בתור הטורים של \( \sin \) ו-\( \cos \) כבר הגענו לקרקע יציבה כלשהי. עבור היתר מה שחשוב כאן הוא רק שמצאנו ביטוי “קונקרטי” לפונקציות הללו, שגם מאפשר לנו לחשב אותן אם נרצה.

נחזור כעת לציד תכונות מעניינות בג’ונגל, כשהמוטיבציה שלנו מגיעה ממה שאנחנו כבר יודעים על \( \sin \)ו-\( \cos \). הבה ונתבונן בפונקציה שמוגדרת על ידי \( h=f^{2}+g^{2} \). אם נגזור אותה, נקבל את הנגזרת \( h^{\prime}=2ff^{\prime}+2gg^{\prime}=2fg-2gf=0 \) - במילים אחרות, \( h \) היא פונקציה שנגזרתה היא זהותית אפס, ולכן היא פונקציה קבועה (זהו אחד מהמשפטים הבסיסיים בחשבון אינפיניטסימלי, וגם משפט ברור אינטואיטיבית - הרי נגזרת היא קצב השינוי של פונקציה, ואם קצב השינוי הזה הוא תמיד אפס, הפונקציה בהכרח קבועה). האם אנחנו יודעים לחשב את הערך הקבוע של \( h \)? ודאי - \( h\left(0\right)=f^{2}\left(0\right)+g^{2}\left(0\right)=0+1=1 \). מכאן ש-\( f^{2}\left(x\right)+g^{2}\left(x\right)=1 \) לכל \( x \). נראה מוכר? זה גם מניב דרך נוספת לבטא את \( g \) באמצעות \( f \): \( g=\pm\sqrt{1-f^{2}} \). זוהי דרך הצגה “רמאית” במובן מסויים כי איננו יודעים באמת את הערך של \( g\left(x\right) \) בהינתן \( f\left(x\right) \); אנחנו יודעים שהוא \( \pm\sqrt{1-f^{2}\left(x\right)} \) אבל איננו יודעים אם זהו הערך החיובי או השלילי. נצטרך לאמץ דרך שונה לתקוף את השאלה הזו.

שימו לב למה שנובע מהתכונה שכרגע ראינו - מכיוון ש-\( g,f \) הן פונקציות ממשיות ומוגדרות לכל \( x \), נובע מכך בהכרח שהערכים ששתיהן מחזירות מצויים תמיד בתחום \( \left[-1,1\right] \), כי במספרים ממשיים, \( f^{2}\left(x\right)+g^{2}\left(x\right)=1 \) מכריח את \( f\left(x\right),g\left(x\right) \) להיות קטנים או שווים ל-1 אחרת אחד מהם יהיה חייב להיות מספר מרוכב. יותר מכך - \( f,g \) רוקדות מעין “ריקוד” יחדיו - כאשר אחת גדולה (בערכה המוחלט), השניה חייבת להיות קטנה. האופן שבו הן משתלבות זו בזו ב”ריקוד” הזה והעובדה שהריקוד הוא מחזורי היא היעד המרכזי שלנו - אבל לצורך כך יש עוד תכונות שעלינו להיווכח בהן.

כל מי שהיה תלמיד תיכון ודאי זוכר את הנוסחאות המפלצתיות עבור \( \sin\left(x+y\right) \) ו-\( \cos\left(x+y\right) \). הבה וננסה לגזור נוסחאות שכאלו עבור \( f,g \) באמצעות הכלים שיש לנו עד כה (דהיינו, בלי שום גאומטריה). לצורך כך הבה וניזכר במשהו מהפוסט הקודם - אמרתי שבהינתן משוואה דיפרנציאלית מסדר שני (בלי מקדם חופשי) ושני פתרונות “בלתי תלויים” עבורה, אפשר לבנות כל פתרון אחר כצירוף לינארי של שני הפתרונות הללו, כשהמקדמים נקבעים על פי תנאי ההתחלה. כפי שניתן לנחש, \( f,g \) הם שני פתרונות “בלתי תלויים” שכאלו, ונראה זאת במפורש. נניח אם כן כי \( h \) היא פונקציה אשר מקיימת \( h^{\prime\prime}=-h \) וכמו כן \( h\left(0\right)=a \) ו-\( h^{\prime}\left(0\right)=b \). כעת נתבונן בפונקציה \( bf+ag \); בבירור אם נציב בה 0 נקבל \( a \) (כי \( f \) יתאפס ואילו \( g \) יהפוך ל-1). אם נגזור אותה, נקבל \( bf^{\prime}+ag^{\prime}=bg-af \), וכשמציבים 0 בנגזרת זו מקבלים בבירור את \( b \). כמו כן ברור כי \( bf+ag \) מקיימת את המשוואה הדיפרנציאלית המקורית שכן היא צירוף לינארי של \( f,g \). מסקנה ממשפט הקיום והיחידות? \( h=bf+ag \).

בואו ניקח כעת \( y \) ממשי כלשהו, ונגדיר פונקציה חדשה: \( h\left(x\right)=f\left(x+y\right) \). מכללי הגזירה הסטנדרטיים עולה ש-\( h^{\prime\prime}\left(x\right)=f^{\prime\prime}\left(x+y\right)=-f\left(x+y\right)=-h\left(x\right) \), כך שאת \( h \) אפשר לייצג כצירוף לינארי של \( f,g \). מהם המקדמים? \( a=h\left(0\right)=f\left(y\right) \), ו-\( b=h^{\prime}\left(0\right)=f^{\prime}\left(y\right)=g\left(y\right) \). מסקנה: \( f\left(x+y\right)=f\left(x\right)g\left(y\right)+g\left(x\right)f\left(y\right) \). נראה מוכר? באופן דומה אפשר להראות כי \( g\left(x+y\right)=g\left(x\right)g\left(y\right)-f\left(x\right)f\left(y\right) \). אני מאוד אוהב את ההוכחה הזו כי היא נותנת תובנה יפה על הנוסחאות הללו - הן לא סתם ערב רב של סינוסים וקוסינוסים שהושלכו באקראי, אלא צירוף לינארי של \( \sin x,\cos x \) כשהמקדמים מבוססים על \( \sin y,\cos y \).

מכאן הדרך להוכחה ש-\( f,g \) מחזוריות קצרה יחסית, אבל עדיין יש צעד מרכזי אחד שטרם ביצענו - עלינו להראות כי \( g \) מתאפסת היכן שהוא. הבה נניח בשלילה כי \( g\left(x\right)>0 \) לכל \( x\ge0 \) (עבור \( x=0 \) אנו יודעים כי זה נכון: \( g\left(0\right)=1 \)). מכיוון ש-\( f^{\prime}=g \), נובע מכך ש-\( f \) היא מונוטונית עולה עבור \( x\ge0 \), דהיינו \( f\left(x\right)>0 \) לכל \( x>0 \). כעת, מכיוון ש-\( g^{\prime}=-f \), עולה מכך כי \( g \) היא מונוטונית יורדת לכל \( x>0 \). עד כאן, שום דבר מפתיע - זהו בדיוק ה”ריקוד” של \( f,g \) שעליו דיברתי - כשהאחת עולה, השנייה יורדת. האינטואיציה כאן היא שקצב הירידה של \( g \), אם היא אינה מתאפסת אף פעם, חייב להתמתן עוד ועוד עם הזמן. קצב הירידה הזה הוא נגזרתה של \( g \), כלומר \( -f \), ולכן הטענה היא שהערך של \( -f \) חייב לגדול עם הזמן (הוא שלילי כל הזמן, ולכן כשאני אומר שהוא “גדל”, הכוונה היא דווקא לכך שערכו המוחלט קטן - בהתחלה הוא \( -1 \), אחר כך \( -0.5 \) וכן הלאה). אלא שהערך של \( -f \) בתחילת ה”ריקוד” היה 0, ולכן הסיטואציה חייבת להיות כזו: ראשית ערכו של \( -f \) קטן, ואז פתאום המצב “מתהפך” וערכו מתחיל “לגדול”. בפרט זה אומר שיש ל-\( -f \)נקודת מינימום בריקוד הזה, אבל משפט בסיסי מחשבון אינפיניטסימלי אומר שבנקודת המינימום הזו הנגזרת של \( -f \) תתאפס - ונגזרת זו היא בדיוק \( -g \)…

למרות שהטיעון הזה נשמע חצי נפנוף-ידיימי, הוא למעשה מאוד קונקרטי ולא נדרשת הרבה עבודה כדי לפרמל אותו לגמרי. השורה התחתונה היא מה שמעניין אותנו - קיימת נקודה \( t>0 \) כך ש-\( g\left(t\right)=0 \), ו-\( t \) הוא הערך הקטן ביותר שגדול מ-0 שמקיים זאת. מהו ערכה של \( f \) בנקודה זו? ובכן, \( f\left(t\right)=\pm\sqrt{1-g^{2}\left(t\right)}=\pm1 \). אלא שלא ייתכן ש-\( f \) שלילי בנקודה זו, כי ב-0 התקיים \( f\left(0\right)=0 \) ומאותו רגע והלאה \( g \) - הנגזרת של \( f \) - הייתה חיובית (כי \( t \) הנקודה המינימלית שבה \( g \) מתאפסת), ולכן \( f \) רק עלתה. מכאן ש-\( f\left(t\right)=1 \). כעת אפשר להגיע למסקנה מעניינת מאוד: \( f\left(x+t\right)=f\left(x\right)g\left(t\right)+g\left(x\right)f\left(t\right)=g\left(x\right) \). במילים אחרות, \( g \) מתנהגת בדיוק כמו \( f \), פרט לכך שהיא “מקדימה” אותה בדיוק ב-\( t \) “צעדים” (כלומר, אם נזיז את הגרף של \( f \) \( t \) יחידות ימינה, הוא יזדהה עם הגרף של \( g \)).

כעת הניתוח נעשה פשוט בהרבה. מה קורה לפונקציות בקטע \( \left[t,2t\right] \)? בתחילתו, כזכור, \( g\left(t\right)=0 \) ואילו \( f\left(t\right)=1 \). מכיוון ש-\( f \) מתנהגת בקטע הזה כמו ש-\( g \) התנהגה בקטע \( \left[0,t\right] \) הרי ש-\( f \) פשוט תרד עד ל-\( 0 \): \( f\left(2t\right)=0 \). בזמן הזה \( g \) היא בעלת נגזרת שלילית לכל אורך הדרך (כי הנגזרת שלה היא \( -f \) ו-\( f \) הרי חיובית בקטע זה) ולכן \( g \) תהיה מונוטונית יורדת בכל הקטע. עד להיכן היא תרד? כאן אפשר להשתמש בנוסחת הסכום: \( g\left(2t\right)=g^{2}\left(t\right)-f^{2}\left(t\right)=-1 \). אם כן, הריקוד ממשיך - בקטע מ-\( t \) אל \( 2t \), שתי הפונקציות יורדות מטה מרחק של יחידה אחת.

ומה קורה ב-\( \left[2t,3t\right] \)? ובכן, \( f \) כרגיל מחקה את \( g \): יורדת עד ל-\( -1 \) (\( f\left(3t\right)=-1 \)). על כן הנגזרת של \( g \) היא חיובית בכל הקטע ולכן \( g \) עולה בכל הקטע ומגיעה עד ל-0, שהרי \( g\left(3t\right)=g\left(2t\right)g\left(t\right)-f\left(2t\right)f\left(t\right)=0-0=0 \).

ולבסוף, בקטע \( \left[3t,4t\right] \) \( f \) ממשיכה לחקות את \( g \) ועולה בעצמה ל-0, ואילו \( g \) ממשיכה לעלות (כי נגזרתה חיובית) ומגיעה עד ל-1: \( g\left(4t\right)=g^{2}\left(2t\right)-f^{2}\left(2t\right)=1 \). זה אומר שב-\( 4t \) חזרנו להתחלה - שוב \( f \) מאופסת ו-\( g \) מחזירה 1. מזה נובע מיידית ש-\( 4t \) הוא מחזור של שתי הפונקציות הללו: \( f\left(x+4t\right)=f\left(x\right)g\left(4t\right)+f\left(4t\right)g\left(x\right)=f\left(x\right) \), ובדומה \( g\left(x+4t\right)=g\left(x\right)g\left(4t\right)-f\left(x\right)f\left(4t\right)=g\left(x\right) \) - וזה נכון לכל \( x \), כולל השליליים. הוכחנו (בלי שום גאומטריה) את המחזוריות של \( f,g \). יותר מכך - המעקב המדוקדק שלנו אחרי ההתנהגות של \( f,g \) מעלה שהסיטואציה הזו (\( f \) מקבלת 0, \( g \) מקבלת 1) התרחשה לראשונה ב-\( 4t \) לאחר ההתרחשות שלה ב-0, ומכאן ש-\( 4t \) הוא המחזור המינימלי של שתי הפונקציות הללו.

זהו - הוכחנו כרגע את התכונה החשובה ביותר של שתי הפונקציות. שימו לב כמה אנחנו כבר יכולים לומר: למשל, מניתוח ההתנהגות שביצענו ל-\( f \) ברור כי היא מתאפסת רק בערכים מהצורה \( k\cdot2t \) עבור \( k \) שלם; לכן אם נשתמש בהוכחה של אוילר לחישוב \( \sum\frac{1}{n^{2}} \) שהצגתי בעבר, נקבל שהסכום הזה הוא \( \frac{\left(2t\right)^{2}}{6} \). במילים אחרות, הצלחנו לחשב את סכום הטור בלי שום גאומטריה. זו נקודה טובה לעצור ולהודות באמת: \( f\left(x\right) \) הוא פשוט שם מיתמם ל-\( \sin\left(x\right) \), \( g\left(x\right) \) הוא שם מיתמם ל-\( \cos\left(x\right) \), ואילו \( \pi=2t \). אך לא ניתן לעשות זאת “סתם”, שהרי \( \sin\left(x\right),\cos\left(x\right),\pi \) כולם יצורים גאומטריים ואי אפשר “להשתלט” עליהם ככה בלי להגיד כלום על גאומטריה. לכן, אם מתעקשים, אפשר להיפגש באמצע - עם קצת אנליזה (והגבול \( \lim_{x\to0}\frac{\sin x}{x}=1 \) והוכחתו הגאומטרית הידועה לשמצה) אפשר להראות כי \( \sin^{\prime}\left(x\right)=\cos\left(x\right) \) ו-\( \cos^{\prime}\left(x\right)=-\sin\left(x\right) \) ומכאן חיש קל אפשר להראות ש-\( \sin,\cos \) הם הפתרונות למשוואה הדיפרנציאלית שעליה דיברתי. האם יש דרך אחרת? ובכן, אפשר להגדיר את \( \sin,\cos \) בצורה מעט שונה מהצורות שאנו מכירים - צורה שהיא מעין פשרה בין ההגדרה הגאומטרית ובין ההגדרות האנליטיות, ומשתמשת בפונקציה אנליטית המתארת שטח של עיגול. הניתוח של הפונקציה הזו כולל קצת אינפי “מלוכלך”, ואיני רוצה להיכנס אליו כעת; אבל גם בו היעד המרכזי שמגיעים אליו, שהחל ממנו הכל ממשיך כרגיל, הוא נוסחאות הגזירה של סינוס וקוסינוס. דבר זה מראה כי במובן מסויים, הגישה שאני הצגתי היא ה”ישירה” ביותר, שכן ממנה נוסחאות הגזירה נובעות בצורה מיידית לחלוטין.

בפוסט הבא אפרע את החוב מהפוסט הקודם - אראה כיצד נפתרת בעזרת סינוס וקוסינוס המשוואה הדיפרנציאלית הכללית שהצגתי, ואכניס לתמונה סוף סוף את נוסחת אוילר.

נהניתם? התעניינתם? אם תרצו, אתם מוזמנים לתת טיפ: