היה זה תענוג לגזור

באחד הפוסטים הקודמים הצגתי את מושג הנגזרת, אך כל מה שעשיתי היה להציג את ההגדרה הפורמלית; אם כל מה שיש לנו הוא את ההגדרה הזו, אנחנו עדיין לא יכולים לעשות הרבה. בפוסט הזה אני רוצה להציג את הכלים והתוצאות הבסיסיות על חישוב פרקטי של נגזרות, כדי לשכנע אתכם בשני דברים: ראשית, שחישוב נגזרות הוא אכן פרקטי; ושנית, שהוא ממש כיף. אנחנו יוצאים להרפתקאה בג’ונגל כשאנחנו חמושים רק במספריים, ומסתבר שנוכל לפלס לעצמנו את דרך המלך באופן הזה.

אם כן, כזכור, הגדרתי נגזרת עבור פונקציות ממשיות, \( f:\mathbb{R}\to\mathbb{R} \), באופן הבא: \( f^{\prime}\left(x_{0}\right)=\lim_{h\to0}\frac{f\left(x_{0}+h\right)-f\left(x_{0}\right)}{h} \). הנגזרת הוגדרה באופן “נקודתי” - בהינתן נקודה \( x_{0} \) מצאנו את ערך הנגזרת של הפונקציה בנקודה הזו. עם זאת, מה שאנחנו באמת רוצים הוא נגזרת “גלובלית” - בהינתן נוסחה עבור הפונקציה \( f \), להסיק ממנה נוסחה עבור הפונקציה \( f^{\prime} \). זה מה שנעשה בפוסט הזה.

בואו נתחיל ישר מללכלך את הידיים עם פונקציה פשוטה לדוגמה: \( f\left(x\right)=x^{n} \). כאן אפשר לחשב את הנגזרת לכל \( x_{0} \) ישירות מתוך הגדרת הנגזרת, תוך שימוש בבינום של ניוטון: \( \left(x_{0}+h\right)^{n}=x_{0}^{n}+n\cdot x_{0}^{n-1}h+\sum_{i=2}^{n}{n \choose i}x_{0}^{n-i}h^{i} \). הסכום המפחיד באגף ימין אינו כל כך חשוב - כל מה שחשוב בו הוא שהוא מתחלק ב-\( h^{2} \). מדוע? כי כעת, מהו \( \frac{f\left(x_{0}+h\right)-f\left(x_{0}\right)}{h} \), לכל נקודה \( x_{0} \) שרק תרצו? ובכן, \( f\left(x_{0}+h\right)=\left(x_{0}+h\right)^{n} \) ואילו \( f\left(x_{0}\right)=x_{0}^{n} \) ולכן לאחר ביצוע החיסור של שניהם נקבל במונה \( n\cdot x_{0}^{n-1}h+\sum_{i=2}^{n}{n \choose i}x_{0}^{n-i}h^{i} \). אחרי חלוקה ב-\( h \) נקבל \( n\cdot x_{0}^{n-1}+\sum_{i=2}^{n}{n \choose i}x_{0}^{n-i}h^{i-1} \) - ושימו לב, הסכום שבאגף ימין עדיין מתחלק ב-\( h \), כלומר אפשר לחשוב עליו בתור “\( h \) כפול משהו”. אבל עכשיו אנו משאיפים את \( h \) לאפס, וזה גורם לסכום להיעלם (כי הדבר היחיד בו שמשתנה הוא \( h \) השואפת לאפס). נשארנו עם \( n\cdot x_{0}^{n-1} \). זה מוביל אותנו לנוסחה הכללית: אם \( f\left(x\right)=x^{n} \) אז \( f^{\prime}\left(x\right)=nx^{n-1} \). בפרט שימו לב שהנגזרת של \( f\left(x\right)=x \) היא \( f^{\prime}\left(x\right)=1 \) ושהנגזרת של פונקציה קבועה - \( f\left(x\right)=c=c\cdot x^{0} \) - היא \( f^{\prime}\left(x\right)=0 \) (התוצאה הזו מתאימה לאינטואיציה שלנו - אם ערך הפונקציה קבוע אז הפונקציה מתארת “עמידה במקום”, כך שהמהירות של הפונקציה היא אפס).

בפני עצמה התוצאה הזו אולי לא עד כדי כך מעניינת, אך בשילוב עם תכונה נוספת של הנגזרת, התוצאה הזו נותנת לנו את הנגזרת של כל הפולינומים (שכפי שהזכרתי כאן בעבר, הן אולי הפונקציות המעניינות הבסיסיות ביותר). מהי התכונה? מה שמכונה הלינאריות של הנגזרת, וניתן לתאר בפשטות כך: אם \( f,g \) הן שתי פונקציות גזירות (כלומר, יש להן נגזרת בכל נקודה בתחום שמעניין אותנו), אז \( \left(f+g\right)^{\prime}=f^{\prime}+g^{\prime} \). כמו כן, אם \( c \) הוא מספר ממשי קבוע, אז \( \left(cf\right)^{\prime}=cf^{\prime} \). במילים: נגזרת של סכום היא סכום הנגזרות, ונגזרת של \( f \)-כפולה-בקבוע היא הנגזרת של \( f \) כשהיא (הנגזרת) מוכפלת באותו קבוע. מכאן מגיעים מיידית לנוסחה הבאה: \( \left(\sum_{k=0}^{n}a_{k}x^{k}\right)^{\prime}=\sum_{k=1}^{n}k\cdot a_{k}x^{k-1} \). ההוכחה של תכונת הלינאריות היא עסק מיידי אם כבר יש לנו את התכונה הדומה עבור גבולות; מתקיים:

\( \left(f+g\right)^{\prime}\left(x_{0}\right)=\lim_{h\to0}\frac{\left(f+g\right)\left(x_{0}+h\right)-\left(f+g\right)\left(x_{0}\right)}{h}=\lim_{h\to0}\frac{f\left(x_{0}+h\right)+g\left(x_{0}+h\right)-f\left(x_{0}\right)-g\left(x_{0}\right)}{h} \)

\( =\lim_{h\to0}\frac{f\left(x_{0}+h\right)-f\left(x_{0}\right)}{h}+\lim_{h\to0}\frac{g\left(x_{0}+h\right)-g\left(x_{0}\right)}{h}=f^{\prime}\left(x_{0}\right)+g^{\prime}\left(x_{0}\right) \)

הוכחה דומה עובדת גם עבור כפל בקבוע. המעבר היחיד כאן שהוא מתוחכם הוא הפירוק של הגבול האחד לשני גבולות - זה דורש הצדקה לא טריוויאלית, אך גם לא קשה במיוחד.

המזל שלנו לא נגמר כאן. מסתבר שקל לחשב גם את הנגזרת של מכפלת פונקציות: \( \left(fg\right)^{\prime}=f^{\prime}g+fg^{\prime} \). איך מגיעים לנוסחה הזו? שוב, על פי הגדרה:

\( \left(fg\right)^{\prime}\left(x_{0}\right)=\lim_{h\to0}\frac{\left(fg\right)\left(x_{0}+h\right)-\left(fg\right)\left(x_{0}\right)}{h}=\lim_{h\to0}\frac{f\left(x_{0}+h\right)g\left(x_{0}+h\right)-f\left(x_{0}\right)g\left(x_{0}\right)}{h} \)

כאן אנחנו לכאורה נתקעים כי לא ברור איך אפשר לפשט את הנוסחה עוד; אבל אז נחלץ לעזרתנו טריק שימושי מאוד במתמטיקה - לחבר ולהחסיר את אותו איבר. אם אנחנו רוצים להחסיר מ-\( f\left(x_{0}+h\right)g\left(x_{0}+h\right) \) איבר כך שנקבל בסופו של דבר משהו שנראה כמו הנגזרת של \( f \), מה עלינו להחסיר? די בבירור זה חייב להיות \( f\left(x_{0}\right)g\left(x_{0}+h\right) \), כי \( f\left(x_{0}\right) \) הוא הגורם שחסר לנו כדי לקבל משהו שנראה כמו נגזרת של \( f \), ו-\( g\left(x_{0}+h\right) \) הוא הגורם המשותף שאנחנו רוצים להוציא כדי להישאר רק עם \( f \) בסוגריים.

בקיצור, אחרי חיסור וחיבור של האיבר הזה, אנו מקבלים את:

\( \lim_{h\to0}\frac{f\left(x_{0}+h\right)g\left(x_{0}+h\right)-f\left(x_{0}\right)g\left(x_{0}+h\right)+f\left(x_{0}\right)g\left(x_{0}+h\right)-f\left(x_{0}\right)g\left(x_{0}\right)}{h} \)

\( =\lim_{h\to0}\frac{g\left(x_{0}+h\right)\left(f\left(x_{0}+h\right)-f\left(x_{0}\right)\right)+f\left(x_{0}\right)\left(g\left(x_{0}+h\right)-g\left(x_{0}\right)\right)}{h} \)

ואת זה ניתן לפשט עוד קצת עם כללי הכפל והחיבור של גבולות. למשל, ברור ש-\( \lim_{h\to0}\frac{f\left(x_{0}\right)\left(g\left(x_{0}+h\right)-g\left(x_{0}\right)\right)}{h}=f\left(x_{0}\right)g^{\prime}\left(x_{0}\right) \). הבעיה היא דווקא במחובר הראשון, שעבורו קל לראות ש-\( \lim_{h\to0}\frac{g\left(x_{0}+h\right)\left(f\left(x_{0}+h\right)-f\left(x_{0}\right)\right)}{h}=f^{\prime}\left(x_{0}\right)\cdot\lim_{h\to0}g\left(x_{0}+h\right) \), אבל מהו \( \lim_{h\to0}g\left(x_{0}+h\right) \)? היינו רוצים להגיד שאפשר פשוט להציב \( h=0 \) ולקבל \( g\left(x_{0}\right) \), אבל זה נכון רק אם הפונקציה \( g \) רציפה ב-\( x_{0} \)…

ובכן, יש לנו מזל, כי משפט בסיסי בחדו”א הוא שכל פונקציה שגזירה בנקודה כלשהי גם רציפה בה. לא אוכיח אותו פורמלית אלא אתן אינטואיציה פשוטה: אם \( \lim_{h\to0}g\left(x_{0}+h\right)\ne g\left(x_{0}\right) \) אז \( \lim_{h\to0}\left(g\left(x_{0}+h\right)-g\left(x_{0}\right)\right)\ne0 \), אבל אז הגבול \( \lim_{h\to0}\frac{g\left(x_{0}+h\right)-g\left(x_{0}\right)}{h} \) אינו קיים בכלל שכן המונה שואף לקבוע, ואילו המכנה שואף לאפס, ולכן הגבול שואף לאינסוף (יותר גרוע אפילו - לאינסוף ולמינוס אינסוף, כתלות בשאלה אם \( h \) חיובי או שלילי). מכאן שכדי שהנגזרת תהיה קיימת הפונקציה חייבת להיות רציפה: הערך של \( g\left(x_{0}+h\right) \) מתקרב לערך של \( g\left(x_{0}\right) \), וכל השאלה שעליה עונה הנגזרת היא כמה מהר ההתקרבות הזו מתבצעת.

סיכום ביניים: אם אנחנו יודעים את הנגזרות של \( f \) ושל \( g \) אנחנו יודעים גם את הנגזרות של \( f+g \) ושל \( f\cdot g \) (כפל בסקלר הוא מקרה פרטי של כפל בפונקציה - סקלר הוא פונקציה קבועה). זה כבר נותן לנו הרבה כוח, כי פונקציות רבות ניתנות לתיאור באמצעות חיבור וכפל (למעשה, אפשר למצוא את הנגזרת של \( f\left(x\right)=x^{n} \) גם בעזרת נוסחה זו בלבד, תוך ביצוע אינדוקציה והסתמכות על הידע שהנגזרת של \( f\left(x\right)=x \) היא \( 1 \), מה שקל מאוד להוכיח מההגדרה; אבל אני חושב שההוכחה הכללית נחמדה יותר ולכן הבאתי אותה). אלא שעדיין לא הצגתי את מה שנותן לנו את הכי הרבה כוח: יש נוסחה גם עבור נגזרת של הרכבה של פונקציות. וכאן אולי כדאי להסביר למה אני מתכוון.

בואו נסתכל שניה על הפונקציה \( f\left(x\right)=x^{2}+3x \). וכעת בואו ונסתכל על הפונקציה \( h\left(x\right)=\sin^{2}x+3\sin x \). אלו שתי פונקציות שונות, אבל מאוד דומות באופיין: נראה כאילו \( h\left(x\right) \) היא מה שמתקבל מ-\( f\left(x\right) \) אם במקום \( x \) “מציבים” את \( \sin x \). אם כן, אפשר לסמן \( h\left(x\right)=f\left(\sin x\right) \). בדרך קצת יותר מסודרת נוכל להגדיר פונקציה \( g\left(x\right)=\sin x \) ואז יש הגיון בסימון \( h\left(x\right)=f\left(g\left(x\right)\right) \). לדבר הזה - \( f\left(g\left(x\right)\right) \) - קוראים הרכבה של \( f \) על \( g \) ומסמנים אותו ב-\( f\circ g \) לפעמים (ולפעמים ב-\( g\circ f \) כדי לבלבל סטודנטים, כתלות בהקשר ובספר הלימוד - זו הסיבה שבגללה אני נמנע משימוש בסימון הזה). הרכבה היא כלי רב עוצמה מאוד לבנייה של פונקציות מסובכות מתוך פונקציות פשוטות, והעובדה שיש לנו נוסחה פשוטה עבור נגזרת של הרכבת פונקציות היא לא פחות מנס. הנוסחה, שמכונה “כלל השרשרת”, היא \( \left[f\left(g\left(x\right)\right)\right]^{\prime}=f^{\prime}\left(g\left(x\right)\right)\cdot g^{\prime}\left(x\right) \). במילים - גוזרים את \( f \), ממשיכים להציב בה את \( g\left(x\right) \) כמקודם, ובנוסף לכך כופלים את הכל בנגזרת של \( g\left(x\right) \) (זו אינה מכפלת הנגזרת של \( f \) בנגזרת של \( g \) מכיוון שאת \( f^{\prime} \) מחשבים בנקודה \( g\left(x\right) \) בעוד שאת \( g^{\prime} \) מחשבים בנקודה \( x \) - כלומר, הן לא מחושבות באותה הנקודה).

דוגמה פשוטה: אם \( f\left(x\right)=x^{2} \) ו-\( g\left(x\right)=\left(x+1\right) \) אז ההרכבה שלהן היא \( \left(x+1\right)^{2} \). כעת, \( f^{\prime}\left(x\right)=2x \) ו-\( g^{\prime}\left(x\right)=1 \) ולכן מכלל השרשרת עולה שהנגזרת של הפונקציה המורכבת היא \( 2\left(x+1\right)\cdot1=2x+2 \). אתם מוזמנים לפתוח את הסוגריים של \( \left(x+1\right)^{2} \) ולחשב את הנגזרת באופן ישיר אם לא השתכנעתם.

הייתי שמח להוכיח את כלל השרשרת כאן, אבל בניגוד להוכחות שכבר הראיתי, ההוכחה של כלל השרשרת דורשת יותר תחכום, בגלל כל מני בעיות עדינות שצצות בהוכחה נאיבית “ישר על פי ההגדרה” שלה. גם להיכנס לבעיות יקח אותנו רחוק מדי. זה לא שההוכחה עד כדי כך מסובכת - היא לא; אבל הפוסט הזה ארוך מספיק בלעדיה. אם כן, קחו בינתיים את כלל השרשרת כנתון.

אילו עוד פונקציות אנחנו מכירים? הזכרתי קצת פונקציות בשעתו - \( \sin x,\cos x,\ln x,e^{x} \)… לכולן קל למצוא נגזרת, אם כי בכל אחד מהמקרים ההוכחה דורשת כלים שמותאמים למקרה הספציפי שאותו תוקפים (כך למשל בשביל הפונקציות הטריגונומטריות צריך את הגבול \( \lim_{h\to0}\frac{\sin h}{h}=1 \) שההוכחה שלו היא סיפור שלם). מגלים, כי \( \left(\sin x\right)^{\prime}=\cos x \), \( \left(\cos x\right)^{\prime}=-\sin x \), \( \left(\ln x\right)^{\prime}=\frac{1}{x} \) ו-\( \left(e^{x}\right)^{\prime}=e^{x} \) (זוהי התכונה המיוחדת של פונקצית האקספוננט - נגזרתה שווה לעצמה).

מכאן אפשר לפתח עוד כמה דברים מעניינים. למשל, מהי הנגזרת של \( a^{x} \) כאשר \( a \) הוא מספר ממשי חיובי כלשהו, לאו דווקא \( e \)? ובכן, אפשר תמיד לכתוב \( a=e^{\ln a} \) (למה? תרגיל למי שדברים כאלו מעניינים אותו) ולכן \( a^{x}=e^{x\cdot\ln a} \). קיבלנו כאן הרכבה של שתי פונקציות: \( f\left(x\right)=e^{x} \) ו-\( g\left(x\right)=x\ln a \). הנגזרת של \( g\left(x\right) \) היא \( \ln a \) ולכן נקבל \( \left(a^{x}\right)^{\prime}=\ln a\cdot e^{x\ln a}=a^{x}\ln a \). זו עוד דוגמה לכוח שאנו מקבלים מכלל השרשרת.

בואו נראה עוד דוגמה. עד כה הצלחתי לטפל בפונקציה \( f\left(x\right)=x^{n} \) רק במקרה שבו \( n \) היה מספר שלם אי שלילי. מה על מספרים שליליים? ובכן, ב-\( n=-1 \), כלומר בפונקציה \( f\left(x\right)=\frac{1}{x} \), ניתן לטפל באופן ישיר על פי ההגדרה:

\( \lim_{h\to0}\frac{\frac{1}{x_{0}+h}-\frac{1}{x_{0}}}{h}=\lim_{h\to0}\frac{\frac{x_{0}-x_{0}-h}{x_{0}\left(x_{0}+h\right)}}{h}=\lim_{h\to0}-\frac{1}{x_{0}^{2}+hx_{0}}=-\frac{1}{x_{0}^{2}} \)

מקבלים, אם כן, ש-\( \left(\frac{1}{x}\right)^{\prime}=-\frac{1}{x^{2}} \). כעת, כל מספר שלם שלילי אפשר לכתוב כ-\( -n \) כאשר \( n \) הוא שלם חיובי, ואם \( h\left(x\right)=x^{-n} \) אז אפשר גם לכתוב \( h\left(x\right)=\left(x^{n}\right)^{-1}=\frac{1}{x^{n}} \). במילים אחרות, יש לנו כאן את ההרכבה של הפונקציה \( g\left(x\right)=x^{n} \) בתוך הפונקציה \( f\left(x\right)=\frac{1}{x} \). כלל השרשרת יניב לנו כאן את התוצאה \( h^{\prime}\left(x\right)=-\frac{1}{g^{2}\left(x\right)}\cdot g^{\prime}\left(x\right)=-\frac{nx^{n-1}}{x^{2n}}=-nx^{-\left(n+1\right)} \). במילים אחרות, הנוסחה \( \left(x^{m}\right)^{\prime}=mx^{m-1} \) עובדת גם כאשר \( m \) שלילי. בדרך גם ראינו מהי באופן כללי הנגזרת של פונקציה מהצורה \( \frac{1}{g\left(x\right)} \): היא פשוט \( -\frac{g^{\prime}\left(x\right)}{g^{2}\left(x\right)} \). בשילוב עם הנוסחה לנגזרת של מכפלת פונקציות, מקבלים את הנוסחה למנה של פונקציות: \( \left(\frac{f}{g}\right)^{\prime}=\left(f\cdot\frac{1}{g}\right)^{\prime}=\frac{f^{\prime}}{g}-\frac{fg^{\prime}}{g^{2}}=\frac{f^{\prime}g-fg^{\prime}}{g^{2}} \). בפרט, שימו לב שמכיוון שאנו יודעים לגזור כל פולינום, כעת אנחנו יכולים לגזור גם כל פונקציה רציונלית (פונקציה שהיא מנת שני פולינומים).

טרם דיגדגנו אפילו את קצה הגבול של מה שעוד נוכל לסחוט מכלל השרשרת! בואו נעבור לדבר על \( x^{n} \) כאשר \( n \) יכול להיות גם שבר. בפרט, מהו \( x^{\frac{1}{n}} \)? לצורך כך אני שוב אוכיח תוצאה כללית יותר - נגזרת של פונקציה הופכית. אם \( f\left(x\right) \) היא פונקציה, אז אומרים ש-\( g\left(x\right) \) היא הפונקציה ההופכית שלה אם ההרכבה של שתיהן היא פונקצית הזהות, כלומר הפונקציה \( h\left(x\right)=x \). למשל, אם \( f\left(x\right)=x^{n} \) אז \( g\left(x\right)=x^{\frac{1}{n}} \) היא ההופכית שלה. אם כן, נניח שאני יודע את הנגזרת של \( f\left(x\right) \) - מה הנגזרת של ההופכית שלה \( g\left(x\right) \)?

כאן נשתמש בכלל השרשרת ובכך שאנחנו יודעים שהנגזרת של \( x \) היא 1. מכיוון ש-\( g \) היא ההופכית של \( f \) אז \( f\left(g\left(x\right)\right)=x \), ולכן על ידי גזירת שני האגפים נקבל \( f^{\prime}\left(g\left(x\right)\right)g^{\prime}\left(x\right)=1 \), כלומר \( g^{\prime}\left(x\right)=\frac{1}{f^{\prime}\left(g\left(x\right)\right)} \). ובמילים: נגזרת הפונקציה ההופכית של \( f \) בנקודה \( x \) שווה לאחד חלקי הנגזרת של \( f \) בנקודה \( g\left(x\right) \). שימו לב - צריך להציב את \( g \) בתוך הנגזרת של \( f \)!

זו הייתה נקודה שבלבלה אותי מאוד כשרק למדתי את הנושא לראשונה. ניקח לדוגמה את \( g\left(x\right)=\sqrt{x} \) שהיא ההופכית של \( f\left(x\right)=x^{2} \). הנגזרת של \( f\left(x\right) \) היא \( f^{\prime}\left(x\right)=2x \), ולכן התבלבלתי וחשבתי ש-\( \left(\sqrt{x}\right)^{\prime}=\frac{1}{2x} \), אך זה לא נכון; מה ששכחתי לעשות הוא להציב את \( g\left(x\right) \) בתוך הנגזרת של \( f \). אחרי שעושים זאת, מקבלים את הנוסחה הנכונה \( \left(\sqrt{x}\right)^{\prime}=\frac{1}{2\sqrt{x}} \). ובאופן כללי מקבלים, בצורה לא מפתיעה, ש-\( \left(x^{\frac{1}{n}}\right)^{\prime}=\frac{1}{n}x^{\frac{1}{n}-1} \). כלומר, הנוסחה \( \left(x^{m}\right)^{\prime}=mx^{m-1} \) נכונה לכל \( m \) רציונלי. למעשה, זה מסיים את העניין גם עבור כל חזקה \( m \) ממשית, שכן חזקה שכזו מוגדרת בתור גבול שמשתמש בחזקות רציונליות, ושיקולי רציפות מעבירים את נוסחת הנגזרת מהמקרה הרציונלי למקרה הממשי הכללי. אם זה נשמע כמו ג’יבריש, לא נורא; גם זה משהו שאני לא רוצה להיכנס אליו.

אם נקבל לרגע את ההנחה ש-\( \ln x \) היא פונקציה שהוגדרה מראש כך שנגזרתה תהיה \( \frac{1}{x} \) (זו, למעשה, ההגדרה המקובלת בספרות), ושאנו יודעים כי \( e^{x} \) היא ההופכית שלה, אז קל להסיק מהכלל של נגזרת הפונקציה ההופכית את התוצאה \( \left(e^{x}\right)^{\prime}=e^{x} \): \( \left(e^{x}\right)^{\prime}=\frac{1}{1/e^{x}}=e^{x} \). זה היה שימוש טיפשי למדי בכלל הנגזרת של ההופכית. בואו ניישם אותו למשהו קצת יותר רציני - הפונקציות ההופכיות לפונקציות הטריגונומטריות. מכיוון שהפונקציה ההופכית האהובה עלי בהקשר הזה היא \( \mbox{atan\ensuremath{\left(x\right)}} \), ההופכית של \( \tan\left(x\right) \), בואו נבין איך באמת מחשבים את הנגזרת של \( \tan\left(x\right) \) קודם - הרי אמרתי (ללא הוכחה) מה הנגזרות של סינוס וקוסינוס אבל לא שלו; זאת מכיוון ש-\( \tan\left(x\right)=\frac{\sin x}{\cos x} \) על פי הגדרתו.

אם כן, נגזור על פי כלל המנה שראינו קודם ונקבל \( \tan^{\prime}\left(x\right)=\frac{\sin^{\prime}\left(x\right)\cos\left(x\right)-\sin\left(x\right)\cos^{\prime}\left(x\right)}{\cos^{2}\left(x\right)}=\frac{\cos^{2}x+\sin^{2}x}{\cos^{2}x}=\frac{1}{\cos^{2}x} \), כשהמעבר האחרון מתבסס על הזהות הטריגונומטרית היסודית \( \sin^{2}x+\cos^{2}x=1 \) (זוהי אחת מאותן נוסחאות בודדות שבאמת כדאי לזכור בעל פה, אבל היא גם בעלת משמעות אינטואיטיבית פשוטה - על פי משפט פיתגורס, זהו המרחק מראשית הצירים של נקודה שנמצאת על מעגל היחידה, בזווית \( x \) עם ציר ה-\( x \); ובוודאי שמרחק כל נקודה על מעגל היחידה מהראשית הוא 1…).

\( \frac{1}{\cos^{2}x} \) זה נחמד אבל קצת בעייתי כשבאים למצוא את הנגזרת של \( \mbox{atan} \). לכן נחזור שניה אחורה בזמן לרגע שבו הייתה לנו הזהות \( \frac{\cos^{2}x+\sin^{2}x}{\cos^{2}x} \): אפשר לפרק את הסכום לשניים ולקבל ש-\( \tan^{\prime}\left(x\right)=1+\tan^{2}\left(x\right) \). אם כן:

\( \mbox{atan}^{\prime}\left(x\right)=\frac{1}{\tan^{\prime}\left(\mbox{atan}\left(x\right)\right)}=\frac{1}{1+\tan^{2}\left(\mbox{atan}\left(x\right)\right)}=\frac{1}{1+x^{2}} \)

כשהמעבר האחרון נובע מכך ש-\( \mbox{atan} \) היא ההופכית של \( \tan \). שימו לב לתוצאה המעניינת כאן - \( \frac{1}{1+x^{2}} \) היא פונקציה שכלל לא מזכירה פונקציות טריגונומטריות, ואיכשהוא היא נבעה מתוכן. זה אומר שאם נלך “בכיוון ההפוך” (ואדבר על זה יותר בקרוב), הפונקציות הטריגונומטריות יצוצו לנו באופן טבעי גם אם אנחנו בכלל לא מתעסקים בגאומטריה.

אם כן, בואו נעשה סיכום ביניים קצר. אנחנו יודעים לגזור: את כל הפולינומים והפונקציות הרציונליות, את כל הפונקציות הטריגונומטריות וההופכיות שלהן, את כל הפונקציות המעריכיות והלוגריתמיות, וכל פונקציה שמתקבלת מהפונקציות הללו על ידי חיבור, כפל, הרכבה או הוצאת הופכי. יותר מכך: אנחנו יודעים לעשות את כל זה באופן אלגוריתמי: אין שום קושי מהותי בכתיבת תוכנית מחשב שבהניתן פונקציה, מסובכת ככל שתהיה, שנבנתה באמצעות הפונקציות הבסיסיות שהצגתי ואוסף פעולות הבניה שהצגתי, תחשב את הנגזרת שלה (ואכן, קיימות תוכנות רבות שעושות זאת). זו אולי הסיבה שבגללה כל כך אוהבים לתת מטלות גזירה מעיקות בבית הספר - זה אלגוריתמי ובית הספר עוסק בעיקר בשינון כמה אלגוריתמים טכניים לפתרון בעיות. בעולם האמיתי גזירות מסובכות זה משהו שעדיף להשאיר למחשב…

אם כן, בפעולת הגזירה אנחנו שולטים די טוב. זה מעביר אותנו באופן טבעי לשאלה הבאה - מה עם הפעולה ההפוכה מגזירה? כלומר, אם נותנים לנו פונקציה ואומרים לנו שהיא הנגזרת של משהו, האם אנו יכולים לגלות את המשהו? אקרא כאן למשהו “האנטי-נגזרת” של הפונקציה, אם כי יש לו שם מקובל יותר שאתאר בפוסט הבא (כרגע אני לא רוצה לקלקל את אלמנט ההפתעה עבור המעטים שיופתעו - ומי שלא יופתע כבר יודע מה השם הנכון ממילא). אל תתבלבלו בין זה ובין מציאת נגזרת של פונקציה הפוכה. אני מתכוון, למשל, לכך שהפונקציה \( x^{3} \) מתקבלת על ידי גזירה של… מפתה אולי לומר \( x^{4} \), אבל הנגזרת של \( x^{4} \) היא \( 4x^{3} \), כך ש-\( x^{3} \) מתקבלת מגזירה של \( \frac{x^{4}}{4} \). כאן אנחנו כבר רואים שהעסק טיפה מלוכלך.

באופן כללי במתמטיקה אם פעולה היא קלה, אפילו אלגוריתמית, לביצוע בכיוון אחד זה לא אומר הרבה על הכיוון השני. דוגמה קלאסית היא פעולת הכפל: קל לחשב אלגוריתמית את \( a\cdot b \) אם יש לנו את \( a,b \), אבל אם נותנים לנו את המכפלה בלבד - כמה עבודה תידרש לנו כדי לפרק אותה לגורמים? התשובה היא שכל כך הרבה עבודה, ששיטות ההצפנה הפופולריות ביותר כיום מתבססות על כך שמדובר על בעיה קשה. כל ענף הקריפטוגרפיה המודרנית, למעשה, מתבסס על קיום פונקציות “חד-כיווניות” - שקל לחשב, אבל קשה להפוך (בהערת אגב אעיר ש”קל” ו”קשה” בהקשר הזה הם מושגים שמוגדרים באופן מתמטי מדויק ומסויים שאולי לא תואם לחלוטין את האינטואיציה שלנו; ויותר מכך, שלא באמת הוכח קיום של פונקציות שכאלו, אלא רק יש לנו אוסף של “חשודות” כדוגמת הזוג כפל/פירוק לגורמים).

הפונקציה \( \frac{1}{1+x^{2}} \) היא מקרה בוחן לקושי של היפוך פעולת הגזירה. כדי לדעת מה ייתן אותה כנגזרת, צריך “להמציא” את הפונקציות הטריגונומטריות. אם כן, גם אם יש לנו פונקציה שנבנתה באופן “נחמד” מתוך פונקציות אלמנטריות זה כלל לא מבטיח שהאנטי-נגזרת שלה תורכב מפונקציות שכאלו בעצמה באופן נחמד. דוגמה קלאסית לכך היא הפונקציה החשובה עד למאוד שהיא האנטי-נגזרת של \( e^{x^{2}} \) (למעשה של פונקציה טיפה יותר מסובכת אך אין הבדל מהותי) - אפשר להוכיח כי את האנטי-נגזרת הזו פשוט לא ניתן לכתוב באמצעות הפונקציות האלמנטריות ופעולות החיבור-כפל-הרכבה. מכאן שברור שאין מה לדבר על נוסחה שבהינתן הרכבה של שתי פונקציות פשוטות, תיתן את האנטי-נגזרת של ההרכבה באמצעות האנטי-נגזרות של הפונקציות המורכבות. אפילו כלל דומה עבור כפל פונקציות אין ממש (יש משהו שאולי אתאר בהמשך; הוא אמנם מפשט את העניינים לפעמים אבל זו לא נוסחה פשוטה כמו שהייתה עבור הנגזרת). רק פעולות החיבור והכפל בסקלר מתנהגות יפה כמקודם.

העיסוק בשאלת “בהינתן נגזרת, מהי האנטי-נגזרת?” יתגלה כקשור באופן הדוק למושג האינטרל שהצגתי בפוסט הקודם. כדי לא לספיילר יותר, אעצור כאן ואחכה לפוסט הבא. אני מקווה שנהניתם מהטיול בג’ונגל הגזירות ושאתם מסכימים שהצלחנו לסלול בו, פחות או יותר, כביש נוח למדי (אם כי, כמובן, טרם נוסעים עליו רכבים - עוד לא ממש הבנו איך הנגזרות משפרות לנו את החיים).

נהניתם? התעניינתם? אם תרצו, אתם מוזמנים לתת טיפ: