נגזרת מרוכבת, פונקציות אנליטיות ונוסחאות קושי-רימן

המושג היסודי בחשבון דיפרנציאלי הוא מושג הנגזרת. כבר הקדשתי לו פוסט, אבל אחזור על הרעיון בקצרה: כאשר יש לנו פונקציה \( f \), אנחנו מעוניינים למדוד את קצב השינוי שלה. המושג האינטואיטיבי שלנו הוא זה של שינוי ממוצע - מסתכלים על ההפרש בין ערכי הפונקציה בשתי נקודות שונות, ומחלקים אותו בהפרש שבין הנקודות הללו. אם המרחק בין ת”א וחיפה הוא 100 ק”מ, והמרחק בין השעה שבה יצאנו מת”א - 8:00 - לשעה שבה הגענו לחיפה - 10:00 - הוא 2 שעות, אז השינוי הממוצע של פונקציית המיקום שלנו (פונקציה שמקבלת נקודת זמן ומחזירה את המיקום שלנו באותה נקודת זמן) בין שתי הנקודות הללו של 8:00 ו-10:00 הוא \( \frac{100}{2}=50 \), כשהיחידות שבהן אנו מבצעים את המדידה הן ק”מ לשעה (במתמטיקה הפונקציות הן לרוב אבסטרקטיות - מקבלות מספרים חסרי יחידות ומחזירות מספרים חסרי יחידות - ולכן אנחנו לא מדברים על יחידות רוב הזמן). הבעיה בשינוי ממוצע שכזה היא בכך שהוא מתאר מה קרה לאורך פרק זמן ארוך כלשהו - הוא לא אומר לנו מה קרה בנקודת זמן מסויימת (כלומר, מה היינו רואים אם היינו מסתכלים במד המהירות בנקודת זמן כלשהי).

הדרך הנאיבית להתמודד עם הבעיה היא לומר - אוקיי, אז בואו נשתמש באותו תעלול שהשתמשנו בו עד כה. חישבנו את השינוי הממוצע בין ערך הפונקציה ב-\( x \) ובין ערכה ב-\( y \) על ידי הנוסחה \( \frac{f\left(x\right)-f\left(y\right)}{x-y} \)? יופי, בואו נציב \( x=y \) ונראה מה נקבל. לרוע המזל, נקבל ביטוי מהצורה \( \frac{0}{0} \) וביטוי כזה אינו מוגדר, ואין דרך טובה להגדיר אותו בצורה חד משמעית. אנחנו צריכים לנקוט בגישה קצת יותר חכמה כדי לחקור את \( f \).

הפתרון הוא כזה: כדי לדעת מה קצב השינוי של הפונקציה \( f \) בנקודה \( x \), מוסיפים ל-\( x \) ערך קטן מאוד אך לא אפס שאפשר לסמן ב-\( dx \), ואז מחשבים את \( \frac{f\left(x+dx\right)-f\left(x\right)}{dx} \). זה מה שניוטון ולייבניץ עשו. לרוע המזל, הפתרון הזה לא מוגדר עד הסוף מבחינה מתמטית - לא ברור מה בדיוק אומר מתמטית “קטן מאוד אך לא אפס”, ואיך עובדים עם יצור כזה מבחינה טכנית - ניוטון ולייבניץ פשוט התייחסו אליו כאל אפס כשהיה נוח להם, ואל משהו שאינו אפס כשהיה נוח להם. אפשר לבצע פורמליזציה מתמטית של יצור כזה, אבל הגישה הסטנדרטית באנליזה היא שונה ומשתמשת במושג הגבול. הרעיון הבסיסי הוא לקחת ערך מספרי קונקרטי \( h \), לחשב את \( \frac{f\left(x+h\right)-f\left(x\right)}{h} \), ואז לשאול את עצמנו לאיזה ערך הביטוי הזה שואף כאשר \( h \) שואף לאפס. פורמלית וטכנית, מחשבים את הגבול \( \lim_{h\to0}\frac{f\left(x+h\right)-f\left(x\right)}{h} \).

מושג הגבול מצריך הגדרה קפדנית בפני עצמו, וגם לו הקדשתי פוסט. בכל זאת צריך להזכיר את ההגדרה המדויקת: הפונקציה \( f:\mathbb{R}\to\mathbb{R} \) מקיימת \( \lim_{x\to x_{0}}f\left(x\right)=L \) אם לכל \( \varepsilon>0 \) קיים \( \delta>0 \) כך שאם \( \left|x-x_{0}\right|<\delta \) אז \( \left|f\left(x\right)-L\right|<\varepsilon \). ועכשיו אנחנו צריכים לעצור ולשאול את עצמנו - מה בהגדרה הזו דורש את היות \( f \) פונקציה שמוגדרת על מספרים ממשיים? מה צריך לתקן כדי להיות מסוגלים להכליל את ההגדרה לפונקציות מעל מרחבים אחרים? התשובה היא פשוטה - הערך המוחלט.

הערך המוחלט משמש בהגדרת הגבול בתור מקרה פרטי של פונקצית מרחק, (או בשם אחר מטריקה). את המושג הזה אפשר להציג בצורה כללית מאוד: אם \( A \) היא קבוצה, אז מטריקה היא כל פונקציה \( d:A\times A\to\mathbb{R} \) כך ש-\( d\left(x,y\right)=0 \) אם ורק אם \( x=y \), ו-\( d\left(x,y\right)=d\left(y,x\right) \) לכל \( x,y \), ו-\( d\left(x,y\right)\le d\left(x,z\right)+d\left(y,z\right) \) לכל \( x,y,z \). למה שלוש התכונות הללו דווקא? כי כשמסתכלים על מה שעושים בהוכחות שמערבות את מושג הגבול, אפשר לראות שאנחנו לא נזקקים לכל התכונות האפשריות של ערך מוחלט במהלך ההוכחה, ולעתים קרובות שלוש התכונות שציינתי מספיקות בהחלט כדי להשיג את אותן התוצאות.

לכן, השלב הראשון בהכללת מושג הנגזרת לפונקציות מרוכבות הוא הכללת מושג המרחק עבור מספרים מרוכבים. אבל זה קל - כבר ראינו איך מוגדר ערך מוחלט עבור מספרים מרוכבים: \( \left|a+bi\right|=\sqrt{a^{2}+b^{2}} \). זו אותה מטריקה בדיוק כמו המטריקה על \( \mathbb{R}^{2} \) שבה משתמשים כשרוצים להגדיר חשבון דיפרנציאלי על פונקציות מ- ואל \( \mathbb{R}^{2} \). אז בעצם, מה ההבדל בין חשבון דיפרנציאלי של פונקציות \( f:\mathbb{R}^{2}\to\mathbb{R}^{2} \) ובין פונקציות \( f:\mathbb{C}\to\mathbb{C} \)? נדבר על זה עוד מעט.

אז יש לנו מושג של גבול של פונקציה מרוכבת (ובדומה גם אפשר להגדיר גבול של סדרה מרוכבת, אבל אין לנו צורך בגבולות כאלו עדיין). מכאן ההגדרה של נגזרת מרוכבת נובעת כמעט מעצמה: אם \( f:\mathbb{C}\to\mathbb{C} \) היא פונקציה מרוכבת ו-\( z\in\mathbb{C} \) הוא מספר מרוכב כלשהו, אז אנו מגדירים \( f^{\prime}\left(z_{0}\right)=\lim_{\Delta z\to0}\frac{f\left(z_{0}+\Delta z\right)-f\left(z_{0}\right)}{\Delta z} \). אם הגבול הזה קיים (ושונה מאינסוף), אומרים שהפונקציה גזירה בנקודה \( z_{0} \). זה הכל. אין כאן שום דבר חדש למי שכבר מכיר חדו”א; אבל כפי שנראה בקרוב, אם \( f:\mathbb{C}\to\mathbb{C} \) היא גזירה, ההשלכות של זה הן קיצוניות יותר מאשר עבור פונקציה ממשית.

רגע, השלכות? אילו השלכות יכולות להיות לכך שפונקציה היא גזירה? ובכן, משפט בסיסי אחד בחדו”א הוא שכל פונקציה גזירה היא גם רציפה בכל נקודה שבה היא גזירה (רציפות פירושה ש-\( \lim_{x\to x_{0}}f\left(x\right)=f\left(x_{0}\right) \)). המשפט הזה תקף גם עבור פונקציות מרוכבות, וכפי שנראה, ההוכחה “אדישה” לשאלה אם הפונקציה מרוכבת או לא, כל עוד מושג הגבול שלנו מתנהג באותו האופן.

ההוכחה מתבססת על השוויון הבא: \( f\left(z_{0}+\Delta z\right)=f\left(z_{0}\right)+\frac{f\left(z_{0}+\Delta z\right)-f\left(z_{0}\right)}{\Delta z}\cdot\Delta z \) - שהוא, כמובן, טריוויאלי. מה שמעניין הוא מה שקורה כאשר משאיפים את \( \Delta z \) לאפס: מקבלים ש-

\( \lim_{\Delta z\to0}f\left(z_{0}+\Delta z\right)=\lim_{\Delta z\to0}\left(f\left(z_{0}\right)+\frac{f\left(z_{0}+\Delta z\right)-f\left(z_{0}\right)}{\Delta z}\cdot\Delta z\right)=f\left(z_{0}\right)+f^{\prime}\left(z_{0}\right)\cdot0=f\left(z_{0}\right) \)

כאשר השוויון האחרון נובע מכך ש-\( \lim_{\Delta z\to0}\frac{f\left(z_{0}+\Delta z\right)-f\left(z_{0}\right)}{\Delta z}=f^{\prime}\left(z_{0}\right) \) וזה מספר מרוכב, ואילו \( \lim_{\Delta z\to0}\Delta z=0 \), וגבול של מכפלה של שני גבולות מתכנסים שווה למכפלה שלהם. רק כדי לשכנע אתכם סופית בכך שאין הבדל בין חדו”א רגיל ואנליזה מרוכבת בנקודה הזו, אני אחזור על איך מוכיחים את הטענה הזו. פורמלית אני רוצה להוכיח שאם \( \lim_{z\to z_{0}}f\left(z\right)=a \) ו-\( \lim_{z\to z_{0}}g\left(z\right)=b \) אז \( \lim_{z\to z_{0}}f\left(z\right)g\left(z\right)=ab \). כלומר, אני רוצה להיות מסוגל לחסום בצורה טובה את הביטוי \( \left|f\left(z\right)g\left(z\right)-ab\right| \). לשם כך, אני נוקט את התעלול הכי ישן בספר - מוסיף ומחסיר את אותו גורם, שאחרי טיפה משחקים אפשר לראות שכדאי שיהיה \( bf\left(z\right) \) כדי שנוכל לקבל חסם שכולל את שני הגבולות שאנחנו יודעים עליהם:

\( \left|f\left(z\right)g\left(z\right)-ab\right|=\left|f\left(z\right)g\left(z\right)+bf\left(z\right)-bf\left(z\right)-ab\right|=\left|f\left(z\right)\left[g\left(z\right)-b\right]+b\left[f\left(z\right)-a\right]\right| \)

\( \le\left|f\left(z\right)\right|\left|g\left(z\right)-b\right|+\left|b\right|\left|f\left(z\right)-a\right| \)

עכשיו, יהא \( \varepsilon>0 \) כלשהו. אנחנו רוצים למצוא \( \delta \) כך שלכל \( z \) שמקיים \( \left|z-z_{0}\right|<\delta \), מתקיים ש-\( \left|f\left(z\right)\right|\left|g\left(z\right)-b\right|+\left|b\right|\left|f\left(z\right)-a\right|<\varepsilon \). ראשית, מכיוון ש-\( \lim_{z\to z_{0}}f\left(z\right)=a \) נובע מכך שקיים \( \delta_{1} \) כך שאם \( \left|z-z_{0}\right|<\delta_{1} \) אז \( \left|f\left(z\right)-a\right|<\frac{\varepsilon}{2\left|b\right|} \), ולכן \( \left|b\right|\left|f\left(z\right)-a\right|<\frac{\varepsilon}{2} \).

שנית, קיים \( \delta_{2} \) כך שאם \( \left|z-z_{0}\right|<\delta_{2} \) אז \( \left|f\left(z\right)-a\right|<1 \), ולכן \( \left|f\left(z\right)\right|<1+a \). הויסה, רגע, רגע! איך עשיתי את זה? ובכן, תכונה כללית של ערך מוחלט: \( \left|x-y\right|\ge\left|x\right|-\left|y\right| \). איך מוכיחים אותה? ובכן, \( \left|x\right|=\left|x-y+y\right|\le\left|x-y\right|+\left|y\right| \). כל מה שאני מתבסס עליו הוא אי-שוויון המשולש (והטריק הרגיל של לחסר ולחבר את אותו הדבר).

כעת, קיים גם \( \delta_{3} \) כך שאם \( \left|z-z_{0}\right|<\delta_{3} \) אז \( \left|g\left(z\right)-b\right|<\frac{\varepsilon}{2\left(1+a\right)} \), ולכן אם \( \left|z-z_{0}\right|<\min\left\{ \delta_{2},\delta_{3}\right\} \) מתקיים \( \left|f\left(z\right)\right|\left|g\left(z\right)-b\right|<\left(1+a\right)\frac{\varepsilon}{2\left(1+a\right)}=\frac{\varepsilon}{2} \). המסקנה הסופית: נגדיר \( \delta=\min\left\{ \delta_{1},\delta_{2},\delta_{3}\right\} \) ונקבל שאם \( \left|z-z_{0}\right|<\delta \) אז

\( \left|f\left(z\right)\right|\left|g\left(z\right)-b\right|+\left|b\right|\left|f\left(z\right)-a\right|<\frac{\varepsilon}{2}+\frac{\varepsilon}{2}=\varepsilon \)

שימו לב בכמה מעט השתמשנו בהוכחה הזו.

חזרה לענייננו. הוכחנו שפונקציה גזירה היא גם רציפה; בואו נראה עוד כמה תכונות בסיסיות של נגזרות. תכונה נחמדה אחת של נגזרת היא שמדובר על אופרטור לינארי - זה אומר שאם \( a,b\in\mathbb{C} \) ו-\( f,g \) הן פונקציות מרוכבות, אז \( \left[af+bg\right]^{\prime}=af^{\prime}+bg^{\prime} \) (למי שמכיר אלגברה לינארית - זה אומר שאופרטור הגזירה הוא טרנספורמציה לינארית, עבור מרחבים וקטוריים מתאימים של פונקציות). ההוכחה לזה נובעת מייד מתכונות של גבולות ושימוש בהגדרה של נגזרת ולא אכנס אליה. תחת זאת אציג את ההוכחה למשהו טיפה יותר מסובך - נוסחת הנגזרת של מכפלה, שזהה גם היא למקרה הממשי: \( \left[fg\right]^{\prime}=f^{\prime}g+fg^{\prime} \). ההוכחה, כרגיל, מבוססת על לחבר ולהחסיר את אותו דבר:

\( \left[fg\right]^{\prime}\left(z_{0}\right)=\lim_{\Delta z\to0}\frac{fg\left(z_{0}+\Delta z\right)-fg\left(z_{0}\right)}{\Delta z}=\lim_{\Delta z\to0}\frac{fg\left(z_{0}+\Delta z\right)+f\left(z_{0}+\Delta z\right)g\left(z_{0}\right)-f\left(z_{0}+\Delta z\right)g\left(z_{0}\right)-fg\left(z_{0}\right)}{\Delta z} \)

\( =\lim_{\Delta z\to0}\frac{f\left(z_{0}+\Delta z\right)\left[g\left(z_{0}+\Delta z\right)-g\left(z_{0}\right)\right]}{\Delta z}+\lim_{\Delta z\to0}\frac{g\left(z_{0}\right)\left[f\left(z_{0}+\Delta z\right)-f\left(z_{0}\right)\right]}{\Delta z} \)

\( =f\left(z_{0}\right)g^{\prime}\left(z_{0}\right)+g\left(z_{0}\right)f^{\prime}\left(z_{0}\right) \)

הבנתם את הפרינציפ. זה מה שתמיד כיף בהכללות מתמטיות - האופן שבו חלק מההוכחות פשוט ממשיכות לעבוד למרות ששינינו לגמרי את “שדה המשחק” שלהן.

ומה עם גזירה של פונקציות קונקרטיות? ובכן, בינתיים מה שפשוט להציג הוא את הגזירה של פולינום. פולינום הוא ביטוי מהצורה \( \sum a_{n}z^{n} \), ולכן אפשר להשתמש בלינאריות של הנגזרת כדי לקבל ש-\( \left[\sum a_{n}z^{n}\right]^{\prime}=\sum a_{n}\left[z^{n}\right]^{\prime} \), כלומר די למצוא את הנגזרת של פונקציות מהצורה \( f\left(z\right)=z^{n} \). פונקציות כאלו אפשר להציג אינדוקטיבית בתור \( z^{n}=z^{n-1}\cdot z \) ואז לגזור עם כלל הגזירה של מכפלה. בשביל הבסיס נצטרך להבין את הנגזרת של \( f\left(z\right)=z \), ואת זה אפשר לעשות ישירות מההגדרה:

\( f^{\prime}\left(z_{0}\right)=\lim_{\Delta z\to0}\frac{f\left(z_{0}+\Delta z\right)-f\left(z_{0}\right)}{\Delta z}=\lim_{\Delta z\to0}\frac{z_{0}+\Delta z-z_{0}}{\Delta z}=\lim_{\Delta z\to0}1=1 \)

וכעת אפשר לנחש (אחרי שמנסים כמה מקרים פרטיים, או סתם לזכור מה קורה במספרים ממשיים) ש-\( \left[z^{n}\right]^{\prime}=nz^{n-1} \), ולהוכיח את זה באינדוקציה:

\( \left[z^{n}\right]^{\prime}=\left[z^{n-1}\right]^{\prime}z+z^{n-1}=\left(n-1\right)z^{n-2}\cdot z+z^{n-1}=nz^{n-1} \)

טוב, מספיק עם זה. עד עכשיו כל מה שעשיתי הוא לקחת תוצאות מחדו”א במספרים ממשיים ולהגיד “היי, תראו, איזה מגניב, זה עובד גם כאן!”. עד כאן. אני רוצה להראות משהו חדש - את משוואות קושי-רימן. נתחיל דווקא בלדבר על פונקציות ממשיות מהמרחב לעצמו, דהיינו \( f:\mathbb{R}^{2}\to\mathbb{R}^{2} \). איך אפשר להגדיר נגזרת של פונקציה שכזו? אפשר לדבר על גבולות ב-\( \mathbb{R}^{2} \) - כבר אמרנו שיש לנו על \( \mathbb{R}^{2} \) את אותה מטריקה כמו ב-\( \mathbb{C} \), אבל משהו אחר ישתבש. אם ננסה להגדיר \( f^{\prime}\left(a_{0}\right)=\lim_{\Delta a\to0}\frac{f\left(a+\Delta a\right)-f\left(a\right)}{\Delta a} \) נקבל משהו שהוא ביטוי חסר משמעות, כי יש בו שבר שבו במונה ובמכנה יש איברים של \( \mathbb{R}^{2} \), כלומר אנחנו מחלקים איבר של \( \mathbb{R}^{2} \) באיבר אחר של \( \mathbb{R}^{2} \). אבל על \( \mathbb{R}^{2} \) אין לנו מושג של חילוק - \( \mathbb{R}^{2} \) אינו שדה. אם אתם זוכרים, בפוסט הראשון על פונקציות מרוכבות התייחסתי לנקודה הזו. המספרים המרוכבים הם כן שדה בזכות פעולת כפל “מתוחכמת” (שממנה נובעת פעולת החילוק). הנה הנקודה המדוייקת שבו האנליזה של \( \mathbb{R}^{2} \) נפרדת מהאנליזה המרוכבת.

אבל מה כן עושים ב-\( \mathbb{R}^{2} \)? דרך אחת לתאר פונקציות כאלו היא בתור זוג פונקציות \( u,v:\mathbb{R}^{2}\to\mathbb{R} \) שמקבלות כל אחת זוג ערכים ומחזירות ערך בודד: \( f\left(x,y\right)=\left(u\left(x,y\right),v\left(x,y\right)\right) \). כעת אפשר לדבר על הנגזרות של כל פונקציה כזו בנפרד. אבל מה המשמעות של נגזרת של פונקציה בשני משתנים? חשבו על הפונקציה כאילו היא מתארת קווי גובה של הר - לכל נקודה במישור מותאם ה”גובה” שלה. אז נגזרת של הפונקציה היא שיפוע ההר בנקודה מסויימת; אבל הכרחי לשאול - שיפוע ביחס לאיזה כיוון? חשבו על שפת תהום, שבה בכיוון אחד יש לנו נפילה בכיוון אנכי ובכיוון אחר יש לנו משטח אופקי…

שני הכיוונים ה”נאיביים” הם אלו של ציר \( x \) וציר \( y \). עבורם פשוט נוהגים באופן הבא: “מקפיאים” את אחד המשתנים, וגוזרים לפי המשתנה השני. מה שמתקבל נקרא נגזרת חלקית. למשל:

\( \frac{\partial u}{\partial x}\left(x,y\right)=\lim_{\Delta x\to0}\frac{u\left(x+\Delta x,y\right)-u\left(x,y\right)}{\Delta x} \)

\( \frac{\partial u}{\partial y}\left(x,y\right)=\lim_{\Delta y\to0}\frac{u\left(x,y+\Delta y\right)-u\left(x,y\right)}{\Delta y} \)

כאשר כאן \( a,b\in\mathbb{R} \). הסימון \( \frac{\partial u}{\partial x} \) לתיאור נגזרת חלקית הוא וריאציה על הסימון \( \frac{du}{dx} \) לתיאור נגזרת של פונקציה במשתנה יחיד (ה-\( \partial \) הוא מין \( d \) מסולסלת).

מסתבר ששתי הנגזרות החלקיות הללו מספיקות לנו כדי למצוא את הנגזרת של הפונקציה בכל כיוון, אבל אני לא מדבר כאן על אנליזה ממשית אז נעזוב את זה לבינתיים. תחת זאת אני רוצה לשאול את השאלה - מה קורה כאשר מנסים לנתח פונקציה מרוכבת בגישת הנגזרות החלקיות הזו?

ובכן, תהא \( f:\mathbb{C}\to\mathbb{C} \) פונקציה מרוכבת. אפשר להציג אותה בתור זוג של פונקציות ממשיות \( u,v:\mathbb{R}^{2}\to\mathbb{R} \): \( f\left(x+yi\right)=u\left(x,y\right)+iv\left(x,y\right) \). עכשיו, נרצה לחשב את הנגזרת של \( f \) בנקודה \( z=x+iy \) בשתי דרכים שונות. בואו נסתכל קודם כל על הגבול הבא:

\( \lim_{\Delta x\to0}\frac{f\left(z+\Delta x\right)-f\left(z\right)}{\Delta x} \)

כאשר \( \Delta x\in\mathbb{R} \). הגבול הזה הוא מעין גרסה מצומצמת של הגבול ה”כללי”, שבו מה ששואף לאפס יכול להיות מספר מרוכב כלשהו ולא רק מספר ממשי. אם הגבול ה”כללי” קיים, אז בפרט הגבול ה”פרטי” קיים ושווה לו (תרגיל קל למדי להוכחה - עבור אפסילון נתון זו אותה הדלתא!). מצד שני, אם נעבור להציג את \( f \) בעזרת הפונקציות הממשיות, נקבל:

\( f^{\prime}\left(z\right)=\lim_{\Delta x\to0}\frac{u\left(x+\Delta x,y\right)-u\left(x,y\right)}{\Delta x}+\lim_{\Delta x\to0}i\frac{v\left(x+\Delta x,y\right)-v\left(x,y\right)}{\Delta x}=\frac{\partial u}{\partial x}\left(x,y\right)+i\frac{\partial v}{\partial x}\left(x,y\right) \)

עד כאן, מתבקש; אבל עכשיו בואו נחשב את הגבול לא לאורך ציר \( x \) אלא לאורך ציר \( y \): נחשב את הגבול

\( \lim_{\Delta y\to0}\frac{f\left(z+i\Delta y\right)-f\left(z\right)}{i\Delta y} \)

כאשר \( \Delta y\in\mathbb{R} \).

תזכרו מה זה אומר לחלק ב-\( i \): מכיוון ש-\( i^{4}=1 \) אז \( \frac{1}{i}=i^{3} \), ומצד שני \( i^{3}=i^{2}i=-i \). לכן לחלק ב-\( i \) זה בעצם לכפול ב-\( -i \). מכאן שנקבל:

נקבל:

\( f^{\prime}\left(z\right)=\lim_{\Delta y\to0}\frac{u\left(x,y+\Delta y\right)-u\left(x,y\right)}{i\Delta y}+\lim_{\Delta x\to0}i\frac{v\left(x,y+\Delta y\right)-v\left(x,y\right)}{i\Delta y}=-i\frac{\partial u}{\partial y}\left(x,y\right)+\frac{\partial v}{\partial y}\left(x,y\right) \)

כלומר, דווקא \( u \) (החלק ה”ממשי”) הוכפל בסופו של דבר ב-\( -i \), ואילו \( v \) בסוף יצא עם מקדם 1, בלי \( i \) ובלי מינוס ובלי שום דבר.

עכשיו אפשר להשוות את שני הערכים שקיבלנו:

\( \frac{\partial u}{\partial x}\left(x,y\right)+i\frac{\partial v}{\partial x}\left(x,y\right)=\frac{\partial v}{\partial y}\left(x,y\right)-i\frac{\partial u}{\partial y}\left(x,y\right) \)

כשמשווים שני מספרים מרוכבים, הם שווים רק אם החלקים הממשיים והמדומים שלהם שווים, ולכן נקבל בעצם זוג של משוואות:

\( \frac{\partial u}{\partial x}=\frac{\partial v}{\partial y} \)

\( \frac{\partial u}{\partial y}=-\frac{\partial v}{\partial x} \)

שמתקיימות בכל נקודה שבה \( f \) גזירה. המשוואות הללו נקראות משוואות קושי-רימן.

משוואות קושי רימן מראות שאם אנחנו רוצים לבנות פונקציה מרוכבת גזירה, אי אפשר סתם לקחת שתי פונקציות \( u,v \) ולחבר אותן ביחד, אפילו אם שתיהן גזירות בעצמן (כלומר, אם יש להן נגזרות חלקיות). הפונקציות הללו חייבות לקיים קשר כלשהו בין הנגזרות החלקיות שלהן כדי שהפונקציה המרוכבת שתתקבל מהן תהיה גזירה (ואם הייתי רוצה לקלל, הייתי קורא לקשר הזה “משוואה דיפרנציאלית חלקית”). אבל הקשר הזה בין שתי הפונקציות גם מצביע על עוד תכונה שכל פונקציה לבדה חייבת לקיים - בואו ניקח את \( u \) ונגזור את הנגזרות החלקיות שלה שוב (צריך להסביר למה שהנגזרות החלקיות יהיו גזירות שוב - בינתיים בואו רק תניחו שזה קורה). נקבל:

\( \frac{\partial^{2}u}{\partial x^{2}}=\frac{\partial v}{\partial x\partial y} \)

\( \frac{\partial^{2}u}{\partial y^{2}}=-\frac{\partial v}{\partial y\partial x} \)

\( \frac{\partial v}{\partial x\partial y} \) הוא מה שמקבלים כשגוזרים את \( v \) קודם על פי \( x \) ואז על פי \( y \) ו-\( \frac{\partial v}{\partial y\partial x} \) הוא מה שקורה כשגוזרים על פי הסדר ההפוך. יש משפט באנליזה שמראה שאם הנגזרות ה”מעורבות” הללו רציפות אז הן שוות, כלומר \( \frac{\partial v}{\partial y\partial x}=\frac{\partial v}{\partial x\partial y} \); המסקנה היא שבמקרה שלנו \( \frac{\partial^{2}u}{\partial x^{2}}+\frac{\partial^{2}u}{\partial y^{2}}=0 \). בניסוח אחר, \( u \) היא פונקציה שמתאפסת על ידי אופרטור הלפליסאן, \( \Delta=\frac{\partial^{2}}{\partial x^{2}}+\frac{\partial^{2}}{\partial y^{2}} \). לפונקציות כאלו יש שם מיוחד - פונקציות הרמוניות. אני לא נכנס עכשיו לפרטים של מה זה בדיוק אומר; אני רק רוצה שנקבל תחושה של איך שמשוואות קושי רימן מצביעות על כך שלא כל פונקציה מהרחוב יכולה להשתתף בפרוייקט הכביר והנשגב של בניית פונקציה מרוכבת גזירה: יש תנאים לא טריוויאליים שצריכים להתקיים.

עכשיו אני רוצה להכניס לתמונה מושג שעד כה החבאתי - פונקציה אנליטית. למשמעות המלאה של המושג הזה נגיע רק בהמשך, אז בינתיים אתן הגדרה יבשה למדי - אם \( D \) היא קבוצה פתוחה במישור המרוכב - מה שאקרא לו גם “תחום” - אז פונקציה מרוכבת \( f:D\to\mathbb{C} \) היא אנליטית אם היא גזירה בכל נקודה של \( D \) (אם תחום ההגדרה של \( f \) רחב יותר אפשר להצטמצמם רק ל-\( D \) ולומר ש-“\( f \) אנליטית על \( D \)”). שימו לב שאנליטיות היא לא תכונה נקודתית - היא תכונה שמתארת את התנהגות הפונקציה בתוך קבוצה פתוחה. מה זו קבוצה פתוחה? בהקשר של המישור המרוכב, זוהי קבוצה שכל נקודה בה היא נקודה פנימית של הקבוצה: לכל \( z_{0}\in D \) קיים \( r>0 \) ממשי כך שאם \( \left|z-z_{0}\right|<r \) אז \( z\in D \) (ציורית, כל נקודה \( z_{0} \) בקבוצה ניתן להקיף בעיגול קטן שכולו מוכל בקבוצה). למה חשוב לנו ש-\( D \) תהיה פתוחה? נראה זאת בהמשך; אנליטיות של פונקציה נותנת לנו “קצת יותר” מאשר גזירות בלבד.

עכשיו אני רוצה לתאר בנפנוף ידיים את הכיוון השני של המשפט על נוסחאות קושי-רימן: לא רק שמדובר על תנאי הכרחי עבור פונקציות כדי שיוכלו להרכיב פונקציה אנליטית, זה גם תנאי מספיק: אם \( u,v \) הן בעלות נגזרות חלקיות רציפות שמקיימות את משוואות קושי רימן על תחום \( D \) כלשהו, אז \( u+iv \) היא פונקציה אנליטית.

ההוכחה לא מסובכת, אבל מתבססת על עוד משהו באנליזה “רגילה” שלא הראיתי אף פעם - פיתוח טיילור של פונקציה בשני משתנים. בקצרה, אפשר לכתוב את הערך של \( u \) אחרי שמזיזים טיפה את הערכים שלה ביחס לנקודה \( \left(x,y\right) \) נתונה על ידי הערך שלה ב-\( \left(x,y\right) \), הערכים של הנגזרות החלקיות הראשונות שלה ב-\( \left(x,y\right) \), ועוד שארית “קטנה”. זה מתואר על ידי הנוסחה המזעזעת הבאה:

\( u\left(x+\Delta x,y+\Delta y\right)=u\left(x,y\right)+\frac{\partial u}{\partial x}\left(x,y\right)\Delta x+\frac{\partial u}{\partial y}\left(x,y\right)\Delta y+R\left(\Delta x,\Delta y\right) \)

כאשר \( R\left(\Delta x,\Delta y\right) \) היא “קטנה”, במובן זה שאם נסמן \( \Delta z=\Delta x+i\Delta y \) נקבל ש-\( \lim_{\Delta z\to0}\frac{R\left(\Delta x,\Delta y\right)}{\left|\Delta z\right|}=0 \). באותו אופן אפשר לכתוב עבור \( v \):

\( v\left(x+\Delta x,y+\Delta y\right)=v\left(x,y\right)+\frac{\partial v}{\partial x}\left(x,y\right)\Delta x+\frac{\partial v}{\partial y}\left(x,y\right)\Delta y+S\left(\Delta x,\Delta y\right) \)

ועכשיו, אם נכתוב את \( f\left(z+\Delta z\right)=u\left(x+\Delta x,y+\Delta y\right)+iv\left(x+\Delta x,y+\Delta y\right) \) במפורש על פי הנוסחאות שלמעלה ונשתמש בנוסחאות קושי רימן, העסק המזוויע הזה יצטמצם למשהו שדי קל להבין:

\( f\left(z+\Delta z\right)=f\left(z\right)+\left(\frac{\partial u}{\partial x}\left(x,y\right)+i\frac{\partial v}{\partial x}\left(x,y\right)\right)\Delta z+R\left(\Delta z\right)+iS\left(\Delta z\right) \)

עכשיו קחו את האיבר הראשון באגף ימין, חסרו אותו משני האגפים, חלקו אותם ב-\( \Delta z \), והופס:

\( \frac{f\left(z+\Delta z\right)-f\left(z\right)}{\Delta z}=\left(\frac{\partial u}{\partial x}\left(x,y\right)+i\frac{\partial v}{\partial x}\left(x,y\right)\right)+\frac{R\left(\Delta z\right)+iS\left(\Delta z\right)}{\Delta z} \)

ואחרי השאפת \( \Delta z \) לאפס נישאר עם \( f^{\prime}\left(z\right)=\frac{\partial u}{\partial x}\left(x,y\right)+i\frac{\partial v}{\partial x}\left(x,y\right) \) . קיבלנו ש-\( f \) גזירה וגם מצאנו נוסחה לנגזרת שלה.

בואו נראה דוגמה קלילה לסיום, כי בלי זה באמת אי אפשר. כזכור, הגדרנו את פונקצית האקספוננט (על התחום \( \mathbb{C} \)) באופן הבא: \( e^{x+iy}=e^{x}\cos y+ie^{x}\sin y \). כלומר, \( u\left(x,y\right)=e^{x}\cos y \) ו-\( u\left(x,y\right)=e^{x}\sin y \) במקרה שלנו. בואו נחשב את הנגזרות החלקיות:

\( \frac{\partial u}{\partial x}=e^{x}\cos y \)

\( \frac{\partial u}{\partial y}=-e^{x}\sin y \)

\( \frac{\partial v}{\partial x}=e^{x}\sin y \)

\( \frac{\partial v}{\partial y}=e^{x}\cos y \)

ובבירור משוואות קושי רימן אכן מתקיימות. במובן מסויים פונקציית האקספוננט גם מקיימת את המשוואות הללו בצורה “טבעית” מאוד לטעמי, אבל לא אנסה לשכנע אתכם בכך.

לסיכום, משוואות קושי-רימן הן הצצה ראשונה לאופן שבו תכונות כמו גזירות הן בעלות רמת סיבוכיות נוספת לעומת מה שקורה בפונקציות ממשיות, אבל זה רק החימום - תאמינו לי שבהמשך הולכים לקרות דברים מוזרים הרבה יותר.


נהניתם? התעניינתם? אם תרצו, אתם מוזמנים לתת טיפ:

Buy Me a Coffee at ko-fi.com