מה הקטע עם שורשים של מינוס 1?

המטרה שלי בפוסט הזה היא להסביר את הסתירה השערורייתית הזו במתמטיקה שאפשר לראות פה ושם:

\[\begin{eqnarray} -1 & =i\cdot i\\ & =\sqrt{-1}\cdot\sqrt{-1}\\ & =\sqrt{\left(-1\right)\cdot\left(-1\right)}\\ & =\sqrt{1}\\ & =1 \end{eqnarray}\]

זו סתירה, כי אנחנו מתחילים עם \( -1 \) ובעזרת סדרה של שוויונות מגיעים אל 1, כלומר לכאורה \( 1=-1 \) ואנחנו יודעים שזה לא המצב. אז מה הולך פה? איפה הרמאות?

ובכן, ייתכן שלחלק גדול מכם, הרמאות מופיעה כבר בשורה הראשונה, כשאני כותב \( -1=i\cdot i \). מה זה \( i \) הזה? הוא אולי נראה כמו יצור מוזר בתכלית, פרי דמיון מתמטי פרוע אבל האמת היא שהמספר הזהת שנקרא מספר מדומה הוא חבר של כבוד במתמטיקה; הוא מושג נפוץ ושימושי מאוד. הבעיה בפירוש אינה בכך שאנחנו משתמשים בו, אבל היא כן נובעת מכך שכאשר משתמשים בו, צריכים להיות זהירים יותר עם כללי החשבון המוכרים לנו. ספציפית, השוויון \( \sqrt{-1}\cdot\sqrt{-1}=\sqrt{\left(-1\right)\cdot\left(-1\right)} \) אינו נכון אלא צריך להסתכל על גרסה כללית יותר שלו, שבה הסתירה נעלמת מעצמה. זה מה שארצה להראות בפוסט הזה.

מה שנחמד בסתירה לכאורה הזו הוא שהיא מכריחה אותנו להסתכל מחדש על מושגים שאולי חלקנו כבר התרגלנו אליהם בצורה אינטואיטיבית, ולהבין יותר טוב מה הם בדיוק אומרים. אז נרצה להבין

מה זה \( \sqrt{a} \)?
למה בעצם מתקיים \( \sqrt{a}\cdot\sqrt{b}=\sqrt{ab} \) כמו שלמדנו בבית הספר?
מה זה \( i \)?
מה הולך פה?!

בואו נתחיל עם \( \sqrt{a} \). הסימן הזה בא לתאר שורש ריבועי של \( a \). מה זה שורש ריבועי? אנחנו אומרים ש-\( x \) הוא שורש ריבועי של \( a \) אם \( x^{2}=a \). למשל, עבור \( a=9 \), שורש ריבועי הוא \( x=3 \) כי \( x^{2}=9 \). אבל תראו, הגענו כבר עכשיו לשלב שבו העסק מתחיל להסתבך! כי גם עבור \( x=-3 \) מתקיים \( x^{2}=9 \), כלומר גם \( -3 \) הוא שורש ריבועי של \( 9 \). ל-9 יש שני שורשים ריבועיים! אפשר היה אולי לומר שמתקיים \( \sqrt{9}=\pm3 \) אבל זה לא נכון. לא ככה משתמשים בסימן \( \sqrt{a} \). המטרה של הסימן הזה היא לתאר שורש אחד, ספציפי, של \( a \). עבור 9 זה השורש 3, ובאופן כללי עבור כל מספר ממשי \( a \) שקיים לו שורש \( x \), יש לו בדיוק שני שורשים: \( x,-x \). העניין הוא שהמינוס של \( -x \) מבטל את עצמו כשמכפילים את \( -x \) בעצמו ולכן מקבלים את אותו הדבר כמו \( x \). במילים אחרות - שורשים ריבועיים באים בזוגות. אם אחד מהם חיובי, השני יהיה שלילי, ולכן החליטו להגדיר את \( \sqrt{a} \) להיות השורש החיובי. זה מה שהסימן מתאר. החריג היחיד הוא 0, שיש לו רק שורש ריבועי אחד - 0 עצמו, ואנחנו מגדירים \( \sqrt{0}=0 \).

העניין הבא שצריך לתת עליו את הדעת הוא שלא לכל מספר ממשי קיים שורש שהוא מספר ממשי. \( -1 \) הוא הדוגמא הקלאסית: לכל \( x \) ממשי, \( x\cdot x \) הולך להיות אי-שלילי; אין שום דרך לקבל את \( -1 \) ככה. למה חוסר הצדק הזה? ובכן, מכפלה של שני מספרים חיוביים היא חיובית, ומכפלה של שני מספרים שליליים גם היא חיובית (כמו שראינו קודם - מינוס כפול מינוס זה פלוס) ולכן אין דרך לקבל את \( -1 \). מה שאומר שהסימון \( \sqrt{-1} \) שהשתמשתי בו קודם הוא חשוד מאוד. אחזור אליו בהמשך, כמובן.

נעבור עכשיו אל כלל כפל השורשים שלומדים בבית הספר: \( \sqrt{a}\cdot\sqrt{b}=\sqrt{ab} \). מה השוויון הזה אומר? אתן פה שתי משמעויות, אחת אינטואיטיבית וקלילה יותר והשני פדנטית בהרבה. תנחשו איזו גרסה תהיה זו שמובילה לסתירות במתמטיקה ועצב גדול ואיזו גרסה תוביל להתרת הסבך הזה.

המשמעות האינטואיטיבית והקלילה של \( \sqrt{a}\cdot\sqrt{b}=\sqrt{ab} \) היא זו: אם \( x \) מקיים \( x^{2}=a \) וגם \( y \) מקיים ש-\( y^{2}=b \) אז \( xy \) מקיים ש-\( \left(xy\right)^{2}=x^{2}y^{2}=ab \). האמירה הזו היא בבירור נכונה לגמרי, מה ש”מוכיח” את השוויון \( \sqrt{a}\cdot\sqrt{b}=\sqrt{ab} \). אם כן, איך אפשר להציל את המתמטיקה מהסתירה שאליה נקלענו?

המשמעות הפדנטית והמעצבנת של \( \sqrt{a}\cdot\sqrt{b}=\sqrt{ab} \) נחלצת עכשיו לעזרתנו. היא אומרת: אם \( a,b \) הם מספרים ממשיים שיש להם שורש ממשי, ואם \( x \) מקיים \( x^{2}=a \) וגם \( x \) הוא אי-שלילי, ואם \( y \) מקיים \( y^{2}=b \) וגם \( y \) הוא אי-שלילי, אז אפשר להסיק שגם למספר הממשי \( ab \) יש שורשים ממשיים, והשורש האי-שלילי של \( ab \) הוא \( xy \).

המשמעות הפדנטית והמעצבנת הזו היא נכונה לגמרי - אפשר להוכיח אותה יחסית בקלות. העניין הוא שהמשמעות הזו באה עם סייגים גדולים: היא דורשת ש-\( a,b \) יהיו מספרים ממשיים שיש להם שורש. אם הם לא כאלו, השוויון לא יהיה נכון במשמעות הפדנטית והמעצבנת. הוא עדיין יהיה נכון במשמעות האינטואיטיבית והקלילה; אבל כפי שנראה בהמשך, במשמעות הזו אין פה שום סתירה.

נעבור אם כן לדבר על הכוכב של הפוסט - היצור המוזר בתכלית \( \sqrt{-1} \). מה זה? ראשית כל, זה שימוש חדש בסימן \( \sqrt{a} \) שעד כה השתמשתי בו רק במקרה שבו \( a \) היה מספר ממשי שיש לו שורש ממשי. לא אמרתי עד כה מה זה אומר, “מספר ממשי”; הכוונה היא לכל מספר שנמצא על ציר המספרים \( \mathbb{R} \); כל מספר שאפשר לכתוב בייצוג עשרוני, למשל \( \pi=3.14\ldots \). במילים אחרות, אין לי פה שום הגדרה של מה זה מספר ממשי; אני מתפלל שנתקלתם במושג הזה מתישהו (בבית הספר?) כי ההגדרות הפורמליות הן מסובכות. אולי ההגדרה הכי טובה היא “כל מספר ששמעתם עליו בבית הספר חוץ אולי ממספרים מרוכבים”.

מה שאמרתי כבר הוא של-\( -1 \) אין שורש שהוא מספר ממשי. אבל במתמטיקה קיים מספר, שמסומן ב-\( i \), שמקיים \( i^{2}=-1 \), כלומר \( i \) הוא שורש של \( -1 \) על פי ההגדרה שנתתי למעלה; הוא פשוט אינו מספר ממשי. זה כמובן מעלה שאלות הרות גורל - אם \( i \) איננו מספר ממשי, מה הוא כן? האם סתם המצאתי אותו כרגע? ובכן, לא. יש מספר דרכים לבנות פורמלית את \( i \) הזה גם אם כל המספרים שיש בארגז הכלים שלי הם מספרים ממשיים, באופן די דומה לאיך שאפשר לבנות שברים מתוך מספרים שלמים. דיברתי על זה בראשית ימי הבלוג אבל הנה שיטה אחת, לא הטבעית או האלגנטית ביותר, אבל זו שעשתה את העבודה מבחינתי והרגיעה את החששות שלי בשעתו.

הרעיון הוא להגדיר מספרים חדשים בעזרת זוגות של מספרים ממשיים. לפני שיתחילו לעוף צעקות שאסור לעשות דברים כאלו, בואו נסתכל על שברים: שבר הוא מספר מהצורה \( \frac{a}{b} \) שבו \( a,b \) שניהם מספרים שלמים. במקום לסמן \( \frac{a}{b} \) הייתי יכול לסמן \( \left(a,b\right) \), ואז שתי המשוואות הנחמדות שאנחנו מכירים מבית הספר

\( \frac{a}{b}+\frac{x}{y}=\frac{ay+bx}{by} \)
\( \frac{a}{b}\cdot\frac{x}{y}=\frac{ax}{by} \)

היו ניתנות להצגה בצורה “המוזרה” הבאה:

\( \left(a,b\right)+\left(x,y\right)=\left(ay+bx,by\right) \)
\( \left(a,b\right)\cdot\left(x,y\right)=\left(a\cdot x,b\cdot y\right) \)

המשוואה השניה, של הכפל, נראית די אינטואיטיבית; אנחנו כופלים את הזוגות “רכיב-רכיב” - האיבר השמאלי בתוצאה יהיה מכפלת האיברים השמאליים במוכפלים, ובדומה עבור האיבר הימני. לעומת זאת, החיבור הוא פחד אלוהים. הוא בוודאי לא “רכיב-רכיב”. קורה פה משהו מוזר, שיכול להיראות מאוד שרירותי אם לא ברור לנו מאיפה הוא הגיע ולאיזו מטרה, ואת זה אנחנו יודעים כי למדנו ביסודי חיבור שברים.

עכשיו, מה שאני הולך לעשות כדי ליצור את \( i \) יהיה דומה מאוד. אני מגדיר קבוצה חדשה של מספרים, שאני קורא לה מספרים מרוכבים ומסמן ב-\( \mathbb{C} \), ואיבריה הם זוגות \( \left(a,b\right) \) כך ש-\( a,b \) הם מספרים ממשיים. ומה שמייחד את הקבוצה הזו הוא חוקי החיבור והכפל שלה. חיבור יהיה “רכיב-רכיב” והכפל יהיה “משהו מוזר, שיכול להיראות מאוד שרירותי אם לא ברור לנו מאיפה הוא הגיע ולאיזו מטרה”:

\( \left(a,b\right)+\left(x,y\right)=\left(a+x,b+y\right) \)
\( \left(a,b\right)\cdot\left(x,y\right)=\left(ax-by,ay+bx\right) \)

בואו נסתכל עכשיו על המספר המרוכב \( \left(0,1\right) \) ונכפול אותו בעצמו. על פי כלל הכפל המוזר שלנו, נקבל:

\( \left(0,1\right)\cdot\left(0,1\right)=\left(0\cdot0-1\cdot1,0\cdot1+1\cdot0\right)=\left(-1,0\right) \)

כל הסימונים הללו עם סוגריים הם מאוד מסורבלים, אז אני אציג סימון חדש: במקום לכתוב \( \left(a,b\right) \) אני אכתוב \( a+bi \). במקרה של \( \left(0,1\right) \), שבו \( a=0,b=1 \), הסימון הזה נהיה עוד יותר פשוט - \( i \) ותו לא. ובמקרה של \( \left(-1,0\right) \) הסימון הזה הוא \( -1+0\cdot i \), שגם אותו אפשר לפשט אל \( -1 \). קיבלנו ש-\( i\cdot i=-1 \).

אפשר להגיד, ובצדק גמור, שאני “מרמה”. שהשוויון \( i\cdot i=-1 \) לא מראה שמצאתי שורש למספר הממשי \( -1 \) אלא שמצאתי שורש למספר מרוכב שאני בחוצפתי קורא לו \( -1 \) למרות שהוא בעצם הזוג \( \left(-1,0\right) \). זה כמובן נכון; אני אגיד שמה שאני עושה הוא לשכן את המספרים הממשיים שאני מכיר בתוך המספרים המרוכבים. זה נשמע חשוד מאוד, אבל זה בדיוק מה שעושים גם עבור שברים; כותבים 7 בתור סימון מקוצר של \( \left(7,1\right) \) וחושבים עליו בתור מספר טבעי נחמד ולא בתור זוג מספרים שלמים.

למה אני מספר את כל זה? כי מצד אחד, חשוב לי להדגיש שהמספרים המרוכבים הם סבבה. אין בהם משהו עקום באופן מהותי שמכריח את המתמטיקה להישבר, ההפך; המתמטיקה מסתדרת איתם יפה. מצד שני המתמטיקה באמת נשברת בגלל עניין השורשים הזה, וצריך להבין איך.

בואו נחזור אל השוויון \( \sqrt{a}\cdot\sqrt{b}=\sqrt{ab} \). דיברתי קודם על שתי משמעויות שלו - אינטואיטיבית ופדנטית. המשמעות האינטואיטיבית אומרת את הדבר הבא: אם במקום \( \sqrt{a} \) נכתוב שורש כלשהו של \( a \) ובמקום \( \sqrt{b} \) נכתוב שורש כלשהו של \( b \), ואם במקום \( \sqrt{ab} \) נכתוב שורש כלשהו של מה שמתחת לסימן השורש, כלומר של \( ab \), אז כשנעלה בריבוע את שני האגפים נקבל את אותו הדבר.

לדוגמא, אם \( a=9 \) ו-\( b=4 \) אז השוויון שלמעלה הוא \( \sqrt{9}\cdot\sqrt{4}=\sqrt{36} \). אם למשל אקח את השורש \( -3 \) של \( a \) והשורש \( 2 \) של \( b \) והשורש \( 6 \) של 36, אז אקבל את הטענה:

\( \left[\left(-3\right)\cdot2\right]^{2}=6^{2} \)

זו טענה נכונה, אבל אני מקווה שברור שזה לא מה ש-\( \sqrt{a}\cdot\sqrt{b}=\sqrt{ab} \) באמת אומר. הוא לא אומר “המספר \( \sqrt{a}\cdot\sqrt{b} \) (בדוגמה שלנו, \( -6 \)) הוא שורש כלשהו של \( ab \)”. הוא אומר “המספר \( \sqrt{a}\cdot\sqrt{b} \) שווה בדיוק לשורש מסויים של \( ab \), השורש האי-שלילי”. הדבר הזה פשוט לא עובד, כי השורש האי-שלילי של \( 36 \) הוא \( 6 \), והוא שונה מ-\( -6 \). כדי שהשוויון הזה יעבוד, הכרחי שגם בבניית המספר \( \sqrt{a}\cdot\sqrt{b} \) ניקח רק את השורש האי-שלילי של \( a,b \).

טוב ויפה, אז למה זה לא עובד עם \( \sqrt{-1} \)? כי פה אין בכלל משמעות ל”שורש שלילי” ו”שורש חיובי” במובן הרגיל. השורשים של \( \sqrt{-1} \) הם \( i \) ו-\( -i \). מה חיובי ושלילי כאן?

“אה-הא!” אתם בוודאי אומרים: “ברור ש-\( i \) חיובי ואילו \( -i \) שלילי, הרי ליד \( -i \) יש סימן מינוס!”. ובכן, זה לא באמת כל כך פשוט; למשל, במספר המרוכב \( z=1-i \) מתקיים \( -z=-1+i \) וקצת קשה לומר מי משני המספרים הללו הוא החיובי והשלילי על פי גישת ה”חפשו את סימן המינוס”. אבל זו אפילו לא הבעיה המרכזית. הבעיה המרכזית היא שכדי להוכיח את \( \sqrt{a}\cdot\sqrt{b}=\sqrt{ab} \) אנחנו מניחים שמספרים חיוביים יתנהגו בצורה מאוד נחמדה, ואם אני אנסה לומר בכוח ש-\( i \) הוא “חיובי” אני אאבד את הצורה המאוד נחמדה הזו.

ספציפית, הדבר הנחמד שאני מתבסס עליו כאן הוא סגירות: אם כופלים שני מספרים חיוביים, התוצאה תהיה בעצמה מספר חיובי. אם \( a>0,b>0 \) אז גם \( ab>0 \). זה כמובן לא עובד עם \( i \), כי כשכופלים את \( i \) בעצמו מקבלים מספר שלילי, \( -1 \). אם נקרא ל-\( i \) חיובי נאבד את תכונת הסגירות של החיוביים ולכן נאבד את התכונה \( \sqrt{a}\cdot\sqrt{b}=\sqrt{ab} \).

למה הסגירות כל כך חשובה? בשביל זה בואו נראה הוכחה בנפנוף ידיים של הטענה. אם \( x^{2}=a \) וגם \( y^{2}=b \), אז חשבון פשוט במיוחד נותן לנו ש-

\( \left(xy\right)^{2}=x^{2}y^{2}=ab \)

אנחנו מסתמכים כאן במובלע על מה שנקרא חוק החילוף; על כך ש-\( xy=yx \) ולכן \( \left(xy\right)^{2}=xyxy=xxyy=x^{2}y^{2} \). אבל חוק החילוף הוא תכונה בסיסית שמתקיימת גם במספרים הממשיים וגם במספרים המרוכבים, אז אין עם זה בעיה (הוא לא מתקיים, למשל, עבור כפל מטריצות, או כפל קווטרניונים אבל זה סיפור שונה). קיבלנו, אם כן, הוכחה לטענה הכללית “אם \( x \) הוא שורש של \( a \) ו-\( y \) הוא שורש של \( b \) אז \( xy \) הוא שורש של \( ab \)”. הטענה הזו נכונה גם עבור מספרים מרוכבים וספציפית עבור השורשים של \( -1 \) שהם כזכור \( \pm i \). בואו נראה את זה על ידי כך שנתבונן במפורש על כל ארבע המכפלות של שורשים של \( -1 \):

\( i\cdot i=-1 \)
\( i\cdot\left(-i\right)=1 \)
\( \left(-i\right)\cdot i=1 \)
\( \left(-i\right)\cdot\left(-i\right)=-1 \)

כל ארבע המכפלות הללו הניבו לנו את 1 או את \( -1 \), שהם השורשים של \( 1 \). הדבר היחיד שנכשל הוא הציפיה שלנו לקבל את השורש החיובי של 1. אנחנו אמנם מקבלים אותו, אבל רק במכפלה כמו \( i\cdot\left(-i\right) \), שמערבת את השורש “הלכאורה חיובי” \( i \) והשורש “הלכאורה שלילי” \( -i \) ביחד.

נניח עכשיו לרגע ש-\( x,y \) הם מספרים ממשיים חיוביים שמקיימים \( x^{2}=a,y^{2}=b \). אז אנחנו יודעים ש-\( xy \) הוא שורש של \( ab \); ואנחנו יודעים, בגלל שהממשיים החיוביים סגורים לכפל, שגם \( ab \) הוא מספר ממשי חיובי. לכן, אם הסימון \( \sqrt{\cdot} \) משמש אותנו כדי לתאר את השורש החיובי של מספר כלשהו, אנחנו יודעים שמתקיים \( \sqrt{a}\cdot\sqrt{b}=\sqrt{ab} \), כי בגלל ש-\( x,y \) חיוביים הם אלו שמופיעים באגף שמאל, ובגלל ש-\( xy \) חיובי הוא מי שמופיע באגף ימין.

מה שהסימן \( \sqrt{\cdot} \) עושה הוא לא רק להוציא שורש; הוא מוציא שורש ובוחר אחד מהשורשים האפשריים ומחזיר אותו. הוא עושה את זה באמצעות כלל בחירה מסוים - במקרה שלנו, “קח את השורש החיובי”. השוויון \( \sqrt{a}\cdot\sqrt{b}=\sqrt{ab} \) לא מתאר איזו תכונה כללית של פונקציית השורש; הוא מתאר תכונה כללית של כלל הבחירה הזה, וכלל הבחירה הזו מלכתחילה קיים רק למספרים ממשיים. מה שראינו עכשיו הוא שאם ננסה להרחיב את כלל הבחירה הזה למספרים נוספים, התכונה היפה שתיארנו לא תשתמר.

כל הסיפור הזה מתקשר לבעיה כללית הרבה יותר בתורת הפונקציות המרוכבות. יש כמה וכמה סיטואציות שבהן יש לנו “פונקציות” כמו שורש שיכולות להחזיר יותר מתוצאה אחת; אפשר לחשוב עליהן כאילו הן מחזירות קבוצה של תוצאות אפשריות. לעתים קרובות מה שמועיל לעשות הוא לקחת פונקציה כזו וליצור ממנה פונקציה שכן מחזירה ערך מספרי יחיד לכל קלט - פונקציה כזו נקראת ענף של הפונקציה המקורית. האתגר הוא לבחור את הענף הזה כך שיקיים תכונות נחמדות ככל האפשר - למשל, רציפות, כלומר ששינויים קטנים בקלט לא יובילו לשינויים גדולים בפלט. מה שראינו פה הוא שהענף של פונקציית השורש על המספרים הממשיים שמוגדר בתור “קחו תמיד את השורש החיובי” מקיים תכונת כפליות (פונקציה \( f \) היא כפלית אם \( f\left(ab\right)=f\left(a\right)f\left(b\right) \)) אבל על המספרים המרוכבים אין לנו ענף שיקיים כפליות. זה אחד מהחסרונות של שימוש במרוכבים; היתרונות כל כך גדולים שאנחנו יכולים לקבל את זה בשמחה.

אם כן, לסיכום: אין סתירה במתמטיקה; אין בעיה עם השימוש ב-\( i \); ואין בעיה עם \( \sqrt{a}\cdot\sqrt{b}=\sqrt{ab} \) כל עוד אנחנו יודעים באיזה הקשר אנחנו משתמשים בו. מה שכן יש פה הוא תירוץ נפלא לכתוב פוסטים על מרוכבים.

נהניתם? התעניינתם? אם תרצו, אתם מוזמנים לתת טיפ: