האם התגלתה שיטה חדשה לפתרון משוואה ריבועית? (לא)
אם יש לי מלבן ששטחו הוא 60 ואני יודע שאחת מצלעותיו ארוכה ב-7 מהשניה, מה אורך הצלעות של המלבן? בואו נפתח עם הבעיה הקונקרטית הזו. איך תלמידת תיכון תפתור אותה בימינו? ובכן, דרך אחת היא לסמן את אורך הצלע האחת של המלבן ב-\( x \) ואז אורך הצלע השניה הוא \( x+7 \), והמכפלה שלהם (שהיא שטח המלבן) מקיימת \( x\left(x+7\right)=60 \). אם נפתח סוגריים ונעביר אגפים נקבל את המשוואה הריבועית \( x^{2}+7x-60=0 \). בשלב הזה ייתכן שהתלמידה תשתמש בכלי העזר הבסיסי לפתרון משוואות ריבועיות שנלמד בתיכון: נוסחת השורשים.
נוסחת השורשים אומרת דבר כזה: אם יש לנו את המשוואה \( Ax^{2}+Bx+C=0 \), אז הפתרונות שלה (אם קיימים) נתונים על ידי הנוסחה \( x_{1,2}=\frac{-B\pm\sqrt{B^{2}-4AC}}{2A} \). כתבתי את הנוסחה הזו כרגע “מהראש” - אני זוכר אותה בעל פה עוד מימי התיכון. אחד מהדברים היחידים במתמטיקה שהבנתי על ידי שינון ותו לא. האם זה טוב, שאני זוכר ככה נוסחאות על ידי שינון? ובכן, לא לגמרי, ובזה יעסוק הפוסט.
נוסחת השורשים פותרת את המשוואה הקונקרטית \( x^{2}+7x-60=0 \) כך: \( A=1,B=7,C=-60 \) ולכן
\( x_{1,2}=\frac{-7\pm\sqrt{49+240}}{2}=\frac{-7\pm\sqrt{289}}{2} \)
עכשיו, מה השורש של 289? קשה לי למצוא דבר כזה בלי מחשבון למרות שאפשר פשוט לנחש ערכים ולבדוק, אבל מחשבון יגיד לנו מייד שהתשובה היא 17. לכן \( x_{1,2}=\frac{-7\pm17}{2} \) ולכן שני הפתרונות האפשריים למשוואה הם \( x=5 \) ו-\( x=-12 \); הפתרון השני לא יכול לתאר צלע של מלבן ולכן התשובה לשאלה המקורית היא שצלעות המלבן הם מהאורך 5 (זהו \( x \)) ו-12 (זוהי הצלע השניה שגדולה מ-\( x \) ב-7).
אבל נשאלת השאלה - האם אין לתלמידה עוד דרכים לפתור את התרגיל הזה? מה אם היא לא זוכרת את נוסחת השורשים? ובכן, בוודאי שיש. כדי לראות מה עוד אפשר לעשות, אני רוצה להזכיר כאן משהו שידוע לגבי משוואות ריבועיות ונקרא נוסחאות וייטה (הוא נכון גם למשוואות יותר מסובכות אבל בהן לא נעסוק פה). כדי לנסח את נוסחאות וייטה בצורה פשוטה, נניח שהמשוואה שלנו היא מהצורה \( x^{2}+bx+c \) (כלומר, אני מניח ש-\( A=1 \); זה המצב במקרה שלנו ותמיד אפשר להעביר את המשוואה לצורה הזו על ידי חילוק ב-\( A \) אם הוא שונה מאפס). אם הפתרונות של המשוואה הריבועית \( x^{2}+bx+c \) הם \( s,t \) אז מתקיים ש-\( s+t=-b \) ו-\( st=c \). במילים: מכפלת הפתרונות שווה למה שנקרא המקדם החופשי של הנוסחה, \( c \), ואילו סכום הפתרונות שווה דווקא למינוס \( b \).
כדי לראות למה נוסחאות וייטה עובדות נשתמש בעובדה הבאה: אם \( s,t \) הם פתרונות המשוואה \( x^{2}+bx+c \) אז \( x^{2}+bx+c=\left(x-s\right)\left(x-t\right) \). עכשיו צריך רק לפתוח את הסוגריים באגף ימין, להשוות מקדמים ולראות שזה עובד. איך זה עוזר לנו?
ובכן, דרך אחת שבה זה עוזר לנו מכונה בבית הספר “טרינום” והיא אומרת - בואו פשוט ננסה לנחש מה הפתרונות, תוך הנחה שהם מספרים שלמים כי נתנו לנו תרגיל נחמד וכיפי. במקרה הנוכחי של \( x^{2}+7x-60 \) המקדם החופשי הוא \( -60 \), כך שאם הפתרונות הם שלמים, הם צריכים להיות מספרים שמכפלתם היא מינוס שישים. למשל \( -4 \) ו-\( 15 \), או \( 10 \) ו-\( -6 \) וכדומה. בנוסף לכך הסכום שלהם צריך להיות \( -7 \); בדרך הזו עם קצת ניחושים נגיע אל הפתרונות \( -12 \) ו-\( 5 \) שעונים לשתי הדרישות הללו.
מצד שני, דרך של ניחושים שכזו יכולה להיות קצת מעצבנת, למרות שהיא מהירה למדי ואפשר לעשות את הניחושים בראש די בקלות (גם היום זו דרך מועדפת עלי לפתרון משוואות ריבועיות). אז הנה תעלול נחמד שמאפשר פתרון שיטתי יותר: אם \( s+t=-b \), אז הממוצע של \( s,t \) הוא פשוט הדבר הזה לחלק ל-2, כלומר הממוצע הוא \( -\frac{b}{2} \). הממוצע של שני מספרים הוא הנקודה שנמצאת בדיוק ביניהם, מה שאומר שאפשר לכתוב את שני הפתרונות בתור \( -\frac{b}{2}\pm z \) כאשר \( z \) הוא המרחק של הממוצע מהפתרונות. עכשיו האתגר שלי השתנה - למצוא את \( z \).
מה אני יודע על \( z \)? אני יודע שמכפלת הפתרונות היא \( c \), ולכן \( \left(-\frac{b}{2}+z\right)\left(-\frac{b}{2}-z\right)=c \). את המכפלה של הסוגריים הזו קל לפתוח - באופן כללי, \( \left(x+y\right)\left(x-y\right)=x^{2}-y^{2} \). במקרה שלנו נקבל
\( \frac{b^{2}}{4}-z^{2}=c \)
עכשיו נעביר אגפים ונקבל \( z^{2}=\frac{b^{2}}{4}-c \), כלומר \( z=\pm\sqrt{\frac{b^{2}}{4}-c} \), ולכן הפתרונות למשוואה הם \( -\frac{b}{2}\pm\sqrt{\frac{b^{2}}{4}-c} \). הדבר הזה הוא פשוט נוסחת השורשים בתחפושת - אם נעשה בתוך השורש מכנה משותף ונוציא את החלוקה ב-4 החוצה, נקבל בדיוק את נוסחת השורשים המקורית. במילים אחרות, כרגע הראינו דרך להגיע לנוסחת השורשים בעזרת התעלול הזה של כתיבת השורשים באמצעות המרחק מהממוצע.
איך זה פותר את התרגיל הנוכחי שלנו? ובכן, אנחנו אומרים שהפתרונות שאנחנו מחפשים הם \( -\frac{7}{2}\pm z \). נכפול אותם, נשווה למינוס 60 ונקבל \( \frac{49}{4}-z^{2}=-60 \). נעביר אגפים ונקבל \( \frac{49}{4}+60=z^{2} \). נבצע את החיבור באגף שמאל ונקבל \( \frac{289}{4} \), לזה נוציא שורש ונקבל \( \pm\frac{17}{2} \) ועכשיו הפתרונות הם \( -\frac{7}{2}\pm\frac{17}{2} \) שהופכים להיות \( -12,5 \) המוכרים לנו.
האם זה היה עדיף, לעשות את זה ככה? לגמרי עניין של טעם. מבחינה חישובית עשינו כמעט את אותם דברים; במקום להעלות בריבוע את \( b \) העלינו בריבוע את \( -\frac{b}{2} \) ובמקום להוציא שורש ל-\( b^{2}-4c \) הוצאנו שורש ל-\( \frac{b^{2}}{4}-c \). לפעמים זה יוצא פשוט יותר, מספרית; לפעמים זה יוצא מסובך יותר.
היתרון בשיטה הזו הוא שנחמד לזכור אותה: זוכרים את הרעיון של “ההפרש מהממוצע” ומזה אפשר כבר להתקדם. אם לא זוכרים בעל פה את נוסחת השורשים, זו בהחלט דרך אלטרנטיבית טובה ללכת בה. אם כן, האם מראים את זה בבית הספר? ובכן, אולי? בספרי הלימוד שבדקתי לא מזכירים את גישת “ההפרש מהממוצע”; מתארים את גישת הטרינום לפתרון משוואות ואת גישת ההשלמה לריבוע שתכף אדבר עליה ואת נוסחת השורשים שמתקבלת מהשלמה לריבוע; לא ראיתי שמציגים את הרעיון של מרחק מהממוצע.
עד כאן המתמטיקה החדשה לפוסט הזה. עכשיו, למה בכלל דיברתי על זה? כי שיטת “המרחק מהממוצע” עלתה לתקשורת בימים האחרונים - ובאופן לא מפתיע, התקשורת עשתה אנדרלמוסיה מוחלטת מהסיפור והתעסקה בעיקר בלהציג 4,000 שנים של מתמטיקאים בתור אידיוטים שלא שמו לב לשיטה הזו מעולם. זה מזכיר לי מאוד את המהומה סביב פלימפטון 322 שהייתה לפני שנתיים. אז הסיטואציה הוצגה בתור “הבבלים גילו שיטה גאונית לחישובים טריגונומטריים שיותר חכמה מכל דבר אחר שהומצא עד היום” והפעם זה מוצג בתור “אפילו הבבלים פספסו את השיטה הגאונית הזו לפתרון משוואה ריבועית שאף אחד לא גילה עד היום”.
זה, כמובן, שגוי לגמרי.
מאיפה המהומה הזו צצה בכלל? המקור למהומה הוא מתמטיקאי בשם Po-Shen Loh שניסה להנגיש מתמטיקה לתלמידי בית ספר ועלה על דרך ההצגה הזו, והתלהב ממנה מספיק כדי לכתוב עליה מאמר קטן שאותו העלה ל-arxiv (למעוניינים - arXiv:1910.06709, או פשוט דרך הלינק הזה). קראתי את המאמר - הוא די נלהב מדי לטעמי, אבל מקפיד לסייג את עצמו בכל הנוגע ל”חדשנות” של השיטה, אז אין לי רצון להתנצח איתו. הוא גם העלה סרטון יוטיוב בנושא שלא ראיתי אז בוודאי שאין לי כוונה להתנצח איתו. יותר מעניין לדבר על איך הדבר הזה מתווך לציבור הרחב דרך אתרי חדשות למיניהם. ההצגה המגוחכת ביותר וגם הנפוצה ביותר שראיתי הייתה זו של ה-MIT Technology Review, ולכן עליה אני אדבר. אפשר לראות אותה כאן.
המאמר הזה מציג את הטריק ככזה ש”התעלמו ממנו 4,000 שנה” עד שהגיע Loh וגילה לנו את האור - זה בוודאי לא נכון, כי הטריק היה מוכר כבר קודם (גם בתגובות לסרטון שלו וגם בתגובות אליו בטוויטר צצו אנשים שהכירו אותו - וגם אני, כאמור, נתקלתי בו ולא חושב שזכיתי להשכלה מיוחדת). זו שאלה מאוד מעניינת מתי בעצם התחילו לדבר במפורש על השיטה הזו. האם הבבלים, למשל, דיברו עליה? אני אחזור לשאלה הזו בסוף הפוסט כי לטעמי זה באמת הדבר הכי מעניין פה (התשובה: כן ולא, אבל בעיקר כן).
המאמר של ה-Technology Review ממשיך לטענות הזויות עוד יותר, למשל שכדי להגיע לפתרון של משוואה ריבועית צריך טריק שנקרא “השלמה לריבוע” שהוא (לדבריהם) “מאוד לא אינטואיטיבי” ואכן “אחרי הבבלים לקח למתמטיקאים מאות שנים לעלות על ההוכחה”. זה מסוג הדברים שאומרים עליהם Not Even Wrong. כל המושג של “הוכחה” של “נוסחה לפתרון כללי” של משוואה ממעלה שניה לא היה רלוונטי לא לבבלים ולא לדורות רבים של מתמטיקאים שבאו אחריהם. במידה רבה הרעיון הזה של נוסחה כללית לפתרון של משוואה ממעלה שניה נולד רק עם הולדת האלגברה הסימבולית במאה ה-16, למרות שהתורה של פתרון משוואות כאלו הייתה מוכרת למתמטיקאים למשך כל התקופה עד אז.
המאמר ממשיך לטעון שכל דרך שהמתמטיקאים מצאו כדי להגיע אל הנוסחה היא “טריקית ולא אינטואיטיבית”. זו חלוקת ציונים שמאוד לא ברורה לי, וממש חבל שבכלל גולשים אליה. אני ממש לא אוהב את הרעיון של לחלק ציוני “אינטואיטיבי/לא אינטואיטיבי” לגישות שונות למתמטיקה (אם כי אני בטוח שאני חוטא בזה בעצמי לפעמים). ככל שיש יותר גישות, אנחנו מרוויחים; כל אחד ומה שעוזר לאינטואיציה האישית שלו. למה לרומם גישה אחת על ידי השפלת גישה אחרת?
אחרי כל הדיון הזה, אולי אטרח לספר מה בעצם הגישה שרואים בבית הספר בימינו, גישת ההשלמה לריבוע? יש לי פוסט על זה, אבל למה לא לדבר על זה שוב. זוכרים שבגישה של המרחק מהממוצע התבססו על הנוסחה \( \left(x+y\right)\left(x-y\right)=x^{2}-y^{2} \)? אז בגישת ההשלמה לריבוע מסתמכים על הנוסחה \( \left(x+y\right)^{2}=\left(x+y\right)\left(x+y\right)=x^{2}+2xy+y^{2} \). נניח שאנחנו רוצים לפתור את המשוואה \( x^{2}+bx+c=0 \), אז נכתוב לשניה \( \left(x+\frac{b}{2}\right)^{2}=x^{2}+bx+\frac{b^{2}}{4} \). קיבלנו משהו שמאוד דומה למשוואה \( x^{2}+bx+c \) שאנחנו רוצים לפתור. אם נוסיף לביטוי \( x^{2}+bx+c \) את \( \frac{b^{2}}{4} \) ונחסר אותו, נקבל את הדבר הבא:
\( x^{2}+bx+c=x^{2}+bx+\frac{b^{2}}{4}+\left(c-\frac{b^{2}}{4}\right)=\left(x+\frac{b}{2}\right)^{2}+\left(c-\frac{b^{2}}{4}\right) \)
אם נשווה את זה לאפס ונעביר אגפים נקבל:
\( \left(x+\frac{b}{2}\right)^{2}=-\left(c-\frac{b^{2}}{4}\right)=\frac{b^{2}-4c}{4} \)
עכשיו נוציא שורש משני האגפים ונקבל
\( x+\frac{b}{2}=\pm\frac{\sqrt{b^{2}-4c}}{2} \)
נעביר את ה-\( \frac{b}{2} \) אגף ונקבל את הנוסחה המוכרת לנו:
\( x=\frac{-b\pm\sqrt{b^{2}-4c}}{2} \)
מכאן להגיע לפתרון של המשוואה הכללית \( Ax^{2}+Bx+C=0 \) כאשר \( A\ne0 \) זה קל: מחלקים ב-\( A \) ומקבלים את המשוואה \( x^{2}+\frac{B}{A}x+\frac{C}{A} \) ואז משתמשים בנוסחה שכבר מצאנו עם \( b=\frac{B}{A} \), \( c=\frac{C}{A} \) ומגיעים לנוסחה הכללית שתיארתי קודם גם עבור המקרה הזה. צריך להעיר שגם בשיטת המרחק-מהממוצע, השיטה הוצגה במקרה שבו \( A=1 \) והפתרון של המקרה הכללי מתבסס על אותו תעלול חלוקה.
האם לדעתכם שיטת ההשלמה לריבוע אינה אינטואיטיבית? לי היא הייתה אינטואיטיבית בזכות ההיכרות שלי עם \( \left(x+y\right)^{2}=x^{2}+2xy+y^{2} \) והרצון “להתאים” את התבנית \( x^{2}+bx+c \) אליו. אבל זה בוודאי לא יהיה אינטואיבי לכולם; לכן יש כאן שאלה מצויינת בפדגוגיה מתמטית - איך כדאי להציג את השיטה, עם איזו הכנה מקדימה, אילו עוד גישות אחרות להראות וכדומה.
דעתי האישית בנושא היא די פשוטה: הבעיה העיקרית בגישת המרחק-מהממוצע היא שקודם כל צריך להכיר את נוסחאות וייטה (כלומר, שסכום הפתרונות הוא \( -b \) ומכפלתם היא \( c \)). אם לא מכירים את נוסחאות וייטה, לכל הפחות צריך להכיר את הפירוק \( x^{2}+bx+c=\left(x-r\right)\left(x-s\right) \). מאיפה תלמידי התיכון יכירו את הפירוק הזה, אם טרם למדו על הנוסחה הכללית לפתרון משוואה ריבועית? הרבה ספרים מראים קודם את העובדה שאם מצאנו פירוק מהצורה \( x^{2}+bx+c=\left(x-r\right)\left(x-s\right) \) למשוואה אז \( r,s \) הם פתרונות המשוואה - אבל כאן חסר את הכיוון השני, לפיו לכל משוואה יש פירוק כזה. במילים אחרות, גם בשיטה של המרחק מהממוצע יש הסתכמות על ידע כלשהו, והשאלה אם השיטה תהיה אינטואיטיבית או לא תלויה מאוד בשאלה כמה מהידע הזה כבר שקע. זו הסיבה שבגללה אם הייתי כותב עכשיו ספר, הייתי כנראה קודם כל מציג את שיטת ההשלמה לריבוע ורק אחר כך את שיטת המרחק מהממוצע.
האם יש הבדל בין השיטות מבחינה “חישובית”? ובכן, בואו וננסה לפרק את השיטות לגורמים. מה אנחנו עושים, טכנית, בשיטת ההשלמה לריבוע?
- לוקחים את \( b \) ומחלקים ב-2 לקבלת \( \frac{b}{2} \).
- מעלים את התוצאה בריבוע לקבלת \( \frac{b^{2}}{4} \).
- מוסיפים ומחסרים את זה לביטוי שלנו.
- מעבירים אגף בביטוי שלנו.
- משתמשים בנוסחה \( x^{2}+2xy+y^{2}=\left(x+y\right)^{2} \) כדי לכווץ את אגף שמאל בביטוי שלנו.
- מחשבים את ההפרש \( \frac{b^{2}}{4}-c \).
- מוציאים שורש להפרש הזה: \( \pm\sqrt{\frac{b^{2}}{4}-c} \)
- מחסרים מההפרש את \( \frac{b}{2} \): \( \pm\sqrt{\frac{b^{2}}{4}-c}-\frac{b}{2} \)
שלבים 3-5 בכל זה הם “קונספטואליים”; אנחנו לא באמת מבצעים בהם חישוב, אלא מניפולציות של משוואה. אם נתכנת עכשיו במחשב קוד שפותר את המשוואה, הם לא יתורגמו לשורות קוד אלא ל”הערות”.
מה קורה בשיטת המרחק מהממוצע?
- לוקחים את \( b \), כופלים במינוס 1 ומחלקים ב-\( 2 \) לקבלת \( -\frac{b}{2} \).
- מסתכלים על הביטויים \( -\frac{b}{2}\pm z \) וכופלים אותם זה בזה לקבלת \( c \) תוך שימוש בנוסחה \( \left(x+y\right)\left(x-y\right)=x^{2}-y^{2} \)
- מחשבים את \( \left(-\frac{b}{2}\right)^{2}=\frac{b^{2}}{4} \).
- מעבירים את \( z \) ואת \( c \) אגפים בביטוי שלנו.
- מחשבים את ההפרש \( \frac{b^{2}}{4}-c \).
- מוציאים שורש להפרש הזה: \( \pm\sqrt{\frac{b^{2}}{4}-c} \)
- מחסרים את \( \frac{b}{2} \) מההפרש: \( \pm\sqrt{\frac{b^{2}}{4}-c}-\frac{b}{2} \)
כלומר, מה שקורה בפועל הוא שהשלבים החישוביים הם זהים לגמרי - ההבדל היחיד בין השיטות הוא קונספטואלי - איך זוכרים את הטריק שמוביל אליהן. אני לא רוצה לזלזל בחשיבות של ההבדל הזה! רק להבהיר שמבחינה חישובים טהורה אלו שיטות שקולות לגמרי.
זה מחזיר אותי אל הבבלים שהבטחתי קודם להגיע אליהם, ועכשיו אני יכול לגלות את הסוד הגדול: התרגיל הזה עם המלבן ששטחו 60? הוא לקוח הישר מהבבלים. ואיך שהם פותרים אותו זהה לשלבים החישוביים שכתבתי זה הרגע. אפילו דיברתי על זה פעם בבלוג, בפוסט על פלימפטון 322, אבל בואו נחזור לזה שוב.
מה שאנחנו יודעים על המתמטיקה של הבבלים מגיע אלינו מלוחות חרס עם טקסטים בכתב יתדות שהצליחו לשרוד את פגעי הזמן ושודדי העתיקות. לוח אחד כזה מכונה בימינו YBC 6967 (ה-YBC פירושו “Yale Babylonian Collection” והמספר הוא פשוט המספר הסידורי של הלוח). הנה איור שמראה את הכיתוב על הלוח (משני צדדיו):
הלוח תורגם לראשונה בידי אוטו נויגבאואר ואברהם זקס בספרם שעסק ספציפית בטקסים מתמטיים בבליים - אותו ספר שבו צץ גם פלימפטון 322 המפורסם יותר (ובפוסט עליו הרחבתי על נויגבאואר וזקס).
מה כתוב בלוח? אני כמובן לא יודע לקרוא את זה ולכן מסתמך על תרגום קיים שאביא פה ואחר כך אסביר מה הולך בו. כמה נקודות שכדאי לציין כבר עכשיו: ראשית, המספרים כתובים פה בשיטה הבבלית, של ספירה על בסיס 60. זה אומר שכשכתוב “1,0” הכוונה היא למספר 60 (פעם אחת 60 ועוד אפס פעמים 1), כשכתוב 30;3 הכוונה ל-\( 3.5 \) (כי 30 הוא חצי מ-60) וכן הלאה. אם השיטה הזו מבלבלת אתכם פשוט תתעלמו; אני אשתמש במספרים “רגילים” בהמשך. שנית, בתרגום מופיעים הביטויים igum ו-igibum בתור המספרים שמנסים למצוא - מה שאצלנו היו אורכי הצלעות של המלבן. ייתכן שפירוש המילים הללו הוא “הצלע הקצרה של המלבן” ו”הצלע הארוכה של המלבן”, אבל כנראה יש להן הקשר רחב יותר ומשמעויות נוספות (במקומות אחרים תרגמו את זה בתור “הופכיים” - כלומר, אלו שני מספרים שהופכיים זה לזה במובן זה שהכפולה שלהם היא חזקה של 60). כמו כן בסוגריים מרובעים מופיע טקסט שלא השתמר בלוח וזה הניחוש לגבי מה השחזור שלו אמור להיות. לבסוף, צריך לזכור שאצל הבבלים לא היו מספרים שליליים, ולכן כשהם מוציאים שורש למספר, מבחינתם יש לו רק שורש יחיד - החיובי.
[The igib]um exceeded the igum by 7.
What are [the igum and] the igibum?
As for you---halve 7, by which the igibum exceeded the igum, and (the result is) 3;30.
Multiply together 3;30 with 3;30, and (the result is) 12;15.
To 12;15, which resulted for you,
add [1,0, the produ]ct, and (the result is) 1,12;15.
What is [the square root of 1],12;15?
(Answer:) 8;30. Lay down [8;30 and] 8;30, its equal, and then
Subtract 3;30, the item, from the one,
add (it) to the other.
One is 12, the other 5.
12 is the igibum, 5 the igum.
מה שיש לנו כאן הוא לימוד של שיטה כללית באמצעות פתרון של תרגיל ספציפי. ה-igum, יהיה אשר יהיה פירוש המילה הזו, הוא ה-\( x \) שאנחנו מחפשים; השורה הראשונה אומרת שה-igibum הוא \( x+7 \). השורה השניה מבקשת מאיתנו למצוא אותם - זו הגדרת התרגיל. מהשורה השלישית כבר מגיע הפתרון עצמו; בואו נכתוב אותו בלשון מודרנית. כזכור, בתרגיל הזה \( b=7 \) ו-\( c=-60 \), אז אני אכתוב בסוגריים גם את התיאור-באמצעות-סימבולים של הדבר הקונקרטי שהלוח הבבלי עושה:
- (שורה שלישית) מחלקים את 7 ב-\( 2 \) לקבלת \( 3.5 \) (\( \frac{b}{2} \))
- (שורה רביעית) מעלים את \( 3.5 \) בריבוע לקבלת 12.25 (\( \frac{b^{2}}{4} \))
- (שורות חמישית ושישית) לתוצאה 12.25 מחברים את 60 (\( \frac{b^{2}}{4}-c \)) ומקבלים \( 72.25 \).
- (שורות שביעית ושמינית) עכשיו מוציאים שורש ל-72.25 (בלי הסבר איך) ומקבלים 8.5 (\( \sqrt{\frac{b^{2}}{4}-c} \))
- (שורות תשיעית ועשירית) מחסרים מהתוצאה הזו את \( 3.5 \) שחישבנו קודם ומקבלים 5 (\( \sqrt{\frac{b^{2}}{4}-c}-\frac{b}{2} \))
- (שורות אחד-עשר ושנים-עשר) מציגים את התוצאה: 5 ו-12.
מה הולך פה? השלבים תואמים במדויק את החישוב של… של… של מה בעצם? של שיטת ההשלמה לריבוע, או של שיטת המרחק מהממוצע? התשובה היא, כמובן, שאת שניהם. מבחינה מתמטית כל השיטות הללו זהות. הטקסט הבבלי לא נותן לנו רמזים לגבי איך הגיעו לעשות את החישובים הללו - הוא מציג רק את האלגוריתם עצמו, בלי ה”הערות בקוד”. מה שאפשר לעשות הוא רק להעלות השערות ולבסס אותן על דברים אחרים שידועים על הבבלים והמתמטיקה הבבלית ולא נמצאים בתוך הלוח הזה עצמו. ההיסטוריון של המתמטיקה Jens Høyrup הציע פרשות אחת כזו שהיא נחמדה מאוד והצגתי אותה כבר פעמיים בבלוג - בפוסט על המשוואה הריבועית ובפוסט על פלימפטון 322, אבל למה לא פעם שלישית. הנה התמונה שבה השתמשתי בעבר:
מה הולך פה? באיור הזה סימנתי את המלבן המדובר, ששטחו 60, בתור \( A \). את אורכי הצלעות סימנתי ב-\( x,y \). זה אומר ש-\( y-x \) הוא ה-\( b \) שלנו: ההפרש בין אורכי הצלעות. עכשיו, הרעיון הוא שהשיטה עובדת כך: את \( A \) חותכים לשני חלקים - אחד הוא ריבוע שאורך צלעו \( x \) ומסומן \( B \), והשני הוא מלבן שמסומן \( C \) שאורך צלעו האחת הוא \( x \) ואורך צלעו השניה הוא “מה שנשאר” אחרי שחתכנו מהצלע הארוכה חתיכה באורך \( x \) - כלומר, נשאר \( b \). סכום השטחים של שני המרובעים הללו הוא עדיין 60.
עכשיו מגיע הטריק: לוקחים את \( C \) וחוצים אותו לשני חצאים, ואת אחד מהחצאים מדביקים על החלק התחתון של \( B \). קיבלנו שהוא משהו שהוא “כמעט ריבוע” חדש, וכדי לקבל ריבוע אנחנו משלימים אותו לריבוע על ידי הוספת ריבוע קטן יותר, \( D \).
אם זו אכן הטכניקה שהבבלים נקטו בה (ואין לדעת) אז שיטת הפתרון באמת צצה מאליה באופן טבעי לגמרי. לוקחים את ההפרש, \( b=7 \) ומחלקים אותו ב-2 - זה בדיוק שלב הפירוק של \( C \) לשני החלקים שלה. עכשיו מחשבים את השטח של \( D \), שהוא מה שנוסיף לצורה שלנו כדי להשלים אותה לריבוע - השטח הזה הוא בדיוק \( \frac{b}{2} \) בריבוע, כי אורך צלעו הוא \( \frac{b}{2} \). עכשיו מוסיפים לשטח של \( D \) את השטח של \( A \) המקורי - כלומר 60, והתוצאה היא השטח של הריבוע “הגדול”. עכשיו מוציאים שורש כדי לגלות את אורך צלע הריבוע הגדול - ומכיוון שאורך הצלע הזו הוא בדיוק \( x+\frac{b}{2} \), נשאר לחסר \( \frac{b}{2} \) מהתוצאה וסיימנו.
אני לא יודע אם הבבלים אכן חשבו על זה בצורה הזו, אבל אני יודע שבסטנדרטים של היום התיאור הזה הוא יפהפה ואינטואיטיבי ולי הוא בהחלט עזר להפיל אסימון לגבי שיטת ההשלמה לריבוע - עכשיו אנחנו רואים בדיוק למה להוסיף \( \left(\frac{b}{2}\right)^{2} \) ורואים בעיניים איך זה “משלים לריבוע” משהו. אני בהחלט חושב שזה משהו שיכול להיות נחמד מאוד אם יופיע בכל ספרי הלימוד, ולא רק ההסבר “האלגברי”.
ואיך ההסבר הגאומטרי הזה משתלב עם שיטת “המרחק מהממוצע”? ובכן, נתחיל מכך שבשיטת “המרחק מהממוצע” אנחנו מסתכלים כאן על המקרה שבו הממוצע שלילי, כי \( b \) אצלנו חיובי והממוצע הוא \( -\frac{b}{2} \). הבבלים, כזכור, לא מתעניינים בפתרון השלילי בכלל אלא רק בחיובי, אבל זה לא אומר שהפתרון השלילי לא נוכח בתמונה: סימנתי בתור \( y \) את אורך הצלע הארוכה יותר; לא קשה להשתכנע שבמקרה הזה \( -y \) הוא הפתרון השלילי של המשוואה \( x^{2}+bx+c \) (כי \( x\cdot y=-c=60 \) במקרה שלנו ו-\( b=y-x \) ולכן \( -b=x+\left(-y\right) \)). אז “הממוצע של הפתרונות” הוא במקרה הזה מינוס אורך הצלעות של ה-\( C \)-ים אחרי הפיצול, ומה שקראנו לו \( z \) - “המרחק מהממוצע” הוא במקרה הנוכחי אורך צלע הריבוע הגדול שצריך להוסיף לממוצע כדי לקבל את \( x \). האינטואיציה של שיטת ממוצע הפתרונות נשמרת, לטעמי, בפתרון הגאומטרי - “שוברים” את המלבן \( y-x \) לשני חלקים שווי גודל; אם לוקחים את התוצאה ומחסירים ממנה את החלק שעוד מחובר אליה מקבלים את הצלע הקטנה יותר, ואם מוסיפים לה את מה שהסרנו ממנה מקבלים את אורך הצלע השניה.
האם זה אומר שהבבלים “ידעו” את השיטה הזו? אני מקווה שבשלב הזה ברור למה השאלה הזו היא קצת חסרת משמעות. הבבלים לא ניסו לפתור משוואה ממעלה שניה; הם ניסו לפתור בעיה של מציאת צלעות של מלבן. מושג כמו “משוואה ממעלה שניה” היה זר להם; מושג כמו פתרונות שליליים של משוואה ממעלה שניה היה זר להם. לקח למתמטיקה זמן להתחיל להסתכל על השאלות הללו כך ולנסות לפתור אותן - וזה אנכרוניזם לנסות לחשוב על כך בצורה אחרת, ובטח שזה אנכרוניזם לומר ש-4,000 שנה אף אחד לא שם לב למשהו שנמצא מתחת לאף.
מצד שני, הטכניקות שעליהן מדובר פה? אנחנו רואים כאן היטב שהבבלים שלטו בהן, וקרוב לודאי שהייתה להם אינטואיציה טובה לגביהן בדיוק כמונו. את האלגוריתם החישובי שהשיטות האלגבריות שלנו מציעות הם בוודאי ידעו בצורה מדויקת לגמרי. כל מה שנשאר הוא ה”הערות בקוד” - וכאן הבבלים עוזרים לנו עם הגישה הגאומטרית בדיוק כפי שאנחנו אולי היינו יכולים לעזור להם עם הגישה האלגברית. ככה זה: מרבה שיטות, מרבה אינטואיציות, מרבה שמחה.
נהניתם? התעניינתם? אם תרצו, אתם מוזמנים לתת טיפ: