אז איך פותרים משוואה ריבועית?

אחת מהשאלות שהביאה נפשות תועות לבלוג הייתה “איך פותרים משוואה ריבועית”. תכננתי לענות עליה במסגרת מדור “שאלות ותשובות”, תשובה שהייתה בערך זו: “הפתרון של המשוואה \( ax^2+bx+c=0 \) הוא \( x_{1,2}=\frac{-b\pm\sqrt{b^2-4ac}}{2a} \)”, אבל אז הבנתי שזו אולי תשובה נכונה ומדוייקת, אבל התחמקות גמורה מהשאלה. אנסה להסביר מדוע.

לא מזמן ראיתי הרצאה של מתמטיקאי שעסקה בשאלת המבחנים האמריקאיים אל מול המבחנים הפתוחים. מהר מאוד ההרצאה התגלגלה למערכת החינוך המוצלחת שלנו ושיטות אי-הוראת המתמטיקה בה. המרצה סיפר את סיפור הזוועה הבא על בנו: הבן, שמתכונן לבחינות הבגרות, היה צריך לפתור את המשוואה הבאה: \( (x-6)^2=900 \). מה עשה הבן? פתח את הסוגריים, קיבל \( x^2-12x+36=900 \). העביר אגף, קיבל את המשוואה \( x^2-12x-864=0 \) שמתאימה ל”צורה הכללית”, ופתר באמצעות הנוסחה. על פניו, פתרון כשר ותקין לחלוטין, אז מה הבעיה? שאני נתקף חלחלה רק מעצם המחשבה על ביצוע החישובים שנדרשים להצבת הערכים הללו בנוסחה הכללית, ועם זאת אני מסוגל לפתור את המשוואה המקורית בשניות, רק מהסתכלות עליה, ולדעת שהפתרונות הם 36 ומינוס 24. לא כי אני מחשבון אנושי, חלילה; פשוט מכיוון שאני רואה שאפשר להוציא מייד שורש משני האגפים ולחבר 6 לשניהם כדי לקבל את הפתרונות.

מה הבעיה כאן? שהבן התרגל לפתור משוואות בצורה מכנית, כאילו היה מחשב. רואים משוואה? מייד להביא אותה ל”צורה הכללית” שמכירים, ומשם לפתור עם הנוסחה. החישובים אולי יהיו קקי, אבל ממילא מחשבון הוא סטנדרט בכל בחינה תיכונית במתמטיקה (לצורך ההשוואה - יש רק קורס מתמטי אחד שלמדתי אי פעם באוניברסיטה שבו הורשינו להשתמש במחשבון; וגם בו הוא היה מיותר לגמרי. זה היה הקורס שעסק בשיטות שבהן מחשבים משתמשים כדי לבצע חישובים נומריים). האירוניה כאן היא שכל הרעיון שמאחורי הנוסחה (“נוסחת השורשים”) הוא הבאה של המשוואה הכללית לצורה של “משהו בריבוע שווה מספר”, כמו זו שממנה הבן התחיל.

אלא מה? אני די בספק אם רבים מהתלמידים בבית הספר זוכרים את ההוכחה של נוסחת השורשים - אם בגלל שלא לימדו אותם, ואם בגלל שלא לימדו אותם למה לדעת את ההוכחה חשוב. כשכל מה שצריך לדעת הוא התוצר הסופי (הנוסחה), למי אכפת ממה שקרה בדרך? וכך מתעלמים מהסיבה האמיתית שבגללה לומדים הוכחות (גם את זה המרצה אמר, כציטוט של מישהו אחר…) - לא בשביל לדעת שמשהו הוא נכון, אלא כדי לדעת למה הוא נכון. וכשיודעים את ה”למה”, קל גם לזהות מצבים שבהם אין צורך בנוסחה הכללית ויש “דרך קיצור” נוחה.

אם כן, איך הגיעו לנוסחה הכללית? מה השיטה שעומדת בבסיסה? השיטה היא שיטה עתיקת יומין, שקיימת לפחות מימי הבבלים - שיטת ה”השלמה לריבוע”. אציג אותה כאן ראשית כל בניסוח “אלגברי” מודרני - בתור משהו שמושג על ידי מניפולציה של סמלים. עם זאת, הדבר המעניין בשיטה הזו, לטעמי, הוא דווקא הצורה שבה הבבלים הבינו אותה. הבבלים לא עסקו כלל באלגברה. הם לא ייצגו ערכים על ידי משתנים. מה שהם כן עשו היה לפתור בעיות ספציפיות בעזרת אלגוריתמים כלליים, והשלמה לריבוע היא דוגמה לאלגוריתם שכזה. בפרט, ממש רואים בה את ה”ריבוע” פיזית. לכן אציג גם את מה שאני מכיר בתור השיטה הבבלית (כמובן, ייתכן שזו לא באמת השיטה שבה הבבלים השתמשו; אני לא היסטוריון של המתמטיקה אלא רק מסתמך על כאלו).

אם כן, משוואה ריבועית “כללית” מסומנת ב-\( Ax^2+Bx+C=0 \) כאשר \( A,B,C \) הם מספרים ממשיים (אבל לא רק; כפי שתראו, מה שאציג עובד בכל שדה - כלומר, בכל קבוצה שיש בה פעולות של חיבור, חיסור, כפל וחילוק שמקיימות את התכונות שאנו מכירים ואוהבים) ואנו מעוניינים לגלות מספר שכאשר מציבים אותו במקום \( x \) המשוואה מתקיימת. הדבר הראשון שעושים הוא להעביר את המשוואה לצורה פשוטה קצת יותר: \( x^2+\frac{B}{A}x+\frac{C}{A} \) - כלומר, חילקתי ב-\( A \). אי אפשר לחלק ב-\( A \) אם הוא 0; אבל במקרה כזה, אין לנו את \( x^2 \) בשום מקום במשוואה ולכן זו לא משוואה ריבועית. אסמן \( b=\frac{B}{A}, c=\frac{C}{A} \) ומעכשיו ועד עולם אפשר לדבר על הדרך התיאורטית הכללית לפתור את המשוואה \( x^2+bx+c=0 \). כפי שתראו, חיסול אחד מהמקדמים פשוט מקל על החישובים (ועל הצגת השיטה הבבלית).

מה כעת? מבחינה אלגברית, השאיפה שלנו תמיד בפתרון משוואות הוא לרכז את כל ה-\( x \)-ים בצד אחד, ואת כל המספרים שאינם \( x \) בצד השני. על כן, מעבירים אגף ומקבלים \( x^2+bx=-c \). כעת, היינו רוצים להוציא את \( x \) כגורם משותף, אבל אז היינו מקבלים \( x(x+b)=c \). מכיוון שיש \( x \) גם בסוגריים אין הרבה תועלת בפעולה הזו - קשה “לבודד” את \( x \). לכן משתמשים בתעלול.

התעלול הוא כדלהלן: ידוע שמתקיים \( (x+t)^2=x^2+2tx+t^2 \) וזאת לכל \( x,t \). מה שטוב בכך הוא שזה מאפשר לנו להפוך סכום של \( x^2 \) שמופיע בו גם \( x \) למשהו שמכיל רק \( x \). אם כן, רוצים לחשוב על \( x^2+bx \) בתור ביטוי מהצורה שלעיל, אבל לעת עתה הם ממש לא דומים; בביטוי שלמעלה יש שלושה מחוברים, וכאן יש רק שניים. הפתרון לכך פשוט - נחבר את אותו המספר לשני אגפי המשוואה (נשלים את אגף שמאל של המשוואה כך שיהיה ריבוע של מספר כלשהו). המספר אמור להיות \( t^2 \), אבל לא ברור לנו עדיין מהו \( t \). כדי להבין מה הוא אמור להיות, נשווה את המקדמים של \( x \) בשתי המשוואות; נקבל \( b=2t \), כלומר \( t=\frac{b}{2} \). אם כן, מה שיש לחבר לשתי המשוואות הוא \( t^2=\frac{b^2}{4} \). נעשה זאת ונקבל את המשוואה:

\( x^2+bx+\frac{b^2}{4}=\frac{b^2}{4}-c \)

כעת אפשר “לסגור” את אגף שמאל על פי הנוסחה שכבר ראינו:

\( \left(x+\frac{b}{2}\right)^2=\frac{b^2}{4}-c \)

כדי להקל לעצמי על החיים אני “מעלה” את \( c \) אל השבר באגף ימין על ידי טריק נפוץ נוסף - אני כופל ומחלק אותו ב-4:

\( \left(x+\frac{b}{2}\right)^2=\frac{b^2-4c}{4} \)

וכעת אני מוציא שורש מאגף שמאל, ולכן גם מאגף ימין. זה, כאמור, לב העניין כולו וזו הייתה המטרה המרכזית שלי:

\( x+\frac{b}{2}=\pm\sqrt{\frac{b^2-4c}{4}} \)

לא תמיד אפשר להוציא שורש לאגף ימין - למשל, כשאנו עוסקים במספרים ממשיים בלבד, מה שמופיע באגף ימין חייב להיות מספר לא שלילי. לכן לא לכל משוואה יש פתרון מאותו השדה (תמיד יש לה פתרון בשדה רחב יותר, כמו למשל במקרה של המרוכבים, אך לא ניכנס לזה). חשוב גם לשים לב לכך שקיבלנו שני פתרונות במקרה הכללי, כי הוצאת שורש אינה פעולה חד ערכית.

כעת מעבירים את \( \frac{b}{2} \) אגף, ובאותה הזדמנות אפשר להשאיר את השורש על המונה של אגף ימין בלבד, כי להוציא שורש למכנה אנו יודעים:

\( x=\frac{\pm\sqrt{b^2-4c}}{2}-\frac{b}{2} \)

ובצורת כתיבה אחרת מקבלים את הנוסחה המוכרת לנו:

\( x=\frac{-b\pm\sqrt{b^2-4c}}{2} \)

אם מציבים \( b=\frac{B}{A}, c=\frac{C}{A} \) במשוואה הזו מקבלים את הנוסחה הכללית ביותר (הטריק היחיד שיש לבצע כאן הוא לכפול ולחלק את \( C \) שבתוך השורש ב-\( A \), ואז ניתן להוציא את \( \frac{1}{A^2} \) מחוץ לשורש): \( x=\frac{-B\pm\sqrt{B^2-4AC}}{2A} \)

הגרסה הזו נוחה במקרים שבהם לא כיף לחלק ב-\( A \) ואז לחשב כל מני דברים מעצבנים, כמו את הריבוע של \( \frac{B}{A} \).

אם כן, זו הגישה ה”אלגברית” לכל זה. אבל מה הבבלים עשו? האם יש אינטואיציה לפתרון שהיא מעבר ל”אם נעשה את המניפולציה הזו והזו על הסמלים הזה והזה, יצא לנו משהו נחמד”?

הבבלים עוסקים בשאלה שבמבט ראשון נראית קשורה רק למחצה, במקרה הטוב: נתון להם מלבן. הם יודעים את שטח המלבן ואת ההפרש בין אורך צלעותיו של המלבן. המטרה: לגלות את אורך הצלעות. ראשית אציג את הדרך שבה פותרים את הבעיה הזו; אחר כך אסביר מדוע עבור מקרים רבים זו הבעיה שלנו, בתחפושת. נתחיל בתמונה אחת ששווה אלף מילים - תיאור התהליך כולו.

כעת להסבר. אנחנו מתחילים ממלבן A שאורך צלעותיו הוא הנעלמים \( x,y \). מה אנחנו כן יודעים? את שטחו \( xy \) ואת הערך \( y-x \).

הרעיון הכללי בבנייה הוא להפוך את המלבן לריבוע. לשם כך יהיה צורך “להשלים” אותו על ידי הוספת פיסה נוספת - זו ה-D שמופיעה בשלב האחרון. את התהליך מתחילים כך: A הוא מלבן, ולכן יש בו צלע ארוכה וצלע קצרה יותר. אפשר להעביר מקביל בתוך המלבן לצלע הקצרה יותר כדי לחלק את A לריבוע (B) ולמלבן קטן יותר, C. אורך הצלע של הריבוע B הוא \( x \), ואילו אורך הצלעות של C הוא \( x \) ו-\( y-x \) (כי “גזרנו” מהצלע שאורכה \( y \) קטע שאורכו \( x \)). מה שחשוב במלבן החדש הוא שאנו יודעים את אורך הצלע \( y-x \) - זה חלק מהנתון.

כעת, מחלקים את המלבן הזה לשני חלקים - C1,C2. את C1 משאירים במקומו, אבל עם C2 יוצאים לטיולים. לוקחים אותו, מסובבים אותו ב-90 מעלות, ומדביקים אותו בחלק התחתון של הריבוע B. זה יוצר לנו צורה שהיא “כמעט ריבוע” - אורך צלעה הוא \( x+\frac{y-x}{2} \), אך חסר בה חלק. את החלק הזה - D - “משלימים”, ומקבלים ריבוע תקין.

מה שטח הריבוע הזה? את זה אפשר לדעת מהנתונים. זה שווה לשטח המלבן המקורי, ועוד שטח D. את שטח D יודעים, כי D הוא ריבוע שאורך צלעו \( \frac{y-x}{2} \), ושטח D הוא פשוט ריבוע האורך הזה. אם כן, את השטח הכולל, שאסמן ב-\( S \), אפשר לחשב באמצעות חיבור שטח A לשטח D. בנוסף, ידוע ששטח זה הוא הריבוע של אורך הצלע של הריבוע שיצרנו: \( S=\left(x+\frac{y-x}{2}\right)^2 \). זהו מקורה ה”היסטורי” של המילה “ריבוע” (באנגלית Square; וכאשר מדברים על חזקה שלישית, זה Cube - אני מניח שכעת ברור למה). אם כן, כל מה שנשאר לעשות הוא להוציא שורש לשטח הריבוע, שאותו כאמור אנו יודעים, וקיבלנו את \( x+\frac{y-x}{2} \). מכיוון שאנחנו יודעים את \( \frac{y-x}{2} \), קל לגלות את \( x \), ולכן גם את \( y \).

את כל זה הצגתי, שוב, בגישה אלגברית יחסית, תוך שימוש במשתנים. הבבלים פשוט הציגו את זה בעזרת דוגמאות. למשל, נניח ששטח המלבן הוא 7 וההפרש בין אורכי הצלעות הוא 6: אז אורך C יהיה 6, ולכן חצי מאורך C יהיה 3. לכן שטח D יהיה 9, ולכן השטח הכולל של הריבוע הגדול יהיה 16 - לכן אורך צלעו של הריבוע הגדול הוא 4, ולכן אורך צלע אחת של הריבוע המקורית הוא \( 4-3=1 \) (ה-3 הגיע מ”חצי מאורך C”). לכן אורך הצלע השנייה הוא 7, וגמרנו.

לדעתי השיטה הזו נאה מאוד גם בקני המידה של ימינו. הנה הצורה שבה אני לפחות, כתוצר משובח של מערכת החינוך שלנו, הייתי ניגש לבעיה הזו אם היו מציגים לי אותה בניסוח אלגברי טהור, כלומר מציגים בפני את שתי המשוואות \( xy=7, y-x=6 \): הייתי מחלץ מהמשוואה השנייה \( y=6+x \), מציב במשוואה הראשונה \( x(6+x)=7 \). פותח סוגריים ומקבל \( x^2+6x-7=0 \), וכאן משתמש בנוסחת השורשים ומקבל \( x=\frac{-6\pm\sqrt{36+28}}{2}=\frac{-6\pm 8}{2} \) ובסופו של דבר, את התוצאות \( x=1 \) ו-\( x=-7 \) (שלא מתאים לתיאור הגאומטרי, שבו אורכים הם תמיד חיוביים). כמות החישובים שהגישה הזו דרשה ממני היא גדולה יותר, ואני מבצע אותה לאט יותר (מחשב, כמובן, יעדיף את הגישה האלגברית…).

טרם סיימתי. טענתי קודם שהשיטה הזו של הבבלים היא (לא תמיד, אבל במקרים רבים) השיטה לפתרון משוואה ריבועית שאנו מכירים, פשוט בתחפושת. על פניו, לא נראה שיש קשר ישיר ביניהן; הרי כאמור, השיטה הזו פותרת את מערכת המשוואות \( xy=t_1,y-x=t_2 \) (כש-\( t_1,t_2 \) הם מספרים כלשהם). כדי להבין איך זה מתקשר למשוואות ריבועיות “רגילות”, צריך להיזכר במה שמכונה “נוסחאות וייטה”.

נניח שיש לנו את המשוואה הריבועית \( x^2+bx+c=0 \). אפשר לחשוב על בעיית הפתרון שלה כעל בעיית מציאת השורשים של הפולינום \( x^2+bx+c \). נניח שהשורשים הם \( \alpha,\beta \). היכרות עם תכונות של פולינומים מראה שקיים פולינום יחיד ממעלה שנייה שאלו הם שורשיו, וניתן לכתוב אותו בתור \( (x-\alpha)(x-\beta) \). לאחר פתיחת סוגריים מקבלים \( x^2+(-\alpha-\beta)x+\alpha\beta \). אם כן, קיבלנו \( b=-\alpha-\beta \) ו-\( c=\alpha\beta \). אלו הן נוסחאות וייטה עבור משוואה ריבועית - הן מראות שמקדמי המשוואה הם פשוט מינוס הסכום והמכפלה של הפתרונות. במקרה שלנו, זה עוזר לנו “להנדס” בעיית מלבן שתפתור לנו את המשוואה הריבועית. הבעיה המרכזית כאן היא שפתרון בעיית המלבן מבוסס על הכרת ההפרש בין שני המספרים שאנו מחפשים, ואילו כאן נתון לנו דווקא מינוס הסכום שלהם. לכן נשתמש בתעלול הבא: אם \( \alpha,\beta \) הם הפתרונות של המשוואה, אז \( b=-\beta-\alpha \). אם נסמן \( x=\alpha, y=-\beta \) (סליחה על השימוש הכפול ב-x - אני מנסה להיות קונסיסטנטי עם השימוש בו בבעיית המלבן) נקבל \( b=y-x \), בדיוק כמו בבעיית המלבן. לכן, אם נפתור את בעיית המלבן ונמצא \( x,y \), הפתרונות למשוואה הריבועית יהיו \( x,-y \).

מה עוד נשאר כדי לקבל בעיית מלבן? צריך לדעת גם את \( xy=-\alpha\beta=-c \) - וכאמור, אנו יודעים אותו. אם כן, כדי לפתור את המשוואה הריבועית אנו פותרים בעיית מלבן עם שטח \( -c \) והפרש צלעות \( b \) ואז מתרגמים את פתרונות בעיית המלבן חזרה לפתרונות של המשוואה הריבועית.

כמובן, השיטה הזו תקפה רק אם \( c \) שלילי, אחרת נקבל בעיית מלבן לא הגיונית, עם שטח שלילי; לכן לא ניתן לטפל במשוואות כמו \( x^2+1=0 \) בעזרת השיטה הזו. עם זאת, אני חושב שבהתחשב בכך שהמתמטיקה הבבלית הייתה קיימת למעלה מאלף וחמש מאות שנים לפני הספירה, אני חושב ששיטת ההשלמה לריבוע היא הישג מרשים ונאה ביותר לזמנו.

נהניתם? התעניינתם? אם תרצו, אתם מוזמנים לתת טיפ: