אז איך באמת פותרים משוואה ריבועית?

מבוא

אחד הפוסטים הפופולריים ביותר בבלוג מבחינת מספר כניסות הוא הפוסט על "איך פותרים משוואה ריבועית?" שנמצא כאן, מן הסתם כי זו שאלה נפוצה שהרבה אנשים מחפשים. הפוסט ההוא נכתב לפני 15 שנים ושם דגש בעיקר על הבנה של שיטת הפתרון הכללית. אני רוצה עכשיו לעשות עוד סיבוב על הנושא הזה ולנקוט בגישה טיפה יותר פרקטית, למרות שגם לשיטה הכללית נגיע. התקווה שלי היא שהפוסט הזה יוכל להיות כזה שמגיעים אליו בלי לדעת כלום על משוואות ריבועיות, ויוצאים ממנו עם הבסיס של מה שצריך כדי להתמודד עם מה שזורקים עלינו בבית הספר בלי להיכנס לחרדות (אבל רק הבסיס! את התרגול המשמעותי שצריך לעשות אני לא עושה כאן).

אז נדבר על מה זה בכלל, מה הטריקים הפשוטים שעוזרים לנו לפתור את זה במקרים רבים ולמה הם עובדים, ובסוף - מה הדרך הכללית להתמודד עם זה ולמה היא נכונה. אבל נתחיל ממה זה בכלל.

מה זו משוואה? הנה דוגמא: \(2x+3=7\). יש לנו כאן סימן שוויון \(=\), והרעיון הוא שמה שנמצא בצד ימין שלו אמור להיות שווה למה שנמצא בצד שמאל שלו. בצד ימין יש פשוט מספר, \(7\), אבל בצד שמאל כתוב משהו יותר מסובך שמערב את האות \(x\). ה-\(x\) הזה נקרא משתנה והרעיון בו הוא שאנחנו יכולים להחליף אותו בכל מני ערכים (ולכן "משתנה" - הערכים ש-\(x\) מייצג יכולים להשתנות). אם נחליף את \(x\) ב-2 נקבל את המשוואה \(2\cdot2+3=7\), ובאמת צד ימין שווה לצד שמאל; אבל אם נחליף את \(x\) ב-1 נקבל \(1\cdot2+3=7\) וזה משהו לא נכון כי \(5\ne7\). לכן אנחנו אומרים ש-\(2\) הוא פתרון של המשוואה \(2x+3=7\) ואילו \(1\) הוא לא פתרון. וכשאני מדבר על "לפתור משוואה" אני מתכוון - למצוא את הפתרונות שלה; למצוא את הערכים שאפשר להציב ב-\(x\) ולקבל שני אגפים שבאמת שווים זה לזה.

בואו נראה דוגמא קצת יותר מסובכת למשוואה: \(x^{2}+3=2x+11\). כאן יש לנו את \(x\) בשני הצדדים (האגפים, כפי שאני בדרך כלל קורא להם) של המשוואה, ובאגף שמאל כתוב \(x^{2}\), כלומר \(x\) בחזקת 2, כלומר \(x\) כפול עצמו. הנוכחות הזו של \(x^{2}\) בתוך המשוואה, אבל בלי שיהיו חזקות גבוהות יותר של \(x\) או ביטויים מסובכים יותר שמערבים את \(x\), הופכת את המשוואה למשוואה ממעלה שניה, שהיא נושא הפוסט. למה משווואת ממעלה שניה מעניינות כל כך? כי כמו רוב הדברים המעניינים במתמטיקה - מצד אחד הן מסוגלות לתאר דברים לא טריוויאליים והפתרון שלהן הוא לא לגמרי טריוויאלי, אבל מצד שני הן אחד מהדברים המועטים שאנחנו כן יודעים לפתור בצורה משביעת רצון (משוואות ממעלה שלישית ומעלה זה עולם מסובך בהרבה ולא אדבר עליו בכלל בפוסט).

אם בודקים, רואים ש-\(x=4\) הוא פתרון של המשוואה: אם נחליף את \(x\) ב-4 (נציב 4 ב-\(x\), כמו שאני הולך לומר מכאן ואילך) נראה שבשני אגפי המשוואה אני מקבל 19. לכן 4 הוא פתרון של המשוואה, אבל הוא לא הפתרון היחיד שלה: \(x=-2\) גם הוא פתרון, כי אם נציב אותו במשוואה נקבל בשני האגפים \(7\). באופן כללי, למשוואה ממעלה שניה יכולים להיות שני פתרונות, או פתרון אחד, או אפס פתרונות אבל בשום פנים ואופן לא שלושה פתרונות או יותר; אדבר על זה קצת יותר לעומק בהמשך (כי אני טיפה - ממש טיפה! - משקר פה).

עכשיו מגיעה השאלה המתבקשת - איך בעצם מצאתי את הפתרונות? מציאת הפתרונות הללו היא מה שאנחנו קוראים לו "לפתור משוואה ריבועית" ומה שאני רוצה להציג בפוסט. כבר מראש אני אגיד שיש דרך כללית לפתור משוואות ריבועיות, שפותרת כל משוואה כזו, באמצעות משהו שנקרא נוסחת השורשים. אני אדחה את ההצגה של השיטה הזו לסוף כי היא לא תמיד הדרך הכי נוחה לפתור משוואה כזו, וכי זה החלק הכי משעמם/מאיים/מפחיד/קשה לשינון בכל הסיפור.

חלק ראשון, ובו פותרים משוואות קלות במיוחד ורואים את המבנה הכללי של משוואה ריבועית

יש כמה מקרים שבהם קל יחסית לפתור משוואות ריבועיות. הנה אחד מהם: \(x^{2}=100\). איזה מספר, כשמעלים אותו בריבוע, מחזיר 100? ובכן, 10 כפי שאולי אנחנו זוכרים מלוח הכפל. אבל לא רק 10, אלא גם \(-10\), כי כשמכפילים את \(-10\) בעצמו יש לנו מקרה של "מינוס כפול מינוס שווה פלוס" (יש לי פוסט על למה הדבר הזה קורה).

זה היה קל יחסית, אבל מה עם \(x^{2}=121\)? כאן הפתרון הוא \(x=\pm11\) (ה-\(\pm\) הזה הוא דרך קומפקטית עבורי לכתוב את שני הפתרונות יחד), אבל מי בעצם יודע את זה? רק מי שיודע ש-\(11^{2}=121\), וזה לא שיש לנו סיבה טובה לדעת את זה. אם נצטרך לפתור שאלה כזו ויהיה לנו מחשבון בהישג יד, מה שנעשה הוא להשתמש בכפתור שעליו מופיע הסימן \(\sqrt{}\) - לבצע את הפעולה של הוצאת שורש ריבועי. האם זה משהו שאפשר לעשות גם ידנית? התשובה היא כן, ויש לזה כמה שיטות (אני טיפה מדבר על זה כאן), אבל בעיקרון - זה בהחלט משהו שאפשר להגיד "מחשב יודע לפתור" או אפילו לכתוב \(x=\pm\sqrt{121}\) וזהו. גם לא תמיד יש לנו דרך יותר טובה לכתוב את הפתרון: עבור המשוואה \(x^{2}=2\) הפתרון הוא \(\pm\sqrt{2}=\pm1.41421\ldots\), כאשר שלוש הנקודות אומרות "לא סיימנו לכתוב את הספרות כי יש אינסוף כאלו אבל נגמר לנו הכוח". זה לא ייצוג טוב יותר מאשר \(\sqrt{2}\) עצמו. גם בפתרון הכללי של משוואות ממעלה שניה באמצעות נוסחת השורשים, הוצאת שורש היא שלב מרכזי בתהליך, וגם אז לפעמים יותר נוח לנו להשאיר את התוצאה בתור משהו עם סימן שורש מעליו ותו לא. למשל, אנחנו הולכים לראות בהמשך שפתרון של המשוואה \(x^{2}=x+1\) הוא מספר \(\varphi=\frac{1+\sqrt{5}}{2}\). זה מספר שמוצג באמצעות ביטוי שמערב את \(\sqrt{5}\) ועם זאת העובדה שהוא מתואר באמצעות שורש לא מנעה מהמספר הזה לזכות בכינוי "יחס הזהב" ולקבל ספרים ומאמרים משתפכים על כמה הוא המספר המדהים בתולדות המתמטיקה. אז בעיקרון, אם יש סימן שורש בפתרון זה לא סוף העולם, למרות שאם השורש הוא מספר שלם, כמו במקרה \(\sqrt{121}=11\), כן יותר נחמד בלעדיו.

הנה דוגמא אחרת למשוואה ריבועית שקל יחסית לפתור: \(x^{2}=10x\). במקרה הזה, יש שתי אפשרויות: או ש-\(x=0\) (קל לראות שהצבת \(x=0\) תיתן אפס בשני האגפים ולכן זה פתרון של המשוואה) או ש-\(x\ne0\). אם \(x\ne0\) אפשר לחלק בו ולקבל \(x=10\), כלומר אלו שני הפתרונות של המשוואה.

מה משותף לשני סוגי המשוואות ה"קלים" הללו? בואו נתאר משוואות ממעלה שניה בצורה גנרית, כללית, ואז נראה איך שני אלו הם מקרים פרטיים פשוטים יחסית.

מבנה כללי למשוואה ממעלה שניה הוא \(ax^{2}+bx+c=0\), כאשר \(a,b,c\), שנקראים המקדמים של המשוואה, הם מספרים שכדי לתאר בצורה כללית אני כותב בצורת אותיות. אף משוואה ממעלה שניה שהצגתי בפוסט עד עכשיו לא נכתבה בצורה הזו, אבל קל מאוד להביא אותן לצורה הזו. למשל, הצגתי קודם את המשוואה \(x^{2}+3=2x+11\). אני יכול עכשיו לבצע מה שנקרא העברת אגפים כדי להביא אותה לצורה הכללית: אני אקבל \(x^{2}-2x-8=0\), כלומר במקרה הזה, \(a=1,b=-2,c=-8\) (מה זו העברת אגפים? למשל, אני מחסר 11 משני אגפי המשוואה ואז ה-11 שבאגף ימין נעלם ובאגף שמאל צץ יש מאין \(-11\); אפשר לדמיין את זה כאילו לקחנו את ה-11 מאגף ימין, העברנו אותו לאגף שמאל ו"שילמנו" על כך בהיפוך הסימן שלו).

עבור המשוואה \(x^{2}=121\) העברה לצורה הכללית נותנת \(x^{2}-121=0\), כלומר \(a=1,b=0,c=121\).

עבור המשוואה \(x^{2}=10x\) העברה לצורה הכללית נותנת \(x^{2}-10x=0\), כלומר \(a=1,b=-10,c=0\).

שתי הדוגמאות האחרונות מראות מה הופך את המקרים הללו לפשוטים יחסית: אחד מהמקדמים של המשוואה היה 0, או \(b=0\) או \(c=0\). ומה אם \(a=0\)? ובכן, זה המקרה הקל מכולם כי במקרה הזה התוצאה היא בכלל לא משוואה ריבועית; למשל, \(2x+3=7\) מתחילת הפוסט, כשמעבירים אותה לצורה הכללית, היא \(2x-4=0\) ואז \(a=0,b=2,c=-2\) ובמקרה הזה הכי קל לפתור אותה. מכיוון שהפוסט הזה עוסק במשוואות ריבועיות, אני אניח מכאן ואילך ש-\(a\ne0\) תמיד.

ראינו שמשוואה ריבועית נהיית "מעניינת" כשכל המקדמים שלה שונים מאפס. זה מביא אותנו לעוד משהו שכדאי לשים לב אליו - אם \(a\ne0\), ואמרנו שזה המקרה ה"מעניין" היחיד ממילא, אז תמיד אפשר לחלק בו ולקבל את המשוואה \(x^{2}+\frac{b}{a}x+\frac{c}{a}=0\) - משוואה חדשה שבה המקדם של \(x^{2}\) הוא 1. לעתים קרובות קל יותר לפתור משוואה בכזו סיטואציה - הפתרונות שהראיתי לשני המקרים הפשוטים אכן הסתמכו על כך. אם אני מסתכל על המשוואה \(4x^{2}=400\) אז אי אפשר סתם להוציא שורש ל-400 וזו תהיה התשובה: אני צריך קודם שהמקדם של \(x^{2}\) יהיה 4, אז אני מחלק את שני האגפים ב-4, מקבל \(x^{2}=100\) ומכאן אני כבר יודע לפתור. מה שכן, אם החלוקה במקדם של \(x^{2}\) יוצרת לנו שברים בתוך המשוואה, לעתים קרובות עדיף לוותר עליה כי חישובים בשברים הם עניין מעצבן יותר; בהמשך אני לא אניח ש-\(a=1\) עבור המקרים היותר כלליים שבהם אטפל.

עניין אחר שכדאי להביא בחשבון הוא שלא תמיד כל כך פשוט להביא את המשוואה לצורה הכללית שלה. למשל, במשוואה \(\frac{2}{x}+\frac{8}{x^{2}}=1\) שהפתרונות שלה הן \(4,-2\) נדרשת עבודה כדי להגיע לצורה הכללית, וכאן זה מקרה פשוט יחסית. אז גם אם אני הולך להראות איך פותרים משוואה בצורה כללית זה לא סוף הסיפור.

חלק שני, ובו אנחנו לומדים טריק שימושי מאין כמותו לניחוש פתרונות של משוואות ריבועיות

לא לכל משוואה ריבועית יש פתרון "נחמד". ראינו את \(x^{2}-x-1=0\) עם הפתרון \(\frac{1+\sqrt{5}}{2}\) - זה מספר שגם מערב שבר וגם מערב שורש, ובסטנדרט שלי זה "לא נחמד". נחמד זה מספר שלם, כמו 42 או \(-12\). מה שעוד יותר נחמד הוא שאם למשוואה ריבועית יש פתרון "נחמד" אחד אז נובע מזה גם שאם יש עוד פתרון, גם הפתרון האחר הוא נחמד, וגם שיחסית קל למצוא את שניהם מתוך הצורה הכללית של המשוואה, בלי נוסחת שורשים כללית ובלי כלום.

בואו נדגים את זה עם המשוואה \(x^{2}-2x-8=0\): ראשית אני אתאר את הקסם שבו אני משתמש, ואז אני אסביר איך הוא עובד. הקסם הוא כזה: במשוואה מהצורה \(ax^{2}+bx+c\) קוראים ל-\(a\) "המקדם המוביל" ול-\(c\) "המקדם החופשי". עכשיו, אם למשוואה יש שני פתרונות, אז המכפלה של אותם שני פתרונות תמיד שווה ל-\(\frac{c}{a}\), התוצאה של חלוקת המקדם החופשי במקדם המוביל. במקרה של \(x^{2}-2x-8=0\) המכפלה של שני הפתרונות חייבת לצאת \(-8\), מה שמאוד מקל עלי לנחש זוגות פוטנציאליים של פתרונות נחמדים: אני יודע ש-\(8=2\cdot4\) או \(8=1\cdot8\) ואלו שתי הדרכים היחידים להציג את 8 בתור מכפלה של שני מספרים שלמים חיוביים. כשאני מכניס את המינוסים לתמונה, אני מקבל בעצם ארבעה מקרים:

\(-8=2\cdot\left(-4\right)\)
\(-8=-2\cdot4\)
\(-8=1\cdot\left(-8\right)\)
\(-8=\left(-1\right)\cdot8\)

אפשר לבדוק את כל המקרים הללו במפורש על ידי הצבה במשוואה ובדיקה מה יקיים אותה; זה כמובן טוב יותר מאשר מה שהיה לנו קודם, שבו לא הייתה לנו בכלל רשימה של פתרונות פוטנציאליים והיינו צריכים פשוט להציב דברים אקראית מכל הבא ליד. ועדיין, בפני עצמו זה לא קסם מספיק טוב. היופי הוא שאפשר לשלב את הקסם הזה בקסם נוסף: הסכום של שני הפתרונות חייב להיות \(-\frac{b}{a}\), כלומר מינוס המקדם האמצעי חלקי המקדם המוביל. עבור \(x^{2}-2x-8=0\) הסכום חייב להיות 2, וזה כבר ממש קל: ברור שזוגות שמערבים את \(\pm1,\pm8\) בכלל לא רלוונטיים כי הסכומים שלהם לעולם לא יתנו 2. גם עבור \(2,-4\) הסכום לא יוצא מתאים: הוא יוצא מינוס 2 במקום 2. את כל זה אפשר לבדוק בזריזות בראש, ולהגיע למסקנה שאם יש זוג פתרונות "נחמדים" הם חייבים להיות \(-2,4\) ואז אפשר להציב אותם במשוואה ולראות שזה עובד.

בואו נחזור שוב על תיאור הקסם, בצורה מפורשת, וגם ניתן לו את שמו האמיתי - נוסחאות וייטה. הקסם אומר שעבור המשוואה \(ax^{2}+bx+c=0\):

מכפלת שני הפתרונות שווה ל-\(\frac{c}{a}\) (ואם יש פתרון יחיד, המכפלה שלו בעצמו שווה \(\frac{c}{a}\)).
סכום שני הפתרונות שווה ל-\(-\frac{b}{a}\) (ואם יש פתרון יחיד, הסכום שלו עם עצמו שווה \(-\frac{b}{a}\)).

בגלל שהחלוקה ב-\(a\) הזו קצת מעצבנת, המקרה הכי נוח לשימוש בנוסחאות הללו הוא כאשר \(a=1\) (כמו פחות או יותר כל דוגמא שהראיתי). באופן כללי, בהינתן המשוואה \(ax^{2}+bx+c=0\) עבור \(a\ne0\) אפשר לחלק אותה ב-\(a\) ולקבל \(x^{2}+\frac{b}{a}x+\frac{c}{a}=0\) ולכן מספיק להכיר את נוסחאות וייטה למקרה שבו \(a=1\), אבל אני בכל זאת אמשיך לעבוד עם הצורה הכללית יותר שלהן כדי שלא נגיע למצב (שאני כמעט תמיד נמצא בו, כולל בזמן כתיבת הפוסט הזה) של מין ערפל לא ברור לגבי מה קורה אם \(a\ne1\).

חשוב לציין, ותכף נראה זאת במפורש, שהנוסחאות הללו נכונות תמיד, לכל משוואה ריבועית בצורה הכללית שלה, בלי קשר לשאלה אם הפתרונות הם "נחמדים" או לא; העניין הוא שאם הפתרונות הם נחמדים, נוסחאות וייטה נותנות לנו דרך נוחה לנחש אותם. כדי לראות מקרה שבו הסיטואציה היא לא נחמדה בואו נחזור אל \(x^{2}-x-1=0\) והפעם אני אכתוב במפורש את שני הפתרונות:

\(\frac{1+\sqrt{5}}{2}\)

\(\frac{1-\sqrt{5}}{2}\)

קל לראות שהסכום של שני הפתרונות הוא 1, ולכן הוא יוצא \(-b\) כמו שהוא נדרש. מה שקרה פה הוא ששני הפתרונות היו דומים מספיק זה לזה כדי שהסכום שלהם "יקזז" את החלק הלא נחמד שלהם (השורש, השבר) ונקבל תוצאה שהיא מספר נחמד. גם המכפלה יוצאת נחמדה: \(\frac{1+\sqrt{5}}{2}\cdot\frac{1-\sqrt{5}}{2}=\frac{1-5}{4}=-1\). זה לא מקרי שהפתרונות כל כך דומים זה לזה; אני אעיר כאן שסוג כזה של דמיון בין פתרונות נותן להם במתמטיקה קצת יותר מתקדמת את השם "פתרונות צמודים" ואפשר להראות שאם למשוואה יש מקדמים "נחמדים" אז אם הפתרונות שלה אינם "נחמדים" הם חייבים להיות צמודים, אבל אני לא אכנס לפרטים של זה. הנקודה היא שבהחלט ייתכן שלמשוואה עם מקדמים שלמים יהיו פתרונות לא שלמים, ולכן למרות שהם עדיין מקיימים את נוסחאות וייטה קשה לומר שהן עוזרות לנו לנחש אותם (עדיין אפשר לנסות, אבל לדעתי בסיטואציה כזו כבר יותר קל להיעזר בנוסחת השורשים וחסל).

חלק שלישי, שבו אנחנו מנסים להבין למה הטריק בעצם נכון

הצגתי את הטריק בתור "קסם" כי זה משהו שנתתי בלי להסביר מאיפה הוא מגיע ולמה הוא נכון. זו גישה טובה כשרוצים להגיע מהר אל "איך משתמשים בזה", אבל זה לא ערפל שכדאי להשאיר לטווח ארוך. בואו נבין בדיוק למה זה עובד ונקבל מושג קצת יותר טוב על מה הולך במשוואות ריבועיות בעצם.

ראשית, צריך להזכיר כלל בסיסי בחשבון: חוק הפילוג. הוא אומר ש-\(a\left(b+c\right)=ab+ac\), כלומר אני יכול "לפתוח סוגריים" עם חיבור שמוכפלים באיזה \(a\) על ידי כך שאני כופל את ה-\(a\) בנפרד באיברים שבסוגריים ואז מחבר את הכל. עכשיו, נניח שבמקום \(a\) היה כתוב סכום, זה עדיין היה עובד באותה מידה, כלומר

\(\left(a+b\right)\left(c+d\right)=\left(a+b\right)c+\left(a+b\right)d\)

ואני יכול להשתמש שוב בחוק הפילוג עבור הסוגריים הנוספים שמופיעים כאן, ולקבל בסופו של דבר:

\(\left(a+b\right)\left(c+d\right)=ac+ad+bc+bd\)

כלומר, קיבלתי סכום של ארבע מכפלות, כשכל מכפלה מתקבלת על ידי "קחו איבר מהסוגריים השמאליים וכפלו אותו באיבר מהסוגריים הימניים". בשביל מה כל זה היה טוב? ובכן, בואו נסתכל עכשיו על מכפלה דומה:

\(\left(x-p\right)\left(x-q\right)=xx-xq-px+pq=x^{2}-\left(p+q\right)x+pq\)

הביטוי שהגענו אליו מזכיר מאוד את הצורה הכללית של משוואה ממעלה שניה! אבל יותר מזה, שימו לב שאם אני מציב ב-\(x\) את \(p\) או את \(q\) אני מקבל 0, כי אם אני מציב את אחד מאלו ב-\(\left(x-p\right)\left(x-q\right)\) אני אקבל מכפלה של 0 במשהו, ומכפלה כזו תמיד יוצאת 0. כלומר, גם \(p\) וגם \(q\) הם פתרונות של המשוואה הריבועית

\(x^{2}-\left(p+q\right)x+pq=0\)

עכשיו, מי המקדמים \(a,b,c\) במקרה הזה?

\(a=1\)

\(b=-\left(p+q\right)\)

\(c=pq\)

ואלו בדיוק נוסחאות וייטה שראינו קודם: \(\frac{c}{a}\) הוא מכפלת שני הפתרונות, \(b\) הוא מינוס הסכום של שני הפתרונות. האם הוכחתי את הטענה שלי? ובכן, לא בדיוק. הראיתי שאם אני בונה משוואה ריבועית על ידי המכפלה \(\left(x-p\right)\left(x-q\right)\), אז נוסחאות וייטה מתקיימות עבורה. בפועל כל משוואה ריבועית שבה \(a=1\) היא אכן מהצורה \(\left(x-p\right)\left(x-q\right)=0\) הזו, אבל יותר מסובך להוכיח את זה. לכן אני אוכיח משהו צנוע יותר: שאם \(ax^{2}+bx+c=0\) היא משוואה ריבועית, ואם מצאתי \(p,q\) כך ש-\(pq=\frac{c}{a}\) וגם \(p+q=-\frac{b}{a}\), אז \(p,q\) הם פתרונות של המשוואה. את זה אני אעשה על ידי סוג של הליכה "בכיוון ההפוך" ממה שכבר ראינו. ראשית כל אני אציב במקום \(b,c\) במשוואה את הערכים שמתבססים על \(p,q\), כלומר על בסיס

\(b=-a\left(p+q\right)\)

\(c=apq\)

ואני אקבל את המשוואה

\(ax^{2}-a\left(p+q\right)x+apq=0\)

עכשיו אחלק ב-\(a\) ואפתח סוגריים:

\(x^{2}-px-qx+pq=0\)

בשלב הזה אולי כבר אפשר לראות שקיבלתי את הביטוי \(\left(x-p\right)\left(x-q\right)=0\), אבל למקרה שקשה לראות את זה, הנה דרך מסודרת להגיע לשם. אני קודם כל מסתכל על שני האיברים הראשונים, \(x^{2}-px\) ואני מוציא גורם משותף לשניהם - במקרה הזה \(x\). אני מקבל

\(x^{2}-px=x\left(x-p\right)\)

(הוצאת גורם משותף כזו היא בעצם הצעד ההפוך לזה שעושים בחוק הפילוג).

עכשיו, עם הביטוי \(-qx+pq\) שהוא מה שנשאר בסכום הגורם המשותף הוא \(q\), אז אני מוציא אותו ומקבל

\(-qx+pq=-q\left(x-p\right)\)

שימו לב שיחד עם \(q\) גם הוצאתי החוצה \(-1\) כדי שהמקדם של \(x\) בסוגריים יהיה חיובי ודווקא של \(p\) יהיה שלילי. למה זה טוב? כי ה-\(x-p\) הופיע גם קודם! בואו נראה מה קיבלנו:

\(x^{2}-px-qx+pq=x\left(x-p\right)-q\left(x-p\right)\)

קיבלנו עוד סכום שאפשר להוציא ממנו גורם משותף (\(x-p\)) עם חוג הפילוג ההפוך, ונקבל

\(x\left(x-p\right)-q\left(x-p\right)=\left(x-p\right)\left(x-q\right)\)

וזה מה שבאמת הבטחתי. עכשיו, כשרואים את הביטוי בצורה הזו, ברור ש-\(p,q\) הם פתרונות של המשוואה \(ax^{2}+bx+c=0\) המקורית שממנה התחלנו.

למרבה הזוועה, את כל התהליך הכללי והגנרי הזה מכריחים לפעמים תלמידים בבית הספר לעשות שוב ושוב עבור מקרים קונקרטיים. בשביל מה בעצם? ובכן, בואו נדגים את זה על המשוואה \(x^{2}-2x-8=0\) האהובה עלי שכזכור, כבר ראינו שהפתרונות שלה הם \(4,-2\). הרעיון בשיטה הכללית שלי היה לפצל את האיבר האמצעי לסכום של שני איברים, וזה מה שאעשה גם כאן:

\(x^{2}-2x-8=0=x^{2}-\left(4-2\right)x-8=x^{2}-4x+2x-8\)

עכשיו מסתכלים על הביטוי שקיבלתי בתור סכום של שני זוגות: \(x^{2}-4x\) ו-\(2x-8\). בכל אחד מהם אנחנו מוציאים גורם משותף כמיטב יכולתנו, ומקבלים

\(x^{2}-4x+2x-8=x\left(x-4\right)+2\left(x-4\right)\)

וקסם! קיבלנו בשני הזוגות גורם משותף \(x-4\) שאפשר להוציא ולקבל

\(x\left(x-4\right)+2\left(x-4\right)=\left(x-4\right)\left(x+2\right)\)

ובעצם סיימנו כאן: הצגנו את \(x^{2}-2x-8\) בתור מכפלה \(\left(x-4\right)\left(x+2\right)\). מהמכפלה הזו אפשר "לקרוא" ישירות את פתרונות המשוואה, רק צריך לזכור שהם מופיעים בתוך הסוגריים עם סימן מינוס, כלומר ה-\(x-4\) מלמד אותנו על הפתרון \(4\) (לא על הפתרון \(-4\)) וה-\(x+2\), שהוא בעצם \(x-\left(-2\right)\) בתחפושת, מלמד אותנו על הפתרון \(-2\).

חלק רביעי, שבו אנו מגיעים אל נוסחת השורשים

אם כן, ראינו איך מתמודדים עם משוואות קלות במיוחד (כאלו שבהן \(b=0\) או \(c=0\)) וראינו טריק שמאפשר לפתור בקלות יחסית משוואות עם פתרונות נחמדים על ידי ניחוש מושכל של הפתרונות הללו; אבל כשרוצים לפתור משוואה ריבועית באופן כללי, לפעמים צריך להשתמש בשיטה הכללית ביותר המוכרת: נוסחת השורשים. בואו נציג את הנוסחה הזו כבר עכשיו ואז נדבר על מה הולך בה. הנוסחה אומרת שהפתרונות של המשוואה \(ax^{2}+bx+c=0\) נתונים על ידי

\(x_{1,2}=\frac{-b\pm\sqrt{b^{2}-4ac}}{2a}\)

כתבתי כרגע את הנוסחה הזו הישר מהראש שלי, בלי להיעזר בספרים ובלי כלום. האם זה בגלל שיש לי זיכרון פנומנלי? ממש לא, יש לי זיכרון די גרוע. האם זה בגלל שיש לי טריק פשוט שמאפשר לי לפתח את הנוסחה יש מאין בעזרת כוח שכלי? לא, אין לי שום טריק ושום כוח שכל. כתבתי את הנוסחה מהראש כי היא צרובה שם, עוד מימי בית הספר שלי, הרבה לפני שידעתי כמה מתמטיקה היא כיף. זה אחד מאותם דברים בודדים במתמטיקה שאני פשוט זוכר בעל פה וזהו, כי אין דרך אחרת. כמובן, יש דרך מסודרת להגיע אל הנוסחה הזו, זו לא סתם המצאה שנשלפה יש מאין, ואני הולך להראות את הדרך הזו כאן; אבל זה לא בדיוק עוזר לזכור אותה בעל פה.

בואו נשתמש בנוסחה כדי להתמודד עם משוואות שכבר ראינו כדי להיווכח שהיא עובדת, ואיך שהיא עובדת. נתחיל עם \(x^{2}-2x-8=0\) האהובה, שבה \(a=1,b=-2\) ו-\(c=-8\). במקרה הזה, הביטוי שהולך להופיע מתחת לסימן השורש הוא \(b^{2}-4ac=4+32=36\). זה מספר נחמד, במובן זה שיש לו שורש שלם: \(\sqrt{36}=6\). זה מה שמבטיח שנקבל פתרונות שלמים: \(x_{1,2}=\frac{2\pm6}{2}=1\pm3\), ואלו אכן שני הפתרונות שלנו: \(1+3=4\) ו-\(1-3=-2\). יפה, הנוסחה עובדת!

אותו ביטוי שמתחת לשורש, \(b^{2}-4ac\), נקרא הדיסקרימיננטה של המשוואה. נעזוב את השאלה מאיפה השם הזה הגיע ומה השימוש הכללי יותר שלו במתמטיקה ונתמקד בו בהקשר של המשוואה הזו: בגלל שהוצאת שורש היא פעולה מסוכנת משהו, הזהות של מה שנמצא בדיסקרימיננטה בעצם קובעת את גורל פתרונות המשוואה. אם הדיסקרימיננטה תהיה מספר טבעי נחמד עם שורש שלם, הפתרונות יהיו פשוטים; אם אין לו שורש שלם הפתרונות יהיו קצת פחות נחמדים; אם הדסיקרימיננטה היא 0 אז יהיה פתרון יחיד למשוואה; ואם הדיסקרימיננטה תהיה מספר שלילי אז לא יהיו פתרונות שהם מספרים ממשיים בכלל. תכף אתן דוגמאות לזה (ובסוף הפוסט יהיה בונוס שמראה את הסיפור המלא סביב זה שהוא, אה, מורכב יותר).

בתור דוגמא, בואו נסתכל על \(x^{2}-x-1=0\) שכבר דיברתי עליה קודם בתור דוגמא למשוואה עם פתרון "לא נחמד". מכיוון ש-\(a=1,b=-1,c=-1\) אז הדיסקרימיננטה תהיה \(b^{2}-4ac=1+4=5\) ולכן הפתרונות יהיו \(x_{1,2}=\frac{1\pm\sqrt{5}}{2}\) שכבר ראינו קודם.

בתור עוד דוגמא, בואו נסתכל על המקרה הפשוט של \(x^{2}=100\). אם רוצים להשתמש בנוסחת השורשים צריך להעביר את ה-100 הזה אגף, לקבל \(x^{2}-100=0\), ואז \(a=1,b=0,c=-100\) ונוסחת השורשים נותנת \(x_{1,2}=\frac{0\pm\sqrt{0^{2}+400}}{2}=\pm\frac{20}{2}=\pm10\), שזה מצד אחד נכון לגמרי ומצד שני רק סיבכנו את עצמנו ובמקום פשוט להוציא שורש ל-100, הוצאנו שורש ל-400 וביצענו כל מני פעולות אלגבריות מיותרות. כלומר, לא תמיד צריך את נוסחת השורשים, אל תמהרו להשתמש בה סתם כי אפשר.

והנה עוד דוגמא: \(x^{2}-10x+25=0\). גם פה כנראה יותר קל לפתור עם וייטה (תנסו!) אבל בואו נראה מה קורה עם נוסחת השורשים. כאן הדיסקרימיננטה היא \(b^{2}-4ac=100-4\cdot25=100-100=0\), ולכן נקבל פתרון יחיד: \(x_{1,2}=\frac{10\pm\sqrt{0}}{2}=5\). הנוסחה עובדת! אם נכתוב את \(x^{2}-10x+25\) בתור מכפלה של \(x\) פחות הפתרון, שימו לב שאנחנו צריכים לכתוב את אותו הפתרון פעמיים: \(x^{2}-10x+25=\left(x-5\right)\left(x-5\right)=\left(x-5\right)^{2}\). על סיטואציה כזו אומרים ש-5 הוא פתרון מריבוי 2 של המשוואה.

אם כן, אני מקווה שהכל טוב ויפה ואנחנו מבינים בערך איך הנוסחה עובדת ואפשר לעבור אל השאלה מאיפה היא צצה בכלל ולמה היא נכונה. בשביל זה שווה לחזור שוב אל המשוואה \(x^{2}=100\). זו הייתה משוואה קלה, כי כל מה שהיה צריך לעשות בה הוא להוציא שורש משני האגפים. היינו רוצים לעשות משהו דומה גם עבור \(ax^{2}+bx+c=0\) - איכשהו להגיע למצב שבו באגף שמאל יש רק משהו בריבוע, ובאגף ימין יש משהו נטול איקס. כדי לעשות את זה נשתמש בטריק שנקרא השלמה לריבוע, וכדי להבין איך הטריק הזה עובד נסתכל לרגע על מה שמצאנו לפני רגע - \(\left(x-5\right)^{2}=x^{2}-10x+25\). הביטוי הזה הוא מקרה פרטי של נוסחה כללית: \(\left(x+A\right)^{2}=x^{2}+2Ax+A^{2}\) (אפשר לראות את זה פשוט על ידי פתיחת סוגריים על פי חוק הפילוג).

בואו נסתכל לרגע על הביטוי הפשוט יחסית \(x^{2}+bx+c\). הייתי רוצה לכתוב אותו בתור \(\left(x+A\right)^{2}\); במקרה כזה צריך להתקיים \(bx=2Ax\), כלומר \(A=\frac{b}{2}\), ומכיוון שצריך להתקיים \(c=A^{2}\) ינבע מכך ש-\(c=\frac{b^{2}}{4}\). לרוע המזל, \(b,c\) יכולים להיות מספרים כלליים ואין שום התחייבות שיתקיים \(c=\frac{b^{2}}{4}\), אבל אפשר להשתמש בטריק ידוע - לחבר ולחסר את אותו מספר לביטוי - זה לא משנה את הערך של הביטוי, אבל זה מאפשר לנו לפשט חלק ממנו במחיר של "זנב קטן" שיישאר אחרי הפישוט.

ובכן, הייתי רוצה לחבר ולחסר אל \(c\) מספר \(B\) כלשהו כך שיתקיים \(c+B=\frac{b^{2}}{4}\), או במילים אחרות - אני רוצה לחבר ולחסר לביטוי המקורי את \(\frac{b^{2}}{4}-c\). אז זה מה שאני אעשה:

\(x^{2}+bx+c=x^{2}+bx+c+\left(\frac{b^{2}}{4}-c\right)-\left(\frac{b^{2}}{4}-c\right)=\)

\(=x^{2}+bx+\frac{b^{2}}{4}-\left(\frac{b^{2}}{4}-c\right)=\left(x+\frac{b}{2}\right)^{2}-\left(\frac{b^{2}}{4}-c\right)\)

עכשיו, המשוואה המקורית שלי הייתה \(x^{2}+bx+c=0\) והגעתי למצב שבו משוואה שקולה, עם אותם פתרונות, היא

\(\left(x+\frac{b}{2}\right)^{2}-\left(\frac{b^{2}}{4}-c\right)=0\)

נעביר אגף ונקבל

\(\left(x+\frac{b}{2}\right)^{2}=\left(\frac{b^{2}}{4}-c\right)\)

זה כבר מתחיל להיראות דומה! אני אוציא שורש משני האגפים ואקבל

\(x+\frac{b}{2}=\sqrt{\frac{b^{2}}{4}-c}\)

עכשיו, בואו נפשט את הביטוי מימין. אפשר להעלות את \(c\) למכנה, ולקבל

\(\sqrt{\frac{b^{2}}{4}-c}=\sqrt{\frac{b^{2}-4c}{4}}\)

ואפשר לפצל את השורש לפעולה על המונה ועל המכנה ולקבל

\(\sqrt{\frac{b^{2}-4c}{4}}=\frac{\sqrt{b^{2}-4c}}{\sqrt{4}}=\frac{\sqrt{b^{2}-4c}}{2}\)

ועכשיו נותרנו עם

\(x+\frac{b}{2}=\frac{\sqrt{b^{2}-4c}}{2}\)

ואחרי העברת אגפים נקבל את

\(x=\frac{-b+\sqrt{b^{2}-4c}}{2}\)

זה דומה לנוסחת השורשים, אבל לא שכחנו משהו? ראשית, איפה ה-\(\pm\)? ובכן, השמטתי אותו בזדון כי צריך להסביר אותו קצת יותר בפירוט. כזכור, הגענו אל \(\left(x+\frac{b}{2}\right)^{2}=\left(\frac{b^{2}}{4}-c\right)\) ואז אמרתי שאני מוציא שורש משני האגפים ומקבל \(x+\frac{b}{2}=\sqrt{\frac{b^{2}}{4}-c}\). אבל כשמוציאים שורש, צריך להיזהר. כשאני כותב \(\sqrt{A}\), אני תמיד מתכוון לשורש החיובי של \(A\). למשל, \(\sqrt{25}=5\), תמיד. זו המוסכמה. אבל אם אני יודע ש-\(x^{2}=25\), אז בהחלט ייתכן ש-\(x=-5\), ואני צריך לכסות את שני המקרים ולכן אני כותב \(x=\pm\sqrt{25}\) כשאני מוציא את השורש. לכן, הדבר הנכון עבורי לעשות היה לכתוב \(x+\frac{b}{2}=\pm\sqrt{\frac{b^{2}}{4}-c}\), מה שהיה מוביל אותנו לבסוף אל הנוסחה

\(x=\frac{-b\pm\sqrt{b^{2}-4c}}{2}\)

טיפלנו בפלוס/מינוס, אבל איפה ה-\(a\)? כזכור, כדי לשמור את העניינים פשוטים אני פתרתי את המשוואה \(x^{2}+bx+c=0\), כלומר הנחתי ש-\(a=1\). כבר ראינו שאפשר להביא כל משוואה ריבועית למבנה הזה: אני לוקח את \(ax^{2}+bx+c=0\) ומחלק את הכל ב-\(a\) ומקבל את המשוואה \(x^{2}+\frac{b}{a}x+\frac{c}{a}=0\). בואו ניקח את הערכים הללו ונציב בתוך הנוסחה שקיבלנו. כלומר, בכל מקום שבו כתוב \(b\) אני אכתוב במקומו \(\frac{b}{a}\), ובכל מקום שכתוב \(c\) אני אכתוב במקומו \(\frac{c}{a}\).

מה זה יעשה לדיסקרימיננטה? במקום \(b^{2}-4c\) אני הולך לקבל

\(\left(\frac{b}{a}\right)^{2}-4\frac{c}{a}=\frac{b^{2}}{a^{2}}-\frac{4c}{a}=\frac{b^{2}-4ac}{a^{2}}\)

וכשאני מוציא לדבר הזה שורש, אני יכול כמו קודם לפצל את השורש למונה ומכנה, ולקבל

\(\pm\sqrt{\frac{b^{2}-4ac}{a^{2}}}=\pm\frac{\sqrt{b^{2}-4ac}}{\sqrt{a^{2}}}=\pm\frac{\sqrt{b^{2}-4ac}}{a}\)

ולכן הנוסחה כולה, אחרי ההחלפה של \(b,c\) ב-\(\frac{b}{a},\frac{c}{a}\), תהיה:

\(x=\frac{-\frac{b}{a}\pm\frac{\sqrt{b^{2}-4ac}}{a}}{2}=\frac{-b\pm\sqrt{b^{2}-4ac}}{2a}\)

וזה בדיוק מה שרצינו! להגיע אל הנוסחה דרש קצת אלגברה, אבל לא היה לי קשה לשחזר את כל התהליך בלי להציץ בספר, פשוט כי זכרתי את הטריק - השלמה לריבוע. אני מקווה שאחרי שרואים את התהליך, הנוסחה נראית קצת פחות מאיימת וקצת יותר קל לזכור אותה, אבל כפי שאמרתי - חוץ מלשנן אותה אני לא מכיר פתרונות קסם להיכרות איתה.

בונוס: מה קורה כשהדיסקרימיננטה שלילית?

הסיפור של משוואה ריבועית לא יהיה שלם בלי שאספר את מה שבבית הספר לרוב מעדיפים להחביא עד שלב מאוחר, כדי לא לסבך עוד יותר את מה שהוא ממילא לא נושא קל. אז כאן אני מספר את זה בתור בונוס, אבל לספר את זה צריך. קודם הצגתי את העניין כאילו למשוואה ריבועית יכולים להיות או שני פתרונות, או פתרון אחד או אפס פתרונות, ושזה תלוי בדיסקרימיננטה: אם היא חיובית אז יש שני פתרונות; אם היא 0 אז יש פתרון אחד; ואם היא שלילית אז אין פתרונות בכלל. אלא שבפועל זה לא באמת המצב: כשאני אומר "אין פתרונות בכלל" אני מתכוון "אין פתרונות שהם מספרים ממשיים". העניין הוא שיש עוד מספרים בעולם.

בואו נסתכל על משוואה פשוטה במיוחד: \(x^{2}+1=0\). זו משוואה שבה \(b=0\) אז אנחנו יודעים איך פותרים אותה - מעבירים אגף ומוציאים שורש. \(x^{2}=-1\), ולכן \(x=\pm\sqrt{-1}\). אבל מה זה \(\sqrt{-1}\)? זה מספר שכשכופלים אותו בעצמו מקבלים \(-1\). מצד שני, מה אנחנו יודעים על מספרים? אם כופלים מספר חיובי במספר חיובי, מקבלים תוצאה חיובית; אם כופלים מספר שלילי במספר שלילי, מקבלים גם כן תוצאה חיובית. אז איך אפשר לקבל את \(-1\) על ידי כפל של מספר בעצמו? אי אפשר. לא במסגרת המספרים הממשיים.

מה זה בכלל "מספר ממשי"? השתמשתי בשם הזה כמה פעמים אבל לא הגדרתי אותו. אם ראיתם פעם את "ציר המספרים", תחשבו על מספרים ממשיים בתור כל המספרים שנמצאים עליו. מנקודת מבט אחרת, אלו כל המספרים שאפשר לכתוב בייצוג עשרוני, למשל \(3.1415\ldots\) - מספרים שנכתבים על ידי רצף סופי של ספרות ואז אולי נקודה עשרונית ואז אולי עוד רצף של ספרות שגם יכול להיות אינסופי. ואז נשאלת השאלה - רגע, אלו לא כל המספרים? על מה אתה מדבר בעצם?

החל מהמאה ה-16 מתמטיקאים נתקלו יותר ויותר בסיטואציות שבהן עוזר לעבוד עם מספרים שכשמעלים אותם בריבוע מקבלים משהו שלילי; האינדיקציה הראשונה והחזקה לכך הייתה משוואות ממעלה שלישית שבהן יש נוסחה דומה לנוסחת השורשים עבור הפתרונות, פשוט מסובכת הרבה יותר - ושימוש בנוסחה הזו במקרים מסויימים מחייב להוציא שורש למספר שלילי, גם אם כל הפתרונות של המשוואה הם בסופו של דבר מספרים ממשיים נחמדים. זו דוגמא אחת, אבל יש רבות אחרות - למרות רתיעה ראשונית מהרעיון של הוצאת שורש למספר שלילי, המתמטיקאים נאלצו להכיר בכך שיש ליצורים הללו שימוש, והשימוש הזה נרחב, ושהשימוש הזה מאפשר לחשוף תבניות שמסתתרות "מתחת לפני השטח" ועוסקות במספרים ממשיים רגילים לכל דבר ועניין. במילים אחרות - שלא מדובר באיזו המצאה שרירותית ומלאכותית אלא בחלק מהמתמטיקה שאי אפשר סתם להתעלם ממנו. ואחרי ההכרה בכך, הגיע גם הפורמליזם; שיטות שבאו להראות איך אפשר "לבנות" בצורה מדויקת את המספרים המוזרים הללו מתוך המספרים הממשיים. היום המספרים המוזרים הללו הם חלק אינטגרלי מהמתמטיקה לכל דבר ועניין, אבל הם עדיין סוחבים איתם את השם הישן שרנה דקארט הפיל עליהם כשהם עוד נחשבו יצורים מפוקפקים משהו: מספרים דמיוניים (או מדומים כפי שאני בדרך כלל כותב).

המספר המדומה הבסיסי ביותר מסומן ב-\(i\); זה מספר בעל התכונה \(i^{2}=-1\). כל מספר מדומה אחר ניתן לתיאור בתור "מספר ממשי כפול \(i\)". למשל, \(\sqrt{-4}=2i\) או \(\sqrt{-5}=i\sqrt{5}\). מאיפה בדיוק \(i\) הזה מגיע ואיך אפשר "לבנות" אותו - אני אחכה עם זה לסוף חלק הבונוס, קודם בואו נראה איך זה עוזר לנו עם פתרון משוואות.

ובכן, הפתרון של המשוואה \(x^{2}+1=0\) הוא \(i\). ליתר דיוק, \(\pm i\) (כי \(\left(-i\right)^{2}=\left(-1\right)^{2}i^{2}=1\cdot\left(-1\right)=-1\)). מה עם משוואות יותר מתוחכמות? בואו נסתכל לדוגמא על \(x^{2}-4x+13=0\). במקרה הזה \(a=1,b=-4,c=13\) ונוסחת השורשים תיתן לנו את הפתרונות

\(x_{1,2}=\frac{4\pm\sqrt{16-52}}{2}=\frac{4\pm\sqrt{-36}}{2}=\frac{4\pm6i}{2}=2\pm3i\)

וזהו, ככה פותרים כל משוואה ריבועית דומה. השלב היחיד שבאמת בעייתי הוא הוצאת השורש, וראינו שאם יש לנו מספרים מדומים אז הוצאת שורש של מספר שלילי מתנהגת בדיוק כמו הוצאת שורש של מספר חיובי, רק שמוסיפים \(i\) שם.

בואו נסתכל לרגע על המספר \(2+3i\). הוא מורכב מסכום של המספר הממשי \(2\) והמספר המדומה \(3i\); הוא לא ממשי, אבל הוא גם לא בדיוק מדומה ("מדומה" התייחס רק למספרים שכשמעלים אותם בריבוע מקבלים מינוס של מספר ממשי). השם שאנחנו נותנים למספרים כאלו הוא מרוכבים (ובאנגלית Complex Numbers). המרוכבים הם אוסף מעניין ביותר של מספרים, שמהרבה בחינות מתנהג "כמו הממשיים" (למשל, פעולות החיבור, החיסור הכפל והחילוק כולן מוגדרות ומתנהגות יפה על המרוכבים) אבל יש גם בחינות שבהן הם מתנהגים אחרת, לפעמים יפה יותר (התחום של חשבון דיפרנציאלי ואינטגרלי במספרים מרוכבים הוא דוגמא טובה מאוד לזה, אבל לא אכנס לכך כאן). התכונה היפה של המרוכבים שאני יכול עכשיו לנסח במדויק היא זו: לכל משוואה ממעלה שניה במספרים מרוכבים, יש בדיוק שני פתרונות מרוכבים, עד כדי ריבוי. ה"עד כדי ריבוי" פירושו שייתכן שיש רק פתרון אחד אבל כזה שבפירוק של המשוואה מופיע פעמיים, כמו שראינו בדוגמא של \(x^{2}-10x+25=\left(x-5\right)\left(x-5\right)\), שבה הפתרון \(x=5\) "הופיע פעמיים". למעשה, זה אפילו יותר מכך - לכל משוואה ממעלה \(n\), עבור כל \(n\ge1\) טבעי, יש בדיוק \(n\) פתרונות, עד כדי ריבוי.

התכונה הזו של המרוכבים נקראת המשפט היסודי של האלגברה. זה שם קצת מפוצץ (וגם זוכה ללעג, כי ההוכחה של המשפט הזה לא יכולה להסתמך על אלגברה בלבד אלא דורשת עזרה מתחומים אחרים, למשל חשבון דיפרנציאלי ברמה כלשהי) ובהתחלה אולי לא ברור למה היא כל כך מלהיבה. הרעיון פה הוא שהטענה תקפה לכל משוואה \(ax^{2}+bx+c=0\) גם אם המקדמים הם בעצמם מספרים מרוכבים. זה מגניב, כי היה אפשר לחשוש שהכנסנו מספרים מרוכבים לתמונה כדי לפתור משוואות עם מקדמים ממשיים אבל בכך רק יצרנו עוד המון משוואות חדשות שאין להן פתרון ונצטרך מספרים סופר-דופר-היפר מרוכבים בשבילן, אבל לא - המרוכבים הם סוף הסיפור מהבחינה הזו, ובדיוק בגלל זה אמרתי שהסיפור של משוואה ריבועית לא יהיה שלם בלעדיהם, כי הם בדיוק סוף הסיפור.

אבל הסיפור לא יהיה שלם בלי שאציג לפחות צל-צלו של הסבר מאיפה ה-\(i\) הזה בכלל מגיע ולמה אפשר להניח שהוא קיים. החלק העצוב הוא שאת הבניה הבאמת טובה לטעמי של המרוכבים אי אפשר להראות פה (כי זה שדה מנה של חוג הפולינומים \(\mathbb{R}\left[x\right]\) שמחולק באידאל המקסימלי \(\left\langle x^{2}+1\right\rangle \) וכפי שאפשר להבין יש כאן שלל מושגים מתמטיים שלא הצגתי וקשה להעריך כשהם מגיעים בשולי פוסט ארוך גם ככה) אבל אפשר די בקלות להראות בניה שכל מה שהיא דורשת הוא להאמין שהמספרים הממשיים קיימים.

הבניה פשוטה: אנחנו מסתכלים על אוסף הזוגות של מספרים ממשיים, \(\left(a,b\right)\). על האוסף הזה אנחנו מגדירים פעולות חיבור וכפל: ראשית, חיבור מוגדר על ידי

\(\left(a,b\right)+\left(c,d\right)=\left(a+c,b+d\right)\)

כלומר, חיבור הוא "רכיב-רכיב". מחברים את האיברים ברכיב הראשון, השמאלי, של הזוג; וכנ"ל עבור הרכיב הימני.

כפל, לעומת זאת, לא מוגדר כך בכלל. הוא מוגדר שונה לגמרי:

\(\left(a,b\right)\cdot\left(c,d\right)=\left(ac-bd,ad+bc\right)\)

זו נראית הגדרה שרירותית משהו (שמגיעה, כמובן, ממה שאנחנו יודעים על המספרים המרוכבים שאנחנו רוצים לבנות) אבל הנקודה היא שאפשר להגדיר כפל בצורה כזו; כשאנחנו בונים אובייקט מתמטי חדש מותר לנו להגדיר עליו פעולות באיזו צורה שנרצה, השאלה היא אם אלו יהיו פעולות נחמדות ומועילות.

למרבה הפלא, מתברר שעם פעולות החיבור והכפל הללו מתקיימות התכונות שאנחנו רגילים אליהן מחיבור וכפל "רגילים". אם אסמן זוגות כאלו של ממשיים ב-\(z_{1},z_{2},z_{3}\), אז מתקיים

חוק החילוף: \(z_{1}\cdot z_{2}=z_{2}\cdot z_{1}\)
חוק הקיבוץ: \(z_{1}\cdot\left(z_{2}\cdot z_{3}\right)=\left(z_{1}\cdot z_{2}\right)\cdot z_{3}\)
חוק הפילוג: \(z_{1}\left(z_{2}+z_{3}\right)=z_{1}\cdot z_{2}+z_{1}\cdot z_{3}\)

אפשר גם לראות שאם \(a,b\) הם מספרים ממשיים, אז \(\left(a,0\right)\) ו-\(\left(b,0\right)\) מתנהגים ביחס לפעולות הכפל והחיבור כמו מספרים ממשיים רגילים: \(\left(a,0\right)+\left(b,0\right)=\left(a+b,0\right)\) ו-\(\left(a,0\right)\cdot\left(b,0\right)=\left(ab,0\right)\). כלומר, אפשר לחשוב על הזוגות מהצורה \(\left(a,0\right)\) כאילו הם המספרים הממשיים - הבניה שלנו הכלילה את הממשיים.

ועכשיו, בואו נסתכל על המכפלה של \(\left(0,1\right)\) בעצמו. על פי חוק הכפל שראינו, מתקיים \(\left(0,1\right)\cdot\left(0,1\right)=\left(-1,0\right)\), כלומר \(z=\left(0,1\right)\) מקיים \(z^{2}=-1\) על פי הגישה שלנו שמזהה את \(\left(-1,0\right)\) עם \(-1\) עצמו. אנחנו מסמנים \(i=\left(0,1\right)\), ועכשיו נוקטים בקיצור נוסף, אחרון: במקום לכתוב \(\left(a,b\right)\) אנחנו כותבים \(a+bi\), וקיבלנו את הייצוג הכללי למספרים מרוכבים שבו נהוג להשתמש.

אין לי ספק שהבניה הזו עשויה להשאיר טעם של "אתם המתמטיקאים עדיין מרמים, סתם בניתם משהו מלאכותי, זה לא חוקי בכלל" וכאמור - זו רק ההתחלה; אבל הבניה הזו מראה שלא סתם המצאנו מהראש את המספרים הללו בלי דרך להראות שאפשר לבנות אותם בפועל, ומכיוון שהם נותנים לנו את המשפט היסודי של האלגברה , זו דרך הולמת לסגור בה את הפוסט.