אז איך פותרים משוואות (ממעלה ראשונה בנעלם יחיד)?

הרי לכם תרחיש בדוי מהראש שאינו מבוסס על חוויה אישית מטופשת שלי בכלל בשום צורה: נניח שנתקלתי בחולצה שנראית לי מגניבה ממש ואני רוצה להזמין אותה מהאתר היחיד באינטרנט שמוכר אותה. החולצה עולה 50 ש”ח. טוב ויפה, אבל האתר דורש קניה של מינימום 200 ש”ח כדי שאוכל לבצע הזמנה. אני מחליט למלא את יתר ההזמנה בחולצות פשוטות יותר, שעולות רק 30 ש”ח כל אחת. כמה חולצות כאלו אני צריך לקנות כדי שאוכל להגיע למחיר המינימום להזמנה?

התשובה היא “חמש”, והדרך הפשוטה ביותר להגיע לתשובה הזו היא פשוט לנסות. לבחור עוד ועוד חולצות עד שבסוף רואים שהגעתי למינימום ההזמנה. זה גם מה שהייתי עושה, אם לא היה לי איזה אינסטינקט בראש שגורם לי לבצע אוטומטית את החישוב ולהגיע אל “חמש” עוד לפני הניסוי וטעיה. האינסטינקט הזה שם כי בבית הספר התעקשו שאלמד לפתור משוואות, וזו דוגמא למשוואה מהסוג הנדיר שאפשר לפתור כמעט ללא מחשבה.

בפוסט הזה אני רוצה לדבר על פתרון של משוואות. כפי שדי ברור מהדוגמא המונפצת שלי, שאלת ה”בשביל מה צריך את זה” היא סיפור נפרד ואני לא הולך לנסות לענות עליה ברצינות כאן. לפעמים זה מועיל; לפעמים זה מגניב; לפעמים זה חשוב; ייתכן שעבורכם זה יהיה נטול חשיבות לחלוטין ואתם לומדים את זה רק כי בבית הספר מכריחים אתכם. אני אישית אוהב מתמטיקה כי זה כיפי ומעניין - אני מקווה שאפילו משהו כמו פתרון משוואות יכול להיות כיפי ומעניין (מה שבטוח הוא שזה אכן צעד ראשון בדרך להיכרות עם דברים כיפיים ומעניינים אחרים במתמטיקה).

אז מה זו משוואה? הכי פשוט להראות דוגמא, והסיפור עם החולצות אכן נותן דוגמא כזו - את המשוואה \( 30x+50=200 \). כאן אנחנו רואים מה משוואה כוללת. ראשית כל, היא כוללת את סימן השוויון, “=”. מה שנמצא מימין לסימן הזה נקרא אגף ימין של המשוואה ומה שנמצא משמאל לסימן הזה נקרא אגף שמאל של המשוואה. המשוואה עצמה היא הטענה “מה שבאגף ימין שווה למה שבאגף שמאל”. לכתוב \( 3+5=8 \) זה לכתוב משוואה; גם לכתוב \( 3\times5=7+8 \) זה לכתוב משוואה. גם לכתוב \( 4=4 \) זה לכתוב משוואה. אפילו לכתוב \( 3=4 \) זה לכתוב משוואה, רק שבמקרה של \( 3=4 \) המשוואה לא נכונה (לפחות לא במערכת המספרים הרגילה שלנו) ומה שנכון לכתוב במקרה הזה הוא \( 3\ne4 \).

בדרך כלל מה שאנחנו עושים עם משוואות הוא לפתור אותן. במשוואה כמו \( 3\times5=7+8 \) אין ממש מה לפתור; אולי רק אם אנחנו רוצים לוודא שאגף ימין ושמאל באמת שווים. לרוב הסיטואציה היא כמו ב-\( 30x+50=200 \): פרט למספרים, המשוואה כוללת גם נעלמים, כלומר סימונים שמייצגים מספרים אבל אנחנו לא לגמרי החלטנו אילו מספרים הם אמורים לייצג. במשוואה \( 30x+50=200 \) יש נעלם יחיד: \( x \). “לפתור את המשוואה” פירושו לענות על השאלה - אילו מספרים אפשר להציב במקום \( x \) כך שהמשוואה תהיה נכונה? כלומר, ש-30 כפול המספר שהצבנו באיקס, כל זה ועוד 50, יהיה שווה 200.

למשוואות לא חייב להיות פתרון; למשל, למשוואה \( 0\cdot x=1 \) אין פתרון (אין מספר שכאשר מכפילים אותו באפס נותן 1 כי כל מספר כפול אפס שווה אפס) ולפעמים יכולים להיות למשוואה כמה פתרונות שונים. זו שאלה כללית ומרתקת במתמטיקה: מהי קבוצת הפתרונות של משוואה? איך היא מתנהגת? איך בודקים שייכות של איבר אליה? וכבר עבור משוואות פשוטות “יחסית” התשובות יכולות להיות מורכבות מאוד (למשל, המשוואה \( y^{2}=x^{3}+ax+b \) שמכונה “עקום אליפטי” היא בעלת מרחב פתרונות מורכב מאוד שהבנה שלו דורשת מתמטיקה עמוקה מאוד). לכן אנחנו מתחילים מלדעת איך פותרים משוואות פשוטות מאוד, מתקדמים אל לדעת לפתור משוואות טיפה פחות פשוטות, ועוצרים שם; ההמשך הוא במתמטיקה מתקדמת יותר.

אני אדבר פה רק על משוואות פשוטות, למרות שהטכניקות שאני אראה רלוונטיות גם למשוואות מסובכות יותר.

אז איך פותרים את המשוואה \( 30x+50=200 \)? קודם נראה את הצעדים ואז ננסה להבין מה בעצם עשיתי בהם.

ראשית, אני “מעביר את 50 אגף”. זה אומר שאני עובר מהמשוואה \( 30x+50=200 \) אל המשוואה \( 30x=200-50 \). ה-\( 50 \) שהיה באגף שמאל עבר אל אגף ימין, וה”מחיר” של המעבר הזה הוא שהסימן שלו השתנה מפלוס אל מינוס (למה? עוד רגע אסביר את הנימוקים). עכשיו אני מבצע את פעולת החיסור ומקבל את המשוואה הבאה:

\( 30x=150 \)

עכשיו אני מחלק את שני האגפים במספר 30 ומקבל \( x=\frac{150}{30} \). אחרי ביצוע החלוקה באגף ימין אני מקבל \( x=5 \) וזה הפתרון של המשוואה. פשוט? כן! וזו רוב הטכניקה שנדרשת כדי לפתור משוואות.

בואו ננסה להבין מה בעצם עשיתי כאן. התחלתי עם משוואה אחת, ואז יצרתי מין “שרשרת” של משוואות שהאחרונה בהן היא פתרון של המשוואה. בואו נכתוב במפורש את כל השרשרת:

  • \( 30x+50=200 \)
  • \( 30x=200-50 \)
  • \( 30x=150 \)
  • \( x=\frac{150}{30} \)
  • \( x=5 \)

הרעיון המרכזי מאחורי השרשרת הזו, ומאחורי פתרון משוואות בכלל, הוא שכל המשוואות פה הן שקולות אחת לשניה. מה זה אומר? שתי משוואות הן שקולות אם בכל פעם שבו אחת מהן היא נכונה, גם השניה היא נכונה. כלומר: אם אני מציב ערך כלשהו ב-\( x \) ויוצא שאחת מהמשוואות היא נכונה, אז מובטח לי שגם השניה תהיה נכונה עם אותו ערך של \( x \); ואם עבור הצבה כלשהי ב-\( x \) המשוואה הייתה לא נכונה, גם השניה תהיה לא נכונה.

בואו נראה דוגמא פשוטה לסיטואציה שבה זה לא המצב; שבה יש לנו שתי משוואות שאינן שקולות. הנה הן:

  • \( 5x=4x \)
  • \( 5=4 \)

המשוואה השניה בבירור היא תמיד לא נכונה; המשוואה הראשונה היא לא נכונה אם מציבים באיקס את 1, למשל, אבל אם מציבים באיקס את 0 אז המשוואה דווקא נכונה. כלומר, קיימת סיטואציה שבה המשוואה הראשונה נכונה, ולעומת זאת במשוואה השניה גם אם “נציב באיקס אפס” המשוואה תהיה לא נכונה - איקס בכלל לא מופיע בה, מה זה חשוב מה אנחנו “מציבים” בו?

זוג המשוואות הזה חשוב כי האופן שבו עברתי מהראשונה אל השניה היה על ידי ביצוע חלוקה - חילקתי באיקס. הלקח הוא שצריך להיזהר - לא כל פעולה שאני מבצע על המשוואה מייצרת משוואה ששקולה לה. אבל לא צריך להיזהר יותר מדי - רוב הפעולות שבהן נרצה להשתמש מייצרות משוואות שקולות וקל לזהות את המקרים שבהם זה לא קורה.

בואו נסתכל על המעבר הראשון שביצעתי במשוואות למעלה - למה הוא תקין?

  • \( 30x+50=200 \)
  • \( 30x=200-50 \)

כיניתי את המעבר הזה “העברת אגף” אבל אני בעצם עושה בו משהו קצת יותר פשוט: אני מחבר לשני האגפים את אותו מספר. במקרה הנוכחי, אני מחבר לשניהם \( -50 \). הייתי יכול להוסיף פה “שלב ביניים”:

  • \( 30x+50-50=200-50 \)

אחרי שלב הביניים הזה ה-\( +50-50 \) נעלם כי הסכום של שניהם שווה לאפס. גם זה סוג של צעד, שאני גם עושה בהמשך - להחליף את אחד מאגפי המשוואה במשהו ששווה לו נותן לנו משהו שקול למשוואה המקורית. זה גם מה שאני עושה במעבר הבא:

  • \( 30x=200-50 \)
  • \( 30x=150 \)

כאן החלפתי את \( 200-150 \) ב-\( 50 \) ששווה לו וקיבלתי משוואה שקולה.

הסוג הנוסף של מעבר שביצעתי היה כפל של שני האגפים באותו מספר:

  • \( 30x=150 \)
  • \( x=\frac{150}{30} \)

ושוב, קפצתי על צעד. אני כופל את שני האגפים במספר \( \frac{1}{30} \) (“מחלק ב-30”) ולכן שלב הביניים היה \( \frac{1}{30}\cdot30x=\frac{1}{30}\cdot150 \). את הצמצום \( \frac{30}{30}=1 \) ביצעתי בלי לכתוב אותו במפורש.

אז אילו פעולות היו לנו שמייצרות משוואה שקולה מתוך משוואה קיימת?

  • להחליף אגף אחד של המשוואה באגף אחר ששווה לו.
  • לחבר את אותו מספר לשני אגפי המשוואה.
  • להכפיל באותו מספר את שני אגפי המשוואה.

את הפעולה השלישית צריך לסייג. זה לא עובד אם המספר שבו כופלים הוא אפס. אם יש לי את המשוואה \( x=x+1 \), לא קשה לראות על ידי חיסור \( x \) משני האגפים שמקבלים \( 0=1 \) וזו משוואה נטולת פתרון. עם זאת, אם נכפול ב-0 את שני אגפי המשוואה נקבל \( 0=0 \) שהיא משוואה נכונה (“כל איקס הוא פתרון”). זה היוצא מן הכלל היחיד - אם לא כופלים באפס (או מנסים לחלק באפס) תמיד מקבלים משוואה שקולה.

למה בעצם?

הסוד כאן טמון בשאלה אם הפעולה שאנחנו מבצעים על אגפי המשוואה היא פעולה הפיכה או לא. אני אתנסח פורמלית: נניח שיש לי את המשוואה \( a=b \) כש-\( a \) ו-\( b \) הם מספרים כלשהם. אז אני מבצע פעולה כלשהי על שני האגפים ומקבל משוואה חדשה, \( f\left(a\right)=f\left(b\right) \) כש-\( f \) מייצגת את הפעולה שביצעתי. בלשון מתמטית אומרים ש-\( f \) היא פונקציה שהפעלתי על שני האגפים. הרעיון הוא שאם \( a \) אכן היה שווה ל-\( b \) (אותו ערך מספרי בדיוק) אז הפעלת \( f \) על שני האגפים תחזיר את אותו ערך מספרי. כלומר, אם המשוואה \( a=b \) מתקיימת אז גם המשוואה \( f\left(a\right)=f\left(b\right) \) מתקיימת. שימו לב שזה משהו שקורה גם עם פעולה “בעייתית” כמו הכפל ב-\( 0 \): אם התחלתי מ-\( 3=1+2 \) וכפלתי את שני האגפים ב-0 אקבל את \( 0=0 \) שגם היא מתקיימת, פשוט “משהו הלך לאיבוד” בדרך.

עכשיו, \( f \) יכולה להיות בעלת התכונה הבאה: לכל \( a,b \), אם \( a\ne b \) אז \( f\left(a\right)\ne f\left(b\right) \). או בניסוח אחר: אם \( f\left(a\right)=f\left(b\right) \) אז \( a=b \) (התכונה הזו נקראת “חד-חד-ערכיות”). אם \( f \) היא בעלת התכונה הזו, אז בהינתן המשוואה \( f\left(a\right)=f\left(b\right) \) אפשר “לשחזר” מתוכה את המשוואה המקורית \( a=b \).

למשל, אם \( f\left(a\right)=a+3 \), אז נקבל מ-\( a=b \) את המשוואה \( a+3=b+3 \). כדי “לשחזר” את המשוואה המקורית, נפעיל על המשוואה החדשה את הפעולה \( g\left(a\right)=a-3 \) ש”הופכת” את \( f \). דבר דומה קורה גם עבור כפל: אם \( f\left(a\right)=3a \) אז ה”היפוך” של הפונקציה הזו הוא \( g\left(a\right)=\frac{a}{3} \). רק עבור כפל באפס אין פעולה הופכית שכזו, כי אי אפשר לחלק באפס, וכפל באפס הוא בבירור לא פעולה חד-חד-ערכית (כי למשל עבור \( 1\ne2 \) אחרי כפל באפס נקבל \( 0=0 \)).

אז חיבור וכפל במשהו שאינו אפס הן פעולות הפיכות ולכן הן משמרות שקילות של משוואות. מה עם הפעולה השלישית, של “להחליף אגף אחד של המשוואה באגף אחר ששווה לו”? הפעולה הזו לא משנה את הערך המספרי של האגף, רק את איך שהערך המספרי הזה כתוב בו; פורמלית, זה כאילו הפעלנו על האגף את הפונקציה \( f\left(a\right)=a \) שהיא בבירור חד-חד-ערכית. לכן גם הפעולה הזו משמרת שקילות של משוואות.

מצוידים בכל הידע הזה, אפשר ללכת ולפתור משוואות “אמיתיות”! כלומר… כאלו שמופיעות בספרי לימוד. למשל, \( 4x+7=19 \). כדי לפתור את המשוואה הזו, נעביר את 7 אגף ונקבל \( 4x=12 \) ואז נחלק ב-4 ונקבל \( x=3 \). מה שהלך כאן היה בעצם זהה לגמרי לפתרון המשוואה \( 30x+50=200 \) שממנה התחלתי; רק המספרים היו שונים. שיטת הפתרון הייתה זהה. אז אולי אפשר לנסח את השיטה הזו בצורה כללית?

נניח שיש לי משוואה מהצורה הבאה: \( ax+b=c \) כאשר \( a,b,c \) הם מספרים ואני מניח ש-\( a\ne0 \) (אחרת איקס לא באמת משתתף במשוואה). אז כדי לפתור אותה אני מעביר את \( b \) אגף ומחלק ב-\( a \) ומקבל את הפתרון \( x=\frac{c-b}{a} \). לרוב מעדיפים לנסח את הסיטואציה בצורה טיפה פחות כללית: אומרים - נניח שיש לנו משוואה מהצורה \( ax+b=0 \), הבה ונפתור אותה. הפתרון במקרה הזה הוא פשוט \( x=-\frac{b}{a} \) (תציבו \( c=0 \) בפתרון הקודם ותקבלו את זה). זה מתווה לנו דרך פעולה לפתרון משוואות כאלו באופן כללי: קודם כל לסדר אותן כך שיהיו מהצורה \( ax+b=0 \), ואז להשתמש בנוסחה הזו, שעכשיו אנחנו מבינים מאיפה הגיעה.

כמובן, לא צריך ללכת למחוזות אבסורדיים. אם למשל נותנים לנו את המשוואה \( 2x=10 \) אנחנו פשוט נחלק ב-\( 2 \) ונקבל \( x=5 \); לא קודם כל נעביר את 10 אגף כדי לקבל \( 2x-10=0 \) ונגיד “אה-הא! הנה משוואה עם \( a=2 \) ו-\( b=-10 \) ולכן על פי הנוסחה הפתרון הוא \( x=-\frac{b}{a}=-\frac{-10}{2}=5 \)”. הגיון פשוט הוא תמיד משהו שעדיף להסתמך עליו כשפותרים משוואות; פשוט לא חייבים.

הנה דוגמא קצת יותר מסובכת: המשוואה \( \frac{1}{1-x}=2 \). כדי לפשט את המשוואה הזו, צריך לכפול ב-\( 1-x \) שבמכנה של אגף שמאל. אבל בניגוד למה שעשינו עד כה, לכפול ב-\( 1-x \) זה לא בדיוק לכפול במספר - זה לכפול במספר שתלוי ב-\( x \). אנחנו יודעים שאסור לכפול ב-0, ולכן אסור לכפול ב-\( 1-x \) במקרה שבו \( 1-x=0 \), כלומר במקרה שבו \( x=1 \). אז מה עושים? מטפלים במקרה הזה בנפרד. ראשית כל שמים לב לכך שאם \( x=1 \) אז \( \frac{1}{1-x} \) הוא ביטוי לא מוגדר כי אסור לחלק באפס, ולכן בוודאי שאינו שווה 2, ולכן \( x=1 \) לא יכול להיות פתרון של המשוואה. כעת אנחנו אומרים במפורש “נניח ש-\( x\ne1 \)” ואז נכפול ב-\( 1-x \) ונקבל \( 1=2\left(1-x\right) \), כלומר \( 1=2-2x \). נעביר את \( 2x \) ואת \( 1 \) אגפים ונקבל \( 2x=1 \), כלומר \( x=\frac{1}{2} \), וזה פתרון המשוואה.

האם זה סוף הסיפור? לא, זה סוף השלב הראשון בלבד. למשוואה מהצורה \( ax+b=0 \) (ומשוואות דומות ששקולות לה בקלות כמו \( ax+b=c \)) קוראים משוואה ממעלה ראשונה. למה? כי הנה למשל דוגמא למשוואה ממעלה שניה: \( x^{2}+2x+1=0 \). כאן \( x \) מופיע גם בחזקה שניה, ומכאן מגיעה ה”מעלה שניה”. לפתור משוואות כאלו זה כבר יותר מסובך ולכן צריך לדבר על זה בפוסט נפרד. משוואות ממעלה יותר גבוהה כמו \( x^{3}+3x+3+1=0 \) זה כבר סיפור הרבה יותר מסובך ואין פתרון כללי נחמד שאותו אפשר ללמד, אבל יש טריקים שעוזרים מאוד במקרים מסויימים. וחוץ מכל זה, אפשר לדבר גם על משוואות עם יותר מנעלם אחד, למשל \( x+y=5 \), ואז יכולים להיות למשוואה הרבה פתרונות שונים, ולעתים קרובות מדברים על מערכת של משוואות שבה יש יותר ממשוואה אחת שצריך לפתור בו זמנית.

במילים אחרות, העולם של פתרון המשוואות הוא גדול ועשינו בו רק את הצעד הראשון, אבל זה צעד חשוב; הטכניקה הזו של “לבצע את אותה פעולה על שני האגפים” ממשיכה לעזור לנו גם בסיטואציות המורכבות יותר.


נהניתם? התעניינתם? אם תרצו, אתם מוזמנים לתת טיפ:

Buy Me a Coffee at ko-fi.com