האם כל המתמטיקה בעצם מבוססת על כשלים לוגיים?

להיט עכשיו בפייסבוק העברי הוא צילום המסך הזה של פוסט שלא חשוב על ידי מי נכתב, כי הוא מופץ במטרה ללעוג לכותב:

אותי פחות מעניין ללעוג לכותב ויותר לשאול שאלות ולנסות לענות להן. למשל:

  1. למה אין כאן סתירה? (התקציר: כי מחלקים באפס)
  2. מאיפה בעצם ה"תרגיל" הזה הגיע ומאיפה בא הסיפור על ניוטון? (התקציר: אין לי מושג)
  3. האם אפשר לומר משהו מעניין מתמטית על התרגיל הזה? (קצת)
  4. האם כל המתמטיקה בעצם מבוססת על כשלים לוגיים? (ובכן... הישארו עמנו?)

וכעת לתשובה קצת יותר מפורטת. ראשית, התרגיל. אם נעקוב אחרי השלבים שלו בקפידה נראה שכולם תקינים במובן זה שכל שורה נובעת לוגית מהשורה שמעליה, למעט שורה אחת: המעבר מ-

$latex \left(x-3\right)\left(x+5\right)=\left(x-3\right)\left(x+4\right)$

אל

$latex x+5=x+4$

מעבר כזה נקרא צמצום, וכדי לבצע אותו צריך לוודא שמה שמצמצמים בו לא שווה לאפס. למה? ובכן, כי לכאורה מה שעושים בצמצום הוא לחלק באפס, וכידוע אסור לחלק באפס. אבל אני אפילו לא זקוק לטענה הזו. צמצום באופן כללי הוא המעבר ממשוואה מהצורה

$latex a\cdot x=a\cdot y$

אל המשוואה

$latex x=y$

“מעבר” ממשוואה אחת לשניה פירושו: אם קיים פתרון למשוואה הראשונה, אז הוא יהיה פתרון גם למשוואה השניה. זה האופן שבו אנחנו פותרים משוואות: לוקחים משוואה מסובכת ומפעילים עליה שורה של מניפולציות שמשמרות את הפתרונות של המשוואה המקורית. המקרה של כפל באפס מקלקל לנו את זה, כי אפס כפול כל דבר שווה לאפס. לכן אם $latex a=0$ נקבל ש-$latex a\cdot x=0$ תמיד, לא משנה מהו $latex x$, ולכן גם $latex a\cdot x=a\cdot y$ מתקיים תמיד בלי תלות בטיב הקשר בין $latex x,y$.

עוד נקודה שאני רוצה לחדד טיפה היא שזה לא אסון אם מקבלים $latex 1=0$. זה לא בהכרח אומר שהגענו לסתירה במתמטיקה, אלא שהגענו למשהו שנראה כמו סתירה להנחות שלנו ולכן קרוב לודאי שאחת מהן לא נכונה. הרי את ה”תרגיל” למעלה היה אפשר להתחיל מהשורה הלפני אחרונה:

$latex x+5=x+4$

שממנה אכן ניתן להסיק, על ידי חיסור $latex x+4$ משני האגפים (פעולה שמשמרת פתרונות), ש-$latex 1=0$. עכשיו, את $latex 1=0$ לא צריך לקרוא בתור “סתירה במתמטיקה!!!!! אההההה!!!!!” אלא בתור “משוואה שלא קיים לה פתרון” - כלומר, זו “משוואה” שבה לא משנה אילו ערכים נציב ב”נעלמים”, הם לא יהפכו את המשוואה לנכונה (מכיוון שפשוט אין בה נעלמים). המסקנה היא שגם למשוואה הקודמת, $latex x+5=x+4$ לא היה פתרון, בגלל תכונת “שימור הפתרונות” שהזכרתי; שאם המשוואה $latex x+5=x+4$ הייתה פתירה, אז גם $latex 1=0$ הייתה פתירה.

במקרה של סדרת המשוואות למעלה, ה”סתירה” מתקבלת מכך שהתחלנו ממשהו שנראה לגיטימי ופתיר - $latex x=3$ - ואיכשהו “איבדנו” את הפתרון הזה בדרך; וזה התרחש בגלל המעבר הלא חוקי שתיארתי, כי אם $latex x=3$ אז $latex x-3=0$ ולכן הצמצום בשורה

$latex \left(x-3\right)\left(x+5\right)=\left(x-3\right)\left(x+4\right)$

הוא בדיוק צמצום של אפס-כפול-משהו.

כשפותרים משוואות בעולם האמיתי, כשמבצעים צמצום כזה מתבצעת חלוקה למקרים. מוסיפים את ההנחה שמה שמצמצמים בו שונה מאפס וממשיכים לפתור עם זה, ומטפלים במקרה שבו הוא שווה אפס בנפרד. כלומר, פתרון תקין לתרגיל היה מגיע אל “או ש-$latex x=3$ והוא פתרון של המשוואה, או ש-$latex x\ne3$ ובמקרה זה אין פתרון למשוואה” שהוא כמובן תקין. בקיצור, קשה מאוד למצוא סתירה כלשהי במתמטיקה עם התרגיל הזה (מפתיע!)

בדיון שבו פורסם הטקסט הזה, האם לא העירו שיש חלוקה באפס? כמובן שהעירו. התשובה הייתה מעניינת: שאין פה חלוקה ב-0 אלא “חלוקה בפולינום $latex x-3$”, שזה… נכון? זה באמת מה שקורה פה, אם כי כמובן שזה לא משפיע על הבעיה בתרגיל. אני רוצה לחדד את הנקודה הזו כי היא מעניינת.

כשאנחנו פותרים משוואות עם נעלמים אנחנו בדרך כלל משחקים משחק “נדמה לי”. אנחנו אומרים “נניח ש-$latex x$ הוא מספר קונקרטי שפותר את המשוואה, אנחנו פשוט עדיין לא יודעים מה הוא אז אנחנו כותבים אות במקומו. אבל כל המניפולציות שאנחנו עושים הן מניפולציות שעושים עם מספרים”. כל זה נכון ותקין לחלוטין, אבל בשלב כלשהו בהיסטוריה של האלגברה, המתמטיקאים החליטו שיהיה מעניין גם לאמץ נקודת מבט נוספת על זה, ולחשוב על יצורים כמו $latex x^{2}+2x-15$ - מה שנקרא פולינומים - בתור אובייקטים אלגבריים בפני עצמם (הנה פוסט שלם בנושא למי שלא רוצים להסתפק במה שאכתוב כאן). מה זה “אובייקט אלגברי”? זה משהו שאפשר להגדיר עליו כללי חשבון עם כפל וחיבור וכדומה שמקיימים תכונות נחמדות כמו חוקי החילוף והפילוג וכדומה. בדרך ההתבוננות הזו, $latex x^{2}+2x-15$ הוא פשוט דרך כתיבה “מעניינת” לסדרת המספרים $latex \left(1,2,-15\right)$ (סדרת המקדמים של הפולינום). זו חשיבה קצת שונה מהחשיבה שפולינום הוא בסך הכל כתיב מקוצר לתרגיל כלשהו (“לוקחים מספר, מעלים אותו בריבוע, מוסיפים לו את עצמו פעמיים ומחסרים 15 מהתוצאה”).

חיבור של פולינומים הוא פשוט חיבור של שתי סדרות המספרים שמגדירות אותם, “איבר איבר”. הנה דוגמא: לפולינום $latex x^{2}+2x-15$ אני אחבר את הפולינום $latex x+5$. כדי לעשות את זה, אני יכול לכתוב את שני הפולינומים הללו בתור סדרות מקדמים: $latex \left(1,2,-15\right)$ ו-$latex \left(0,1,5\right)$. עכשיו אני יכול לחבר את שתי הסדרות:

$latex \left(1,2,-15\right)+\left(0,1,5\right)=\left(1+0,2+1,-15+5\right)=\left(1,3,-10\right)$

קיבלתי את הפולינום $latex x^{2}+3x-10$. עכשיו, בשביל מה כל זה היה טוב? למה לא פשוט חיברתי “כרגיל” תוך שימוש בזה ש-$latex 2x+x=3x$ וכדומה? כי כך הדגמתי שאפשר לדבר על הפולינומים הללו בלי להזדקק בכלל לדיבורים על $latex x$, שהוא לכאורה מה שלשמו נתכנסנו פה - ה”נעלם” שלנו. אולי עכשיו מתעוררת בכם שאלה אחרת - אם אפשר פשוט לדבר על סדרות של מספרים, למה לא מדברים עליהן וזהו ובמקום זה משתמשים בכתיב עם $latex x$? אה, טוב ששאלתם - כי הכפל הוא פעולה מעניינת יותר מאשר “איבר איבר”, ויותר קל להבין אותה כשיש איקס מול העיניים.

בואו נראה דוגמא פשוטה: הפולינומים $latex x-3$ ו-$latex x+5$. אני רוצה לכפול אותם; בתור סדרות הם $latex \left(1,5\right)$ ו-$latex \left(1,-3\right)$ וכפל “איבר איבר” של הסדרות הללו נותן $latex \left(1,-15\right)$ כלומר את $latex x-15$, אבל זה לא מתאים למה שאנחנו חושבים עליו כשכופלים פולינומים:

$latex \left(x+5\right)\left(x-3\right)=x^{2}+5x-3x-15=x^{2}+2x-15$

מה קרה פה? קיבלנו פולינום ממעלה גבוהה יותר מזו של אלו שהכפלנו - יצרנו סדרת מקדמים ארוכה יותר, וזה משהו שכפל “איבר איבר” לא יכול לבצע בכלל. ומאיפה הגיע ה-$latex 2x$ הזה, הרי בסדרת המקדמים המקורית אין שום דבר שמזכיר את 2? הוא הגיע מהחישוב היחסית מסובך $latex 1\cdot5+\left(-3\right)\cdot1$ שבו כפלנו את המקדם השני באחד הפולינומים במקדם הראשון בפולינום השני, ואת הסמטוחה הזו חיברנו אל המקדם הראשון בפולינום הראשון שמוכפל במקדם השני בפולינום השני… יש כאן פעולה שנקראת קונבולוציה של סדרות, שהיא פעולה הרבה יותר מתוחכמת מאשר “כפל איבר איבר”. נשמע מפחיד? לא הבנתם איך זה עובד? לא נורא! אתם כמו האדם שדיבר פרוזה כל ימיו ולא ידע זאת; אם אתם יודעים לכפול פולינומים אתם יודעים לחשב קונבולוציות (אם אתם מכירים מטריצות, הסיפור פה די דומה: אובייקט אלגברי “חדש” שבו פעולת החיבור היא “איבר-איבר” משעממת אבל פעולת הכפל היא מחוכמת ומכניסה אותנו לעולם חדש לגמרי).

אם כן, פולינומים הם יצורים מתמטיים עצמאיים, עם פעולות חיבור וכפל משלהם, וגם סוג של פעולת חילוק - חלוקה עם שארית, כמו שיש במספרים שלמים (הדמיון לא מקרי; שלמים ופולינומים הם דוגמאות מרכזיות למשהו שנקרא תחומים אוקלידיים וכתבתי עליו פעם פוסט). בגישה הזו, אם יש לי את המשוואה

$latex \left(x-3\right)p\left(x\right)=\left(x-3\right)q\left(x\right)$

שמתארת שוויון בין שני פולינומים, אז בהחלט אפשר לחלק ב-$latex x-3$, וזו בהחלט לא חלוקה באפס, ולכן בהחלט כן מקבלים $latex p\left(x\right)=q\left(x\right)$. אז למה $latex x+5=x+4$ עדיין לא מתקיים?

ובכן, כי בפולינומים השוויון $latex x=3$ שפתח את כל הסיפור הזה לא מתקיים. בתור פולינומים, יש לנו בשני האגפים יצורים שונים: באגף שמאל הפולינום $latex \left(1,0\right)$ ובאגף ימין הפולינום $latex \left(3\right)$. אלו סדרות מקדמים מאורכים שונים, עם ערכים שונים בתוכן. ברור שאין קשר. המשמעות האינטואיטיבית שיש לנו, של “$latex x$ הוא נעלם שאנחנו מציבים בו 3” לא קיימת אוטומטית כשמדברים על פולינומים. לכן התשובה “לא חילקתי באפס, חילקתי ב-$latex x-3$” רק מקלקלת את הטיעון עוד יותר, כי היא מצביעה על הונאה כבר בשורה הראשונה של התרגיל.

אפשר לחפור אפילו יותר עמוק כאן אם רוצים. האמת היא שמתמטיקאים בהחלט רוצים לפעמים לבצע חשבון של פולינומים תחת ההנחה הנוספת ש-$latex x=3$. בשביל זה הם עוברים לדבר על משהו שנקרא חוג מנה של פולינומים. בלי להיכנס יותר מדי להגדרות (הנה פוסט בנושא אם כן רוצים הגדרות), הרעיון בחוג מנה שבו $latex x=3$ הוא פשוט: פעולות החיבור והכפל של הפולינומים יהיו זהות לאלו שהצגתי קודם, למעט זה שאחרי שמבצעים אותם, מחלקים את התוצאה בפולינום $latex x-3$ ולוקחים רק את השארית. בחוג מנה כזה, הפולינום $latex x-3$ הוא שקול לאפס (כלומר, ביצוע חשבון איתו נותן את אותה תוצאה כמו ביצוע חשבון עם אפס) ולכן כמו קודם, אי אפשר לצמצם בו ואנחנו חוזרים לטיעון שהתחלנו איתו. אי אפשר להתחמק מזה - גם כשהולכים למתמטיקה גבוהה יותר מהתיכונית, אנחנו עדיין רואים שהמתמטיקאים נזהרו מאוד לא ליצור סתירות שעליהן הם מתבססים.

אגב, אם כבר הגעתי לכאן, אני רוצה להזכיר חוג מנה חביב במיוחד של פולינומים: זה שמתקבל על ידי חלוקה ב-$latex x^{2}+1$. אפשר לחשוב על איבר כללי בחוג הזה בתור פולינום מהצורה $latex a+bx$. בואו נכפול בשביל הכיף את $latex x$ עם עצמו: נקבל $latex x^{2}$, שאם מחלקים אותו ב-$latex x^{2}+1$ עם שארית מקבלים את השארית $latex -1$. כלומר בחוג הפולינומים הזה מתקיימת המשוואה $latex x^{2}=-1$. עכשיו בואו נשתמש בסימון קצת שונה: במקום $latex x$ נכתוב $latex i$. קיבלנו חוג פולינומים שכל איבר בו הוא מהצורה $latex a+bi$ כאשר $latex i$ מקיים $latex i^{2}=-1$; החוג הזה נקרא המספרים המרוכבים והוא אחת מקבוצות המספרים המעניינות והחשובות במתמטיקה. וזו הדרך הפורמלית הטובה ביותר להגדיר אותה שאני מכיר (הנה פוסט שמרחיב על זה).

ועוד הערה אם אני כבר כאן - אפשר לדבר על חוגי מנה גם בהקשרים אחרים, למשל של שלמים, ואתם כבר מכירים חוגי מנה שכאלו - המפורסם שבהם הוא מה שקורה בשעון. אנחנו חושבים על השעות בשעון בתור המספרים מ-0 עד 23, כאשר 24 זה כבר “שוב פעם 0”. אם השעה היא 18 ואנחנו שואלים מה תהיה השעה עוד עשר שעות, אנחנו מחשבים $latex 18+10=28$ ואז מחסרים 24 מהתוצאה - כלומר, מחלקים ב-24 ולוקחים את השארית, 4. זה נקרא חשבון מודולו 24 (הנה פוסט שלי על חשבון מודולרי). חשבון כזה יכול להיות טריקי יותר מחשבון “רגיל”: למשל, $latex 4\cdot6=0$ בחשבון הזה. למספרים כאלו ששונים מאפס אבל המכפלה שלהם עדיין יוצאת אפס קוראים מחלקי אפס, והם עוד דוגמא למספרים שלא מקיימים את כלל הצמצום. למשל, אם יש לי את המשוואה

$latex 4x=4y$

כשהמשוואה הזו היא מודולו 24, אני לא יכול להסיק ש-$latex x=y$. הנה דוגמא נגדית: $latex x=4,y=10$. אלו שני מספרים ששניהם קטנים מ-24 (כלומר, הם לא שקולים מודולו 24 וצריכים להיחשב “אותו דבר”) אבל המכפלה של שניהם ב-4 מניבה 16. שימו לב שאני פדנט ומתעקש לא לדבר על “אסור לחלק ב-4” אלא אומר משהו יותר בסיסי, שאסור לצמצם את 4 משני האגפים - הסיבה לכך היא שיש חוגים במתמטיקה שבהם אין משמעות ל”חלוקה” באיבר אבל עדיין אפשר לדבר על היכולת לצמצם אותו משני האגפים.

זה מסיים את ההתייחסות הפרטנית שלי ל”כשל” שאיתו פתחתי. עדיין נשארו לנו כמה שאלות. הראשונה, מאיפה הוא הגיע בכלל. דברים כאלו בדרך כלל מופצים באינטרנט הרחב הרבה לפני שהם מעוברתים ומגיעים אלינו. במקרה הנוכחי אין לי מושג מה המקור. כמובן, תעלולים שמערבים חלוקה באפס כדי להגיע ל”סתירה” הם עתיקי יומין ורואים אחד כזה כל כמה חודשים, אבל את האחד הספציפי הזה? עוד לא ראיתי. והסיפור עם ניוטון ו-1704? הוא חדש לי לגמרי. מאיפה הגיעה השנה 1704 דווקא? ניסיתי להתחקות על עקבות הסיפור הזה באינטרנט בעזרת מספר הקסם 1704 וחברים אבל לא מצאתי כלום. אולי אתם תצליחו יותר ממני? לפעמים סיפורים כאלו מובילים לספרים של ממש, כאלו שאפשר למצוא בחנויות וכתבו אנשים מכובדים ומהוגנים ומשלמים עבורם כסף, ואז הבידור גדול שבעתיים.

זה משאיר לנו רק את השאלה האחרונה - האם כל המתמטיקה אכן מבוססת על כשלים לוגיים? כמובן, לא הכשל הלוגי הזה עם ה-$latex 1=0$ שהוסק בצורה שגויה, אבל האם יש לנו הוכחה שהמתמטיקה נמצאת על בסיס יציב וחף מכשלים?

התשובה היא שאנחנו מאמינים שהמתמטיקה כיום חפה מכשלים כאלו, אבל אין לנו הוכחה משכנעת לכך, וכרגע נראה שהוכחה כזו לעולם לא תתקיים. הייתה תקופה בתולדות המתמטיקה שבה הבעיה הזו נראתה אקוטית הרבה יותר מאשר היום - שיא התקופה הזו היה בתחילת המאה ה-20, כאשר בבסיס של המתמטיקה דאז באמת התגלו סתירות ונדרשה עבודת תיקון לא מעטה בשביל להתגבר עליהן. האופטימיות של התקופה גרמה למתמטיקאים לקוות שאפשר יהיה להתגבר עליהן “אחת ולתמיד” - למצוא ביסוס למתמטיקה שדורש הנחות יסוד מאוד פשוטות, שיהיה “ברור מאליו” שהן נכונות ואפשר יהיה להוכיח שלא יכולות להוביל לסתירות. השאיפה הזו נקראת התוכנית של הילברט והיא… נכשלה. לא במובן זה שנמצאו סתירות במתמטיקה, אלא במובן זה שנמצאה הוכחה - “משפט אי השלמות השני של גדל” - שאי אפשר יהיה לתת בסיס פשוט שכזה והוכחות של ממש ש”המתמטיקה נטולת סתירות” ייאלצו להיות מסובכות ועם הנחות לא מוכחות משל עצמן. שימו לב לנקודה העדינה פה: זה שאי אפשר להוכיח שאין סתירות במתמטיקה לא אומר שיש סתירות במתמטיקה; זה רק אומר שזו טענה שאין לנו דרך להוכיח בצורה “פשוטה”. יש טענות מתמטיות רבות אחרות שאין דרך להוכיח בצורה “פשוטה”; למעשה, משפט אי השלמות הראשון של גדל נותן לנו דרך שיטתית לבנות טענות כאלו, ובהתבסס עליו אפשר להוכיח את המשפט השני. יש לי פוסט על משפטי גדל, אבל אם כל נושא היסודות הרעועים-כן-או-לא של המתמטיקה מעניין אתכם, אני ממליץ על הספר “משפטי גדל ובעיית היסודות של המתמטיקה” של ארנון אברון שמכסה את הנושא בצורה בהירה ומעניינת מאוד.

ולאלו שעדיין מחפשים “סתירות” במתמטיקה - למה אתם עושים את זה בעצם? למה לשחק עם משוואות טיפשיות כשאתם יכולים לשחק עם דברים מגניבים כמו עקומים אליפטיים? המתמטיקה מגניבה. אל תחפשו בה סתירות אלא כיף! תתעוררו, אנשים!


נהניתם? התעניינתם? אם תרצו, אתם מוזמנים לתת טיפ:

Buy Me a Coffee at ko-fi.com