האם המצאנו או גילינו את המפלצת המתמטית שמתחת למיטה?

ישנם שני דיונים פילוסופיים מרכזיים וקשורים זה לזה הנוגעים למתמטיקה. הראשון עוסק בשאלה האם האובייקטים המתמטיים “קיימים” בצורה כלשהי במנותק מבני האדם, או שהם חבים את כל קיומם להגדרות של בני האדם, ובלעדי בני האדם לא היו קיימים כלל. השני עוסק בשאלה האם המתמטיקה היא תגלית או המצאה. דעתי בנושא היא פשוטה - אין לי ספק שהאובייקטים המתמטיים קיימים באופן מנותק מבני האדם; בני האדם רק יוצרים הגדרות מילוליות שמאפשרות להם “לראות” את האובייקטים המתמטיים, ואותן הגדרות לא היו קיימות אלמלא בני האדם. לדיון הזה איני מעוניין להיכנס כרגע (אם כי כפי שנראה בהמשך, לא אוכל להימנע לגמרי ממנו).

הדיון השני הוא מורכב יותר, מכיוון שאין ספק שבמתמטיקה יש המצאות רבות. בפוסט הקודם הצגתי שיטה לפתרון משוואות רקורסיביות; אפשר להגיד שהשיטה הזו התעופפה לה בשקט בעולם אידאות כלשהו עד שבא מישהו וקטף אותה, אך נראה לי יותר נכון לומר שמי שחשב על השיטה המציא אותה. הוא לא סתם הלך ברחוב ונתקל בה לפתע פתאום, והוא לא ביצע תצפית כלשהי שהניבה אותה. אם הגישה הזו שלי מקובלת עליכם, ייתכן שתקבלו את הרושם שאין במתמטיקה תגליות כלל - ואני מעוניין להקדיש את הפוסט הזה כדי לתת כמה דוגמאות לכך שבהחלט יש בה, ושמדובר במובנים מסויימים במדע אמפירי למדי, שגם בו יש תצפיות, השערות והפרכות (טוב, להפרכות לא ממש אכנס כאן, אבל אפשר להזכיר את מספרי פרמה).

כדאי להתחיל מניפוץ מיתוס שנראה לי שלא מעט מחזיקים בו, לגבי הצורה שבה “עושים” מתמטיקה. ספרי הלימוד במתמטיקה, והרצאות אוניברסיטאיות במתמטיקה, נוקטים לרוב בשיטת “מלמטה למעלה”. מתחילים מהגדרות ומושגים בסיסיים, ועליהם מתחילים לבנות עוד ועוד מושגים, ולהוכיח עוד ועוד משפטים. זו אכן הדרך המסודרת והמדוייקת ללמד מתמטיקה; אך האם זו הדרך שבה חוקרים פועלים? כלומר, האם הם אומרים “בוקר טוב! בואו נמציא היום כמה אקסיומות חדשות ונתחיל לשחק איתן”? ודאי שלא.

דוגמה קלאסית לצורה לניגוד הזה ראה כל סטודנט לחדו”א. המושג המרכזי בחדו”א הוא גבול, ולא אכנס כרגע להגדרה שלו (שתיארתי כאן פעם). הוכחות של גבולות של פונקציות ספציפיות הולכות בערך כך: מתחילים ממספר ממשי כלשהו \( \varepsilon>0 \) וצריך לבנות, במהלך ההוכחה, מספר ממשי אחר \( \delta>0 \) כך שהפונקציה תקיים איזו שהיא תכונה שתלויה ב-\( \delta \) וב-\( \varepsilon \). כלומר, ה-\( \varepsilon \) הספציפי שנבחר מציג “אתגר” בפני הפותר, והפותר צריך לספק \( \delta \) שמתמודד עם האתגר.

כאשר מרצים מוכיחים גבול מסויים בכיתה, לעתים הם פותחים את ההוכחה שלהם באופן הבא: “יהי \( \varepsilon>0 \). נבחר \( \delta=\frac{3}{7}\sqrt{\varepsilon^{5}} \), וכעת…” ואז מראים שהתכונה מתקיימת. הבחירה הספציפית של ה-\( \delta \) שלהם תגרום להוכחה שהתכונה מתקיימת להיות אלגנטית ויפה במיוחד. רק מה, ה-\( \delta \) נראה מזוויע ולסטודנטים אין מושג איך אפשר היה להגיע אליו מלכתחילה. הדרך ה”נכונה” להתמודד עם גבולות היא להתחיל עם \( \delta \) כמעט שרירותי, לשחק איתו ולראות מה קורה במהלך תהליך ההוכחה של התכונה; לרוב התוצאות שמגיעים אליהן מספיקות כדי לזהות מה הערך של \( \delta \) צריך להיות כדי שההוכחה תהיה אלגנטית ויפה ככל האפשר, וזו גם הצורה שבה המרצה הגיע לכך מלכתחילה. עם זאת, את שלב ה”חקירה” הזה חייבים לעבור לפני שאפשר לבצע את ההוכחה במדוייק; העובדה שלא תמיד עושים זאת מקשה מאוד על הסטודנטים, לצערי.

הדבר לא קורה רק בחדו”א, כמובן, אלא במקומות רבים במתמטיקה. לעתים קרובות אנו מתבוננים בהוכחות שחלקים גדולים מהן אינטואיטיביים וברורים, ואז פתאום מגיע צעד מופרע לחלוטין ומנותק מכל הגיון אפשרי, שלכו ותבינו מאיפה הוא בא. הוא בא, ככל הנראה, מ”חשיבה הפוכה” שכזו, או לפחות מנסיונות רבים של המוכיח לבצע צעדים שונים ומשונים, עד שבסופו של דבר הוא הגיע אל הצעד הנכון שיש לבצע. את כל התהליך הזה אנחנו לא רואים; רק את התוצר המוגמר. אמנם, יש ספרי מתמטיקה שמתארים גם את התהליך, לפחות באופן חלקי, אבל הם נדירים למדי ולרוב מנסים להיות בעלי יותר מערך לימודי גרידא של הנושא שלהם, אלא גם לספק פרספקטיבה “היסטורית”. אם כן, חשוב להבין שהצורה שבה המתמטיקה מוצגת אינה זהה לצורה שבה המתמטיקה נחקרת. כמובן שבדרך ההצגה המתמטית ישנם יתרונות רבים; קשה לי לקרוא טקסט לימודי שאינו כתוב בצורה שכזו.

הבנה ונעבור כעת למה שהיא ככל הנראה הדוגמה הידועה ביותר במתמטיקה למשפט שנולד מתוך “תצפיות אמפיריות” - משפט המספרים הראשוניים. אפשר להתווכח על השאלה האם המספרים הראשוניים נתגלו או הומצאו - כאמור, אני חושב שהשם “מספר ראשוני” הומצא, אבל התכונה המהותית, המאפיינת שלהם אינה “המצאה”, אלא אנחנו פשוט שמנו לב לחשיבות שלהם. בערך באותה הצורה ששמנו לב לחשיבות של אטומים כאבני הבניין של החומר. משפט מפורסם של אוקלידס הוכיח עוד בימי יוון העתיקה שיש אינסוף ראשוניים, מה שמעלה את השאלה “אבל האם זה אינסוף גדול, או אינסוף קטן”?

ובכן, הדרך הפשוטה ביותר במתמטיקה מודרנית לדבר על גדלים של אינסוף היא באמצעות מה שמכונה עוצמות, אלא שהן כלל לא רלוונטיות לדיון הזה שכן עוצמת קבוצת הראשונים שווה לעוצמת קבוצת כל הטבעיים. ממילא, כאשר נענתה השאלה המדוברת תורת העוצמות טרם הומצאה (למעשה, אני משקר כאן חלקית - ההוכחה של משפט המספרים הראשוניים ניתנה ב-1896, אחרי שקנטור כבר פיתח את תורת הקבוצות - אבל המדד שאציג היה קיים הרבה לפני שהוכיחו את נכונותו). הצורה שבה המתמטיקאים ניגשו למושג הגודל הייתה קצת יותר מעודנת - נסמן ב-\( \pi\left(n\right) \) את מספרם של המספרים הראשוניים שקטנים או שווים ל-\( n \); השאלה היא מהו בערך הגודל של \( \pi\left(n\right) \), לכל \( n \). אם תרצו, אפשר לתת גם ניסוח אחר - נניח שאנחנו מגרילים מספר בין 1 ל-\( n \); מה ההסתברות שנקבל מספר ראשוני?

משפט המספרים הראשוניים ראוי לפוסט בפני עצמו. רק אציין שבתחילה כל מה שהיה הוא ניחוש - ניחוש ש-\( \pi\left(n\right)\approx\frac{n}{\ln n} \), כאשר שני הקווים מסמנים כאן “בערך” (יש למושג הזה משמעות מתמטית מדוייקת לחלוטין שלא אציג כרגע). את הניחוש הזה ניחשו - כל אחד בנפרד - גאוס ולז’נדר, וזאת פשוט על ידי הסתכלות על ערכים אמיתיים של \( \pi\left(n\right) \) שחושבו ידנית. ההוכחה הגיעה רק קרוב למאה שנים לאחר מכן, והיא מבוססת על אבחנה מבריקה של ברנרד רימן מאמצע המאה - שההתפלגות הזו של הראשוניים קשורה בצורה הדוקה לפונקציה מסויימת, שמאז נקראת “פונקצית הזטה של רימן” - למעשה, שאפשר לצמצם את המשפט כולו לטענה שלפונקציה אין אפסים בתחום מסויים (פונקצית הזטה של רימן היא מה שנקרא פונקציה מרוכבת מרומורפית; מבלי להיכנס לפרטים, תורת הפונקציות המרוכבות מראה כי ההתנהגות של הפונקציות הללו נקבעת בצורה מאוד חזקה באמצעות האפסים שלהן, כך שאין כאן מקריות). השערת רימן המפורסמת מצמצמת עוד יותר את המקומות שבהם האפסים של פונקצית הזטה עשויים להימצא, מה שמשפר באופן משמעותי את מה שניתן להגיד על התפלגות הראשוניים; כמובן שגם לזה לא אוכל להיכנס כרגע.

אם כן, מה הולך כאן? ראשית, שני מתמטיקאים מכובדים מבצעים מחקר שאינו דומה בכלל לפיתוח מתמטי מסודר - הם מסתכלים על מספרים ומעלים השערות. אחר כך בא רימן וגם הוא בעיקר מעלה השערות ורעיונות, אבל לא ממש מוכיח משהו מהם (רימן כן הוכיח מספר דברים על הפונקציה, אבל לא ניכנס אליהם). מה הם עושים אם לא משהו אמפירי? ויתר על כן, מהיכן צצה לה פונקצית הזטה? היא הייתה ידועה עוד בזמנו של אוילר, אבל רימן היה הראשון שביצע חקירה משמעותית שלה באמצעות הכלים של האנליזה המרוכבת, ואז פתאום צצו תוצאות חדשות. מהיכן? האם הקשר של האפסים של הפונקציה להתפלגות של הראשוניים הוא תוצר מעשה ידי אדם? האם כשפונקצית הזטה “הומצאה”, זה מה שעבר בראש של האדם שהמציא אותה? אני בספק.

אני רוצה לעבור כעת מהדוגמה הקלילה הזו למשהו הרבה, הרבה יותר קיצוני. בהתאם, נפנוף הידיים שלי כשאתאר את האובייקטים שאדבר עליהם יהיה גדול בהרבה - להבדיל מענייני פונקצית הזטה של רימן, שעליהם אני יודע מעט מאוד, על הדברים שאזכיר כעת אני לא יודע כמעט כלום. מה שאני רוצה לספר עליו מכונה בעגה המתמטית Monstrous Moonshine; ה-Monstrous פירושו “מפלצתי”, וזה תכף יתבהר; ה-Moonshine ככל הנראה בא כאן במשמעות של “מגוחך” (למילה באנגלית יש קונוטציות יותר עדינות - משהו שהוא מופרך עד כדי כך שהוא הופך למגוחך וקומי. למישהו יש רעיון למילה מתאימה בעברית?). הבה ונכיר את שני הכוכבים של הסיפור הזה.

נתחיל בחבורות פשוטות. “חבורה” היא מושג שתיארתי כאן לא אחת - זה למעשה שם כולל לאובייקטים מתמטיים רבים שיש בהם פעולה בינארית (כדוגמת כפל או חיבור) שמקיימת כמה תכונות נחמדות. המושג של חבורה פשוטה הוא מעט יותר מסובך - לחבורות ישנן תת חבורות (תת קבוצות שלהן שהן בעצמן חבורה), וחלק מאותן תת חבורות נקראות “נורמליות” - לא אכנס כאן להסבר מדוייק, אבל החבורות הנורמליות שופכות אור רב על המבנה של החבורה כולה. יש חבורות שאין להן בכלל תת חבורות נורמליות (חוץ מאשר שתיים טריוויאליות שהן, בערך, “הכל” ו”כלום”), וחבורות שכאלו מכונות חבורות פשוטות. ניתן לתאר את כל החבורות הסופיות באמצעות חבורות פשוטות, בדומה לכך שכל מספר טבעי ניתן לתאר באמצעות הגורמים הראשוניים שלו, אבל אני מזהיר כאן שהקשר אינו דומה עד כדי כך ועד שאכתוב פוסט בנושא אפנה את המתעניינים לחפש מידע על “סדרת הרכב”. בקיצור - חבורות פשוטות הן אחד מהדברים הראשונים שמתמטיקאים רוצים למיין כשהם באים לעשות סדר בעולם המפלצתי והפרוע של תורת החבורות.

עשיית הסדר” המדוברת נחשבת לאחד מהפרוייקטים המתמטיים הגדולים של המאה ה-20 (טוב, על מי אני עובד - נחשבת לפרוייקט הגדול ביותר של המתמטיקה במאה ה-20, חד וחלק). עשרות אם לא מאות מתמטיקאים עסקו בתרומה לאותו פרוייקט, שנמשך עשרות שנים והסתכם באלפי עמודי מאמרים. התוצאה הסופית? יש כמה משפחות אינסופיות של חבורות פשוטות שניתנות לאפיון פשוט יחסית, ועוד כ-26 חבורות בודדות, “ספורדיות”, שאינן עונות על האפיונים הללו. מבין החבורות הספורדיות, הכי מפורסמת היא חבורת פישר-גריס, הידועה גם בשם “המפלצת”. הנה הסברנו את ה-Monstrous. החבורה הזו זכתה בצדק לכינוי הזה, בגלל גודלה - היא מכילה בסביבות ה-\( 10^{53} \) איברים. להשוואה - מספר הכוכבים ביקום מוערך בכ-\( 10^{22} \). מן הסתם יש דרכים פשוטות יותר לאפיין את המפלצת מאשר כתיבת כל איבריה; אחת מהדרכים המקובלות לחקירת חבורות היא באמצעות תורת ההצגות, שבה מסתכלים על הצורות השונות שבהן ניתן לחשוב על אברי חבורה כעל טרנספורמציות לינאריות שפועלות על מרחבים וקטוריים (ובעברית: כעל משהו שפועל בצורה מסויימת על משהו מתמטי אחר). מי שלמד אלגברה לינארית זוכר אולי שלמרחבים לינאריים יש מימד. מי שלמד את תורת ההצגות זוכר אולי שבתורה זו מתעניינים בעיקר בהצגות אי פריקות של חבורות (הנה עוד מושג שלא אגדיר כעת). דוגמה טיפוסית למימד של הצגה אי פריקה של המפלצת היא 196883. עכשיו, משסיימנו את נפנוף הידיים הזה, אפשר לעבור לנפנוף ידיים גדול הרבה יותר.

האובייקט השני שאני רוצה לתאר נקרא “פונקצית ה-\( j \)”. כאן אפילו לא אנסה להתחיל ולתאר מאיפה היא הגיעה במדוייק. מדובר בפונקציה מרוכבת, שמקיימת כמה תכונות יפות למדי שמאפיינות משפחה חשובה של פונקציות שנקראות “תבניות מודולריות” (Modular Forms; בתרגום ספרו של סיימון סינג על משפט פרמה המושג הפך, למרבה הבושה, ל”צורות מודולריות”). פונקצית ה-\( j \) היא לא “סתם עוד” תבנית מודולרית - היא אולי התבנית המודולרית החשובה ביותר, והיא מתקשרת לתורת המספרים בצורות יפות מאוד. כאמור, אין לי שום סיכוי לדבר על כך ברצינות כאן וכעת, אך חשוב לי להבהיר שהפונקציה הזו אינה מלאכותית; לא סתם בחרנו לדבר עליה מבין כל אינסוף הפונקציות הקיימות, כשם שהמפלצת אינה מלאכותית.

אם כן, יש לנו שני יצורים לא קשורים בעליל. אחד מגיע מתחום תורת החבורות, והשני מגיע מתחום תורת המספרים והפונקציות המרוכבות. בשני המקרים, מדובר על אובייקטים שלי אין ספק ש”נתגלו” - מי שהמציא את המושג של חבורה לא החזיק בראש תמונה של המפלצת. שום דבר במפלצת אינו מעשה ידי אדם, פרט לתיאורים הקומפקטיים שבהם האדם משתמש כדי לתאר אותה. ה-Monstrous Moonshine מתאר קשר לחלוטין לא טריוויאלי שהתגלה בין שני היצורים הללו. את האבחנה הראשונית, האמפירית, לכך שיש קשר שכזה אמר מתמטיקאי בשם ג’ון מק’קי למתמטיקאי מפורסם מאוד בן זמננו, ג’ון קונווי; קונווי, בחריפות הלשון האופיינית לו, אמר מייד שהמחשבה שיש קשר שכזה היא Moonshine. מהר מאוד הוא שינה את דעתו.

מה בעצם היה הקשר? לפונקצית ה-\( j \) יש הצגות רבות, ואחת מהן היא באמצעות התמרת פורייה (שוב, משהו שלא אכנס אליו). בהצגה הזו אפשר לכתוב את הפונקציה באופן הבא: \( j(\tau)=\frac{1}+744+196884{q}+21493760{q}^{2}+864299970{q}^{3}+\cdots \) (מהו \( q \)? מהו \( \tau \)? שוב, לא חשוב). מה שמעניין כאן הם המקדמים של המשוואה, אם מתעלמים מ-744. המקדם השני אולי נראה לכם מוכר, כי אך לפני שנייה הזכרתי את המספר 196883, הקטן ממנו באחד; זה גם מה שמק’קי ראה. מכיוון ש-\( 196884=1+196883 \). ה-1 מוסבר בקלות בכך שיש למפלצת הצגה אי פריקה ממימד 1. ההצגה האי פריקה הבאה של המפלצת היא מגודל \( 21296876 \), ולא קשה לראות ש-\( 21493760=1+196883+21296876 \). בקיצור, יש כאן קשר. בהמשך, הקשר נהיה קצת יותר מורכב, אבל הרעיון הבסיסי נותר זהה - כל אחד מהמקדמים בפיתוח של פונקצית ה-\( j \) חוץ מה-744 הזה ניתן לכתוב באמצעות סכום כלשהו של גדלי ההצגות האי פריקות של המפלצת. כל זה, כמובן, התגלה באופן אמפירי לגמרי, בלי שמץ של מושג לאף אחד מהמעורבים מה לעזאזל הולך כאן.

האבחנה הראשונית הייתה ב-1979; ב-1992 הוכיח המתמטיקאי ריצ’רד בורצ’רדס את הקשר (שכאמור, איני יכול לתאר בצורה פורמלית ומדוייקית). אם כן, אין כאן מקריות; שני האובייקטים אכן קשורים בצורה מסויימת. מהי? אין לי מושג, אבל זה לא העניין. ראשית, העניין הבסיסי הוא היופי שבכל הסיפור הזה - יופי שאני מניח שכל חובב מתמטיקה יכול לראות. הדבר השני הוא מה שהתופעה הזו אומרת לנו על שאלת המתמטיקה-תגלית-או-המצאה. איני יכול להבין כיצד מישהו שמודע לתוצאות הללו יכול להמשיך ולחשוב שהמתמטיקה כולה המצאה; ברור לגמרי שאובייקטים מתמטיים שאנחנו “ממציאים” הם בעלי חיים עשירים ורחבים יותר מאשר אנחנו מסוגלים להעלות בדמיון שלנו. האם אנחנו באמת ממציאים משהו? האם כשהעיוורים נתקלים בפיל, האחד אוחז בזנבו והשני בחדקו, ניתן לומר שהם “ממציאים” את הזנב והחדק בכך שהם נותנים להם שמות? האם בכך שהם ממששים את הזנב והחדק הם יודעים את כל מה שניתן לדעת? לא.

יש עוד טיעון מחץ אחד שאני חושב שניתן להשתמש בו כאן, ואכן כבר שמעתי אותו לא אחת - טיעון לפיו במתמטיקה ה”ממציא” של מערכת האקסיומות אמנם לא יודע את כל מה שנגזר ממנה, אבל מרגע שקבענו אותה, זה סוף המשחק - אפשר יהיה להגיע להכל באמצעות גזירה פורמלית ממנה, וחסל. ראשית, הבעיה הבסיסית בטיעון הזה היא, כאמור, שהמתמטיקאים לא “מתחילים” מהאקסיומות אלא מגיעים אליהן במהלך המחקר; אבל יותר מכך, השעשוע הזה של לקיחת מערכת אקסיומות וגזירה ממנה של כל המתמטיקה הוא הדבר המרכזי שקורט גדל הוכיח שלא ניתן לעשותו. גדל הראה שאפילו את כל המספרים הטבעיים לא ניתן לתאר באופן מושלם באמצעות מערכת אקסיומות בודדה (שמקיימת כמה תכונות בסיסיות והכרחיות, שעליהן פירטתי בפוסט שעסק במשפט גדל). אם כן, לא ניתן לזהות את האובייקטים המתמטיים עם מערכות האקסיומות שמנסות לתאר אותן (לפחות לא כשזה מגיע לאובייקטים מורכבים דיו כדי לתאר את הטבעיים…); התיאור-מעשה-ידי-אדם אף פעם לא יצליח לתפוס את האובייקט המתמטי בשלמותו. זה, אגב, המסר ה”פילוסופי” שגדל עצמו קיווה שהמשפט שלו יעביר (ולרוע המזל, לרוב משתמשים בו כדי לתאר מסר הפוך לגמרי). אם כן, האם המצאנו את המספרים הטבעיים, או שגילינו אותם, ואנחנו ממשיכים, גם כיום, לנסות ולאפיין אותם בצורה טובה יותר מאשר סתם “זה זנב, זה חדק”?


נהניתם? התעניינתם? אם תרצו, אתם מוזמנים לתת טיפ:

Buy Me a Coffee at ko-fi.com