אז מה הקטע עם דילוגי אותיות בתורה? (חלק ג')

חלק מהתגובות לפוסטים הקודמים שאלו את השאלה הברורה - בשביל מה בכלל להקדיש זמן לדילוגי אותיות? הרי ברור לכל קוראי הבלוג שזה שטויות, מי צריך ניתוח רציני של הנושא?

ובכן, יש לשאלה הזו כמה תשובות אפשריות. הראשונה היא שאני מאמין שיש בבלוג גם קוראים שאינם מבינים שזה שטויות וקריאה בבלוג יכולה לשכנע אותם בכך. השניה היא שאני חושב שבנושאים כאלו, שזכו לפופולריות רבה, ראוי לתת לטענות בחינה כלשהי ולחשוב עליהן ולא רק לפסול מייד ב”זה נשמע לי שטויות”; פסילה אוטומטית שכזו היא לא גישה מדעית, ויעידו על כך מדענים לאורך כל ההיסטוריה שנפסלו מראש כי מה שאמרו (שבדיעבד הפך לקונצנזוס) נחשב ל”שטויות” (גאורג קנטור ודן שכטמן הם שתי דוגמאות טובות שהוזכרו בבלוג זה עצמו). הבלוג “חשיבה חדה” נותן התייחסות רצינית שכזו לאינספור נושאים “על טבעיים”, החל בנומרולוגיה וכלה באנשים ש”חיים” בלי לאכול ולשתות. אני בסך הכל תורם את חלקי הצנוע. בנוסף, גם בתור מישהו שלא מאמין שיש משהו מעניין בדילוגי אותיות בתורה עדיין הייתי רוצה מקום שיכתוב עליהם בצורה מסודרת ומפורטת כדי לדעת איך להתייחס למי שכן מדבר עליהם ברצינות.

וחוץ מזה, רייטינג.

הפעם אני רוצה לדבר על המאמר של ויצטום, ריפס ורוזנברג (WRR, כפי שאכנה אותם מעתה), “Equidistant Letter Sequences in the Book of Genesis” (“רצפי אותיות שווי-מרחק בספר בראשית”). המאמר זמין לכל כאן. מה שהופך את המאמר הספציפי הזה לייחודי בתולדות דילוגי האותיות היא העובדה שהוא פורסם בכתב עת מתמטי רציני עם ביקורת עמיתים - (Statistical Science 9, 1994, 429-438). זה לכשעצמו עדיין לא אומר הרבה, אבל זה כן אומר שכדאי להבין על מה המאמר מדבר בכלל.

הנה תיאור קצר שיסביר (אני מקווה) למה אני חושב שהמאמר הזה רציני הרבה יותר מכל מה שדיברנו עליו עד כה. המאמר נפתח בלתאר את המושג של מילה שמופיע בדילוגי אותיות, שבמאמר מכונה ELS (דהיינו Equidistant Letter Sequence - “רצף אותיות שוות-מרחק”). הוא מצהיר שהטקסט שבו הוא הולך לעסוק הוא רק ספר בראשית (שקצר משמעותית מכל התורה, כמובן). לאחר מכן הוא מדבר על “קרבה” בין ELS-ים שמתרחשת כאשר כותבים את הטקסט כריבוע ברוחב מסויים ומביא דוגמה של “פטיש” ו”סדן”. לאחר מכן המאמר מבהיר בעצמו שזו סתם דוגמה טיפשית כי אלו מילים קצרות ולכן צפוי שהן יופיעו קרוב אחת לשניה משיקולי הסתברות כלליים; כלומר, המאמר כבר מודע לכל הדברים היפים שאמרתי בפוסטים הקודמים. בשל כך, המאמר מצהיר שהוא ידבר על ELS-ים יותר “מעניינים”, ובפרט כאלו שבהם הדילוג הוא מינימלי (טוב, כבר אמרתי שהם נותנים חשיבות לדילוג המינימלי). ואז הם מצהירים ש”פטיש” בדוגמה שלהם מופיע בדילוג מינימלי, ו”סדן” באותה דוגמה מופיע בדילוג מינימלי בטקסט שהוא 71 אחוז מספר בראשית. אה… טוב, עד כה, לא משכנע יותר מדי. המאמר מבטיח שהוא עושה דברים יותר רציניים בהמשך.

הניסוי של WRR בנוי כך: הם מגדירים זוגות של מילים עם איזה קשר ביניהן (למשל, “פטיש” ו”סדן” הן זוג מילים שיש ביניהן קשר), ועבור אוסף זוגות כזה מודדים את רמת הקרבה ביניהן. לצורך כך, מגיעה הגדרה פורמלית של WRR לפונקציה שאיתה הם מודדים “מרחק” בין שני ELS-ים. זו הגדרה מסובכת למדי, והם עצמם מעבירים אותה לנספח. אני לא הולך לדבר עליה עכשיו בכלל, כי הפוסט הזה מטרתו להיות נגיש גם למי שלא רוצים לראות נוסחאות; אולי אציג אותה בפוסט המשך. WRR אומרים במפורש שההגדרה שלהם לפונקציית המרחק אינה יחידה במובן זה שניתן להציע הגדרות אלטרנטיביות, אבל שהם “מרגישים ששינוי בפרטים לא סביר שישפיע באופן משמעותי על התוצאות”. המממ.

גם השלב השני הוא מתוסבך מתמטית (יחסית); כאן WRR מגדירים את האופן שבו הם נותנים דירוג למדגם כולו (זכרו - המדגם הוא אוסף של זוגות של מילים עם קשר ביניהן, והבדיקה היא של רמת הקרבה בתוך הטקסט של ELS-ים עבור המילים הללו). שוב, עדיף לחשוב על זה בתור קופסה שחורה שבסוף פולטת איזה שהוא דירוג, וחסל; הפרטים המתמטיים לא יהיו רלוונטיים כל כך בהמשך.

בשלב השלישי WRR בוחרים את זוגות המילים שישתתפו במדגם. הבחירה שלהם היא להשתמש ברבנים מפורסמים, ובתאריכי הלידה או הפטירה שלהם. זו הסיבה שהניסוי הזה מכונה לפעמים גם “ניסוי הרבנים”. למשל, “רבי אליהו” (הגאון מוילנא) עם התאריך ט”ו ניסן. רק שזה ממש לא פשוט כמו שאני מציג את זה עכשיו, ועוד נדון בשלב הזה הרבה בהמשך. לבינתיים, הבנתם את הכוונה.

טוב, תגידו, עד כה לא הבנו מה אתה רוצה מאיתנו. אז הם מוצאים זוגות של מילים “קרובות” ואומרים שהתוצאות שלהם איכותיות כתוצאה מאיזו פונקציית משקל מוזרה שהם הגדירו ואתה מפחד אפילו לומר לנו מה היא. מה חדש? זה לא נשמע שונה ממה שכבר עשינו בפוסטים הקודמים. אתם כמובן צודקים בכך: הטוויסט מגיע בשלב האחרון.

אתן דוגמה קטנה משל עצמי. נניח שהרשימה שלנו כוללת שלושה זוגות: “צרציל, אנגליה”, “רוזוולט, ארהב” ו-“דהגול, צרפת”, ושאנחנו מחשבים את הדירוג על פי WRR של הזוגות הללו בספר בראשית ומקבלים 17 (לא חשוב אם זה מספר שבאמת יכול להתקבל מהדירוג של WRR). לא ברור מה אנחנו אמורים ללמוד מזה. אבל, שימו לב שאנחנו יכולים להגדיר עוד חמישה זוגות אחרים על בסיס המילים שכבר יש לנו. אכתוב אותם במפורש:

  1. "צרציל, ארהב", "רוזוולט, אנגליה", "דהגול, צרפת".
  2. "צרציל, ארהב", "רוזוולט, צרפת", "דהגול, אנגליה".
  3. "צרציל, צרפת", "רוזוולט, ארהב", "דהגול, אנגליה".
  4. "צרציל, צרפת", "רוזוולט, אנגליה", "דהגול, ארהב".
  5. "צרציל, אנגליה", "רוזוולט, צרפת", "דהגול, ארהב".

מה עשיתי כאן? ערבבתי את רשימת המדינות וחילקתי את הערבוב למנהיגים. במתמטיקה קוראים לערבוב כזה פרמוטציה. היופי בעניין הזה הוא שפרמוטציות יש המון: אם הרשימה שלנו כוללת שלושה זוגות, יש לה 6 פרמוטציות כפי שאנו רואים (זכרו שגם המצב שבו כל מנהיג קיבל את המדינה “שלו” הוא פרמוטציה), אבל ברשימה של 10 זוגות כבר יש לי \( 3,628,800 \) פרמוטציות, וברשימה של 30 זוגות יש לי את כל הפרמוטציות שאי פעם ארצה. כך שקל מאוד לייצר אוספי זוגות שהם כמעט אותו הדבר כמו אוסף הזוגות המקורי, כשההבדל העיקרי הוא במשמעות שאנחנו מייחסים לחיבור בין שני רצפי אותיות שרירותיים. אין סיבה לחשוב שהטקסט “יעדיף” את “צרציל, אנגליה”, “רוזוולט, ארהב”, “דהגול, צרפת” (שמתאים כל מנהיג למדינה שלו) על פני “צרציל, ארהב”, “רוזוולט, צרפת”, “דהגול, אנגליה” (שמתאים כל מנהיג למדינה שאיננה שלו) ולכן אפשר להבין את ההפתעה שלנו אם נריץ את החישוב של WRR על כל הפרמוטציות ונגלה שהערך הגדול ביותר שהן קיבלו הוא 7, כלומר הן לא מגרדות את ההצלחה של אוסף הזוגות ה”נכון” (17 בדוגמה שלי).

זה בערך מה שקרה ב-WRR.

הם הגדירו 1,000,000 פרמוטציות על אוסף הזוגות שלהם ועשו “תחרות” ביניהן לראות מי מקבלת את הדירוג הכי גבוה. האוסף ה”נכון” אמנם לא הגיע למקום ראשון, אבל עבור אחת משיטות הניקוד שלהם הוא הגיע למקום 453 מתוך 1,000,000, ובשיטה אחרת הוא הגיע למקום 5 מתוך 1,000,000. אם אכן כל העסק היה אקראי, היינו מצפים ממנו להגיע למקום בעל חמש ספרות, לפחות. הסיכוי שאוסף הזוגות ה”נכון” יגיע למקום גבוה כל כך - ובכן, זה ממש לא נראה סביר.

אבל כאן זה לא נגמר. צריך גם קבוצות ביקורת. לכן WRR חזרו על הניסוי בטקסטים אחרים: “מלחמה ושלום”, ספר ישעיהו, ספר בראשית כשמערבבים את האותיות שבו; ספר בראשית כשמערבבים את המילים שבו; ספר בראשית כשמערבבים את הפסוקים שבו, וספר בראשית כשמערבבים את האותיות בכל פסוק. בכל המקרים הללו ההצלחה של האוסף ה”נכון” הייתה בלתי מרשימה בעליל, כפי שהיינו מצפים בניסוי אקראי שכזה. גם בלי לבחון את התוצאות מתמטית, מבט אחד בטבלה נראה מרשים ביותר:

(\( P_{1} \) ו-\( P_{2} \) הן שתי שיטות הניקוד שהזכרתי; לא חשוב מה זה \( P_{3},P_{4} \)).

אוקיי. זה מפתיע. זה לא צפוי. מי שלא עוצר בשלב הזה ובוהה בחלל ותוהה לעצמו לרגע - ובכן, אני לא מבין אותו.

כעת WRR מסכמים:

אנו מסיקים שקרבת ה-ELS-ים בעלי משמעויות קשורות בספר בראשית אינה מקרית (Due to chance).

זה הכל. שימו לב שאין כאן אפילו אזכור ישיר לאל, לא כל שכן לניבוי עתיד כלשהו. המאמר הזה הרבה יותר זהיר ומפוכח מאשר הטררם הדרוזניני; ומצד שני, התוצאה שבו נראית חזקה הרבה, הרבה יותר, ולא ברור איך אפשר להסביר אותה בכלל.

הדבר הראשון שאפשר לתהות לגביו הוא השיטה המתמטית של דירוג המדגמים - שהיא, כאמור, לא מיידית להבנה (אם כי לא קשה מדי). אבל לי עצמי נראה לא סביר שאפשר איכשהו “להנדס” את השיטה כך שתחזיר תוצאות טובות דווקא על המדגם הספציפי של הרבנים בספר הספציפי של בראשית. אני לא אומר שאי אפשר; אבל זה בהחלט לא בראש רשימת ה”חשודים” שלי. השלב שנראה לי שעל פיו קם ונופל דבר הוא בדיוק שלב בחירת המדגם. למה דווקא רבנים? על פי אילו קריטריונים נבחרו הרבנים הספציפיים הללו? האם יש תהליך כלשהו שמאפשר “לכייל” רשימה של רבנים כדי שתחזיר תוצאות טובות בניסוי בתורה? והכי חשוב - האם יש תהליך כלשהו שמאפשר “לכייל” רשימה של רבנים כדי שתחזיר תוצאות טובות בניסוי בספרים אחרים? כלומר, האם המאמר של WRR יכל להיכתב גם עבור ספרים אחרים, תוך שינויים קלים לכל היותר? ובכן, למזלי אני לא לבד בעולם - בשנת 1999 פורסם באותו כתב עת שפרסם את WRR מאמר של המתמטיקאים ברנדן מקיי, דרור בן-נתן, גיל קלעי והפסיכולוגית מיה בר הלל (MBBK) שעוסק בדיוק בדברים הללו (לקרוא לו “מאמר הפרכה של WRR’’ - וזה איך שאני רוצה לקרוא לו - נשמע לי סובייקטיבי מדי). אם לסכם את מה ש-MBBK אומרים:

  1. תוצאות הניסוי של WRR תלויות בצורה קריטית בשלב בחירת הרבנים.
  2. שלב זה נותן מרחב תמרון שמאפשר להנדס רשימה שתיתן תוצאות מצוינות בספר בראשית, ולהצדיק אותה בדיעבד באמצעות עקרונות שנראים שרירותיים ומגבילים.
  3. אפשר לעשות את זה גם בספרים אחרים, וספציפית ב"מלחמה ושלום" אפשר לייצר רשימת רבנים שדומה מאוד לזו של WRR אבל מצליחה אפילו יותר להתמודד עם אותו ניסוי.
  4. בניסוי של WRR לא היה ציות מלא לכללים שהם עצמם קבעו, ויש בעיות נוספות שמטילות צל כבד על התקינות שלו.

עבורי 3 היה מה שהרס טוטאלית את האפקט של WRR. מה שהרשים אותי ב-WRR הוא ששיטת הפרמוטציות שבה הם השתמשו נראתה לי חסינה לנסיונות הינדוס שונים ומשונים. אבל אם איכשהו אפשר לשחק עם הרשימה כדי לקדם מדגם מסויים על פני כל הפרמוטציות שלו… ובכן, זה אומר שהשאלה שלנו לגבי WRR מפסיקה להיות שאלה מדעית - האם זה ניסוי תקין - והופכת להיות בעיקרה שאלה היסטורית-אישית, האם אפשר לסמוך על עורכי הניסוי שהניסוי הספציפי הזה נערך באופן תקין ובלי נסיון “הינדוס”?

מה שצריך להבין הוא שהתשובה לשאלה ההיסטורית-אישית הזו היא לא רלוונטית. ניסויים מדעיים לא צריכים לקום וליפול על כך שאנחנו מאמינים לאלו שערכו אותם שלא בישלו את התוצאות; הם צריכים לקום וליפול על כך שאי אפשר לבשל את התוצאות. אתן דוגמה מהבלוג “חשיבה חדה”: מספרים שם על אחד, מאסארו אמוטו, שהצמיד לצלוחיות מים פתקים עם מילים “חיוביות” כמו “אהבה” ומילים “שליליות” כמו “שטן”, הקפיא את המים והסתכל על הגבישים שנוצרו בהם; מהצלוחיות של המילים ה”טובות” הוא פרסם תמונה של גבישים “יפים”, ומהצלוחיות של המילים ה”רעות” הוא פרסם תמונה של גבישים “מכוערים”.

בניסוי הזה היו אינספור כשלים - לא אספיילר את כל הפוסט - אבל בעיה מובהקת אחת היא שהיה קל “לבשל” אותו: מכל צלוחית מים פורסמה רק תמונה אחת, והאיש שבחר איזו תמונה לפרסם גם ידע מה היה הפתק שהודבק על הצלוחית במקור. כלומר, הוא יכל לבחור את הגביש ה”יפה” ביותר מבין כל הגבישים בצלוחית שהודבק עליה פתק “טוב” ואת הגביש ה”מכוער” ביותר מבין כל הגבישים בצלוחית שהודבק עליה פתק “רע”. בוודאי שעורך הניסוי יכול לטעון שלא היו דברים מעולם והוא האובייקטיבי באנשים שאי פעם התעסקו עם מים, אבל אז אנחנו שוב עוברים לעסוק בשאלת האמינות של נסיין זה או אחר (ואמינות אפילו ברמת התת-מודע; ייתכן שהנסיין באמת התכוון להיות אובייקטיבי, אבל זה דבר קשה למדי כשאתה יודע מה התוצאה ש”אמורה” לצאת). ככה לא עורכים ניסוי.

איך אפשר היה לפתור את הבעיה במקרה של המים? בשתי דרכים פשוטות: ראשית, להבטיח קיום של קבוצות ביקורת (צלוחית שהודבק עליה משהו רע, צלוחית שהודבק עליה משהו טוב, צלוחית שלא הודבק עליה כלום, צלוחית שהודבק עליה ג’יבריש, צלוחית שהודבק עליה משהו נייטרלי ועוד ועוד - כולן מוקפאות באותם תנאים בדיוק והמים שבהן מגיעות מאותו מקור בדיוק וכדומה). שנית, להבטיח שמי שמדרג את ה”יופי” של הגבישים במים לא יודע איזו צלוחית השתייכה לאיזו קבוצת ביקורת (הייתי אומר סמיות כפולה אבל זה מתאים רק לסיטואציה שבה גם הנבדקים הם אנושים, והם לא יודעים לאיזו קבוצת ביקורת הם שייכים). לבסוף, היה ראוי לפרסם את כל הממצאים מהניסוי באופן מסודר (כל התמונות של הגבישים שנוצרו במים ולא רק אלו שלדעת עורך הניסוי היו “היפים ביותר”).

לעומת זאת, בניסויים של הצופן התנ”כי שדומים לאלו של WRR לי אין מושג איך אפשר לערוך ניסוי מבוקר שכזה. הבעיה הבסיסית היא שכל קריטריון שמישהו יציע כדי ליצור מדגם של זוגות יהיה קריטריון שאותו אדם יכל לבדוק קודם בשקט בביתו, במחשב האישי שלו, אם הוא נותן תוצאות טובות עבור התורה. כל בחירה שרירותית שמתבצעת בעת יצירת המדגם היא בעיה, ולא ברור לי איך אפשר להימנע מכך. אני חושב רק על פתרון אפשרי אחד - לגשת למאגר מידע גדול ודינמי, כזה שישתנה בין זמן ההחלטה על הקריטריון וביצוע הניסוי - לדלות ממנו רשימה של זוגות מילים על ידי תוכנית מחשב אקראית, כשהאקראיות שבה התוכנית תשתמש לא תהיה ידועה מראש, ולחזור על הניסוי הזה פעמים רבות. מאגר המידע הסביר הוא כמובן ויקיפדיה העברית; אפשר לכתוב בוט שבוחר ערכים באקראי (בעזרת מנגון הערכים האקראי שהתוכנה של ויקיפדיה עצמה מספקת), מכל ערך בוחר שתי מילות מפתח כלשהן (נאמר, מילים שנפוצות בו אך לא נפוצות בדרך כלל בערכים אחרים), וחוזר על התהליך עבור 30 ערכים אקראיים שכאלו. אז אפשר להריץ את המדגם הזה על התורה ועל ספרים אחרים בשיטת WRR.

טרם מימשתי משהו כזה בעצמי, אם כי אני משתעשע ברעיון לעשות זאת. הניחוש שלי, מהבטן, הוא שהניסוי יהיה כישלון חרוץ: בכל פעם שבה אריץ אותו לא יתקבלו תוצאות מעניינות עבור אף אחד מהטקסטים שאבחר. אני גם מנחש שויצטום, ריפס ושאר תומכי הצופן התנ”כי יגידו שהניסוי שלי הוא קשקוש מקושקש ושאני חובבן. אני כמובן מסכים איתם, אבל איני מצליח לחשוב עכשיו על אף ניסוי שיצליח לשכנע אותי שיש כאן משהו ויהיה בנוי בצורה שונה מהותית מאשר הניסוי שלי (אני מגזים, אפשר לערוך ניסויים פשוטים יותר שיהיו מקובלים עלי, אבל זה כבר עניין לפוסט ייעודי).

כל זה כמובן לא אומר שניסויים אחרים לא נעשו; ועדת מתמטיקאים בראשות פרופ’ ישראל אומן ופרופ’ הלל פרוסטנברג ניסתה לבצע ניסוי דומה לזה של WRR באופן מבוקר ולא מצאה כלום - אבל אני מקדים את המאוחר, וממילא איני בטוח שאכתוב סקירה היסטורית מלאה של כל השתלשלות העניינים.

בפוסט הבא: פרטים, פרטים, פרטים! נדבר סוף סוף על איך הורכבה רשימת הרבנים של WRR, למה זה יוצר מרחב תמרון, ואילו עוד בעיות יש כאן.


נהניתם? התעניינתם? אם תרצו, אתם מוזמנים לתת טיפ:

Buy Me a Coffee at ko-fi.com