אז מה הקטע עם דילוגי אותיות בתורה? (חלק ב')

בפוסט הקודם הכרנו את מושג הדילוגים בתורה וראינו כמה דוגמאות בסיסיות. בפוסט הזה אני רוצה להמשיך לדון באותם דברים, ועדיין לא לקפוץ לדיון על המאמרים של ויצטום וריפס. בואו נתמקד לבינתיים בספר של דרוזנין ובכל מה שהוא מייצג: ההנחה שניתן איכשהו לחזות את העתיד באמצעות התורה, ושזוהי סגולה ייחודית לתורה.

הממצא המרכזי שסביבו נבנה הספר של דרוזנין הוא ההתנקשות ביצחק רבין. אבל פרט אליו הספר עמוס ב”תגליות” רבות נוספות, רובן מרוכזות סביב החצי השני של שנות התשעים ונראות כיום לא רלוונטיות להדהים. אני רוצה להתמקד באחת ספציפית שמראה, לטעמי, את הגיחוך הגדול שברוב התוצאות שנמצאות בספר (הרי לא אתחיל לעבור אחת אחת…). הבה ניתן לדרוזנין לדבר (עמוד 77 בספר):

שבוע לפני ה-29 במאי 1996, יום הבחירות הגורלי - הבחירות שיכריעו אם להמשיך בתהליך השלום שנחתם בלחיצת היד בין רבין וערפאת - מצאתי את התוצאה חזויה מראש בצופן התנ"כי."רה"מ נתניהו" הופיע מקודד, והמלה "נבחר" חצתה את שמו. באותה השורה, באותו הפסוק, הופיע כינויו, "ביבי". לא האמנתי שזה יקרה. בנימין נתניהו היה מתנגד מוצהר לתוכנית השלום. שמעון פרס היה אדריכל התוכנית והיורש החוקי של יצחק רבין. הייתי בטוח שישראל לא תפנה לאחור, גם לא אחרי גל פיגועי הטרור... ביום שלפני הבחירות התקשרתי לאלי ריפס וסיפרתי לו שמצאתי את "רה"מ נתניהו" מוצפן בתנ"ך. ריפס הוא שגילה את המילה "נבחר" החוצה את שמו. מבחינה סטטיסטית, זה מעבר למקריות. ההסתברות הייתה 1 ל-200. נתניהו אכן זכה, אולם הצופן מנבא שהוא ימות בקרוב...

“חכה שניה!”, אתם בטח אומרים, “מה זה עניין ה”ימות בקרוב” הזה?”. ובכן, אין לי כוח לפרט את כל הטרחנות שדרוזנין מטרחן אחר כך - דברים בסגנון הנבואה של רבין. כיום אנו יודעים שהנבואה הזו הייתה שגויה, אבל דרוזנין כנראה יטען שזה בזכות מעשיו והאזהרות שהוא הזהיר (לדבריו בספר, לא אימתתי), אז נוותר על זה. בואו נתמקד בצופן שהוא מדבר עליו.

ראשית, “רהמנתניהו” אכן מופיע בדיוק פעם אחת בתורה, בדילוג אחורי של לא פחות מ-19129, החל מאינדקס 259333. שתי המילים האחרות שנמצאות בסמיכות ל”רהמנתניהו” ודרוזנין מציין הן “ביבי” ו”נבחר”. אלו שתיהן מילים קצרות ואנחנו בוגרי הפוסט הקודם, כך שאנחנו יודעים שאפשר לצפות שהן יופיעו המון בתורה - “ביבי” עם הי’ם שלו יותר מ”נבחר”. ואכן, “ביבי” מופיע בדילוגי אותיות בסך הכל 926,592 פעמים, “נבחר” מופיע 109,969. התנ”ך כולו מפוצץ במילים הללו. כמובן, כדי שלדרוזנין זה יצא יפה הוא משתמש במופע שלהן עם דילוג קטן - 2 עבור ביבי, מינוס 4 עבור נבחר; אבל הקפיצות המדויקות הללו אינן חשובות, כמובן, וכל קפיצה קטנה יחסית הייתה מרשימה את דרוזנין באותה המידה. “נבחר” מופיע 53 פעמים בקפיצה עד גודל 20, ואילו “ביבי” מופיע 453 פעמים. מי שהתרשם מה”ביבי” שהיה כל כך קרוב ל”רהמנתניהו” - אל. התורה מלאה ביבי בכל אשר נפנה. הסתברות של 1 ל-200? אולי, אבל הסתברות של 1 ל-200 שיקרה מה? ש”רהמנתניהו” יופיע כשבסביבה שלו יש את “ביבי” בדיוק בדילוג של 2 ואת “נבחר” בדילוג של בדיוק מינוס 4? או ש”רהמנתניהו” יופיע כשבסביבה שלו יש “ביבי” ו”נבחר” בדילוג כלשהו? או ש”רהמנתניהו” יופיע כשבסביבה שלו יש מילים מעניינות? או שצירוף מילים כלשהו שכולל את שם משפחתו של נתניהו יופיע עם מילים מעניינות ואולי תחילית מעניינת? (כי באמת, כולנו יודעים ש”רהמנתניהו” זה בגלל שלא “בנימיןנתניהו” ולא “ביבינתניהו” לא מופיעים בתורה היודעת-כל) דרוזנין לא אומר, וכמובן שלא מפרט את החישובים.

אבל הניתוח המספרי של הדילוג הזה הוא החלק הפחות מעניין כאן. מה שיותר צריך לעניין את הקורא הביקורתי הוא שהצופן הזה תלוי במיקום הטמפורלי של מי שמוצא אותו. בבחירות 1996 הצופן “ניבא” מי יהיה ראש הממשלה; אבל מה היה קורה אם דרוזנין היה כותב את הספר מאוחר יותר ומגיע למסקנה שהצופן מתייחס בכלל לבחירות 1999, שבהן נתניהו הפסיד? ואז ב-2009 נתניהו שוב ניצח. אולי הצופן התייחס בכלל לבחירות הללו? ולמה הוא לא כלל הבהרות נוספות לגבי התאריך שאליו הוא מתייחס? הנקודה היא שה”צפנים” שדרוזנין מוצא הם לא מעניינים כל כך סטטיסטית, ולכן דרוזנין מנסה ליצור אצל הקורא קישור אסוציאטיבי כלשהו בין המילים המפוזרות שהוא מוצא, על ידי כך שהוא מספר סיפור עלילה נחמד שמנסה לקשור את המילים אחת לשניה. תגידו “נו, ברור, זה מובן מאליו”, אבל צריך להדגיש שויצטום וריפס עושים דברים שונים ואובייקטיביים (לפחות למראית עין) יותר.

איזה ניסוי ברור שצריך לעשות עכשיו? כמובן, לחפש “רהמפרס” ו”נבחר”. ובכן, “רהמפרס” מופיע המון; הדילוג המינימלי שלו הוא 69 החל מ-30,810. “נבחר” מופיע קרוב אליו, בדילוג של מינוס 5, החל מ-31,257. בסמיכות יש גם את כינוי החיבה הישן של פרס, “לוזר”, בדילוג של 120 החל מ-30,918. אם כן, אולי היה צריך “לנבא” שפרס ייבחר? הייתי רוצה להגיד שזו טעות נוראית ובעצם התורה התכוונה לבחירה של פרס לנשיא המדינה, אבל “רהמפרס” לא מותיר מקום לספק; פרס מעולם לא נבחר לראשות הממשלה. הייתכן - תחזיקו חזק - שיש נבואות שגויות בתורה?

זה אחד הדברים שלא טרחתי להביא בפוסט שעבר, גם כי ברור שיש (דרוזנין עצמו מצא כמה עבורנו; מכיוון שאף אחד כנראה לא ציפה שהנבואות של דרוזנין יתגשמו לאף אחד גם לא היה אכפת) וגם כי קת’ולהו היה חמוד יותר. הציעו לי בתגובות לפוסט הקודם לחפש את היטלר בהקשר של שלום. ובכן, באופן מביך משהו לתורה-שכוללת-הכל, “אדולףהיטלר” לא מופיע בה כלל. זה לא מפתיע כי זו מילה ארוכה - ארוכה יותר מ”יצחקרבין” בשתי אותיות. לעומת זאת “היטלר” סתם מופיע בתורה המון, כצפוי - 6,290 פעמים. הדילוג המינימלי הוא של מינוס 3 החל מ-221,330, וכמובן שאפשר למצוא שלל מילים קצרות לידו - “ מנצח”, “שלום”, “אהבה” וכדומה. אתם מבינים את העיקרון.

אז עד כה טענתי שקל למצוא בתורה מה שרוצים (לא את כל מה שרוצים, אבל מספיק דברים אם מוכנים לשחק עם זה). זה טוב כדי לשכנע בכך שכנראה לא כדאי להשתמש בתורה כדי לחזות את העתיד, אבל זה לא שולל טענה אחרת, מעודנת יותר: שהתורה היא טקסט בעל תכונות ייחודיות, שלא סביר שנכתב בידי אדם. זו (ולא “עם התורה אפשר לחזות את העתיד”) הטענה המרכזית של ויצטום וריפס, והיא דורשת התמודדות זהירה יותר מאשר השטויות של דרוזנין. לב העניין אצל ויצטום וריפס הוא אותן “תכונות ייחודיות”, אבל ארשה לעצמי לא לדבר עליהן בפוסט הזה אלא להתמקד, עדיין, בשאלה קלה בהרבה - האם אפשר למצוא תוצאות דומות לאלו שמצאתי עד כה גם בטקסטים אחרים?

שני טקסטים לא דתיים בעליל ששימשו בעבר לחיפוש אחר “צפנים” הם “מובי דיק” ו”מלחמה ושלום” (בשל אורכם, מן הסתם). לי אין עותק דיגיטלי שלהם בעברית, וגם אם היה - אני מעדיף ללכת על משהו יותר אקראי. למרבה המזל, בימינו יש מקור פשוט מאוד לטקסטים אקראיים ארוכים בעברית - ויקיפדיה העברית. אז מה שעשיתי הוא פשוט מאוד וכל אחד יכול לעשות בבית: השתמשתי במנגון של ויקיפדיה שנותן לי רשימת ערכים אקראיים ושאבתי מהם את התוכן (בלי הבחנה - גם לינקים וכדומה - אבל כשאני משאיר רק את האותיות העבריות ותו לא) עד שקיבלתי טקסט באורך דומה לזה של התורה - 300,000 תווים בערך. כמובן, אתם לא חייבים להאמין לי שלא הינדסתי את קובץ הטקסט באופן מושלם לצרכי; לכן אני מזמין אתכם לחזור על הניסויים שלי עם טקסט ויקיפדי שתפיקו בעצמכם. הנה הסקריפט בשפת Ruby שבו השתמשתי לצורך בניית הטקסט.

הטקסט עצמו הוא אמנם אקראי במובן זה שפרנקנשטיין בנה אותו מחלקי ערכים בויקיפדיה, אבל בבירור יש לו “אופי” שונה מזה של התורה בשל צירופי מילים שונים שמופיעים בו (למשל, “יצחקרבין” פזור בו הרבה בדילוג של 1, מה שכמובן לא נמצא בתורה).

התחלתי לערוך את החיפושים שלי בטקסט, ואז להפתעתי הרבה קרה דבר מוזר - שום דבר לא הצליח! לא מצאתי בדילוג גדול מ-1 אפילו דברים פשוטים כמו “היטלר”, שלא לדבר על רהמנתניהו. גם קתולהו היה נפקד. התחלתי להתכסות זיעה קרה, לפקפק בעצמי ולתהות “רגע. אולי יש משהו בתורה? משהו ייחודי? האמנם? הייתכן?”. ואז עצרתי לרגע לחפש באגים. חיפשתי “כלב”, ראיתי שהוא אמנם מוצא הרבה תוצאות אבל שאף אחת מהן לא עוברת את אינדקס 1,024 בטקסט. בירור קצר העלה שאיכשהו השתרבבו ירידות שורה לטקסט שגרמו לחיפוש שלי לפעול רק על 1,024 המילים הראשונות. לעזאזל!

אחרי שתוקנה התקלה התוצאות התחילו להיראות קצת יותר שפויות - מילים קצרות כמו היטלר וקתולהו צצו כל הזמן. לעומת זאת, “יצחקרבין” (בדילוג גדול מ-1) ו”רהמנתניהו” וכדומה לא נמצאו כלל. מצד שני, “ברקאובמה” כן הופיע, בדילוג של 145 ובדילוג של 7459. אז עבור אובמה של ה-145 נקטתי בשיטת קת’ולהו - זרקתי המון מילים מהראש ובדקתי אם משהו מעניין יתקבל בסמיכות לאובמה. מצאתי את “שחור”, “נשיא”, “נבחר”, “כושי”, “ארהב”, “מישל”, “תקווה” ו”חזון”. אני בכוונה לא הולך להביא תמונה או פרטים מדויקים יותר, כי כאמור - אתם לא צריכים לסמוך עלי ועל הטקסט שלי. תעשו ניסויים בעצמכם באופן שאני מתאר. לא בטוח שתצליחו למצוא את “ברקאובמה”, כמובן, אבל אם תמצאו מילה ארוכה מעניינת - ואם תחפשו מספיק, תמצאו - אז בסמיכות אליה כנראה תצליחו למצוא ערב רב של מילים קצרות רלוונטיות.

הלקח הוא פשוט: בכל פעם שבה אתם רואים תוצאה מרשימה לכאורה של דילוגי אותיות, עצרו ושאלו את עצמכם - האם שיטת פעולה כמו זו שתיארתי למעלה יכולה לנפק תוצאות שכאלו? אם התשובה היא “כן”, אז די ברור איך צריך להתייחס אליה. התרשמותי מהספר של דרוזנין היא שכמעט כל תוצאה בו היא מהצורה הזו. צורה אחרת היא של מילה נדירה שנמצאת בדילוג בטקסט, והטקסט המקורי שמצטלב איתה הוא בעל משמעות מעניינת - כמו יצחק רבין וה”רוצח אשר ירצח”, או קת’ולהו ומתן תורה. בשל העושר של התורה והמשמעויות הרבות שמיוחסות לכל פסוק ופסוק, אפשר להשתמש בטכניקה הזו כדי לתת משמעות “מעניינת” להמוני מופעים של מילים בדילוגי אותיות (וכל מה שצריך הוא שהמילה תופיע בדילוג; אחר כך ההקשר התנ”כי יעשה את שאר העבודה). xkcd כבר אמר את זה קודם:

הנה דוגמה יפה ל”מצאנו משהו, בואו נבנה עכשיו נרטיב סביבו”, שמקורה בלינק שנתנו לי בתגובות לפוסט הקודם: אבולוציה. בקישור אומרים כי “אבולוציה” מופיעה פעם אחת בלבד בתורה (היא אכן מופיעה בדילוג של 2402 החל מ-246802; עם זאת, היא מופיעה גם ארבע פעמים נוספות בדילוגים אחורה של 4815,5397,18344,31281). כמו כן מצאו באיזור שלה את “צארלס” ואת “דרווין” (לא ביחד, כמובן) ואת “מאובנים”. בטקסט מציינים שהמילים הללו מופיעות רק 79, 179 ו-41 פעמים (בהתאמה) בדילוגים של עד 10,000; כמובן שבדילוגים ארוכים יותר המספר גדול יותר אבל בשביל הדוגמה הזו לא היה צורך בדילוג ארוך יותר. זו בהחלט תוצאה נחמדה ויותר מרשימה מברק אובמה שלי. הבעיה היא רק שלא ברור מה היא אומרת - הרי לא מנסים לטעון פה שהתורה בעד דרווין - ולכן בלינק מנסים לבנות נרטיב סביב ההקשר של המופע של “אבולוציה”.

ההקשר הוא מצוות שילוח הקן, והב’ של אבולוציה נפלה ישר על “ביצים”. והנה בא הנרטיב:

תורת האבולוציה מנסה להסביר התפתחות כל המינים בעולם ממין אחד ראשוני. ואולם כאן בפסוק מתוארת לנו התפתחות באותו המין מהביצים עד לאפרוחים וכלה בציפור האם. חוקרי האבולוציה ניסו בכל מיני שיטות ודרכים להוכיח את תורתם ביניהם: מאובנים ואבות קדומים משותפים,
הפרדוקס המפורסם שעד היום מתקשים להסביר אותו הוא התרנגול והביצה, השאלה היא בעצם מה בא קודם, התרנגול או הביצה? אם נגיד שהביצה אז מי הטיל אותה, ואם נגיד שהתרנגולת אז מהיכן יצאה? ובכן, ברור שהתורה רומזת לנו כאן על הבעייתיות הזאת.

הבלוג הזה לא עוסק בביולוגיה, ולכן אסתפק בלהגיד - קשקוש מקושקש! חצופים!

סליחה. מה שהתכוונתי לומר, לפני שמתקן השגיאות האוטומטי של האייפון התערב, הוא שהציטוט למעלה נותן משמעות חדשה למילה “מאולץ”. הלינק מכיל עוד דיונים וקישורים באותה הרוח. מי שסקרן מוזמן להיכנס.

מילה אחת לסיום, כהכנה לפוסט הבא שידבר על ויצטום וריפס: פרט לעניין בניית הנרטיב, המושג המרכזי שמשחק תפקיד בדילוגי אותיות- וימשיך לשחק תפקיד גם כשנגיע לויצטום וריפס - הוא מרחב התמרון שיש לנו; אילו דברים אנחנו יכולים לשנות ואולי לשפר את תוצאות הניסוי תוך כדי. כאן, ובניסויים כאלו באופן כללי, יש לנו כמה רמות שונות של מרחב תמרון. ראשית, אנחנו אלו שמחליטים מה בא לנו לחפש מלכתחילה - האם הניסוי שלנו יערב את ברק אובמה, או שיערב את יוליוס קיסר, או בכלל שיעסוק בקת’ולהו. בכל אחד מהמקרים ודאי נוכל לתת נימוק משביע רצון למה בחרנו להתעסק דווקא באישיות שבה בחרנו להתעסק (זה מה שדרוזנין עושה רוב הספר). אחרי שקבענו את האישיות, יש לנו מרחב תמרון בבחירת המילים שנחפש. אם אנחנו מגבילים את עצמנו בכך שאחת המילים צריכה להיות מדילוג מינימלי, אז מרחב התמרון כולל גם את בחירת המילה הזו (בעוד שעבור שאר המילים כל מופע שלהן בטקסט יהיה לגיטמי). בנוסף, יש לנו חופש בחירה רחב בבחירת האיות המדויק של מה שמחפשים. כך למשל במקרה של “מגלת” מול “מגילת” (כאשר מספיק שאחד משניהם יצליח כדי שהרושם המרשים יתקבל), וכמובן גם במקרה של “רהמנתניהו” שממחיש יפה עד כמה יש לנו חופש בחירה של המילה המדויקת אותה נחפש.

הבדלי איות הם אולי התמרונים המעודנים והחזקים ביותר בכל העניין. נניח שיש לנו 20 מילים שאנו מחפשים, ולכל אחת יש לנו שני איותים שונים. זה אומר שיש $latex 2^{20}=1,048,576$ - מיליון וקצת - קומבינציות אפשריות לחיפוש. לא מדויק להגיד משהו בסגנון “אם ההסתברות הייתה 1 למיליון שהקומבינציה תיתן תוצאה מעניינת, אז קרוב לודאי שאחת מהתוצאות הייתה מעניינת” ולו בגלל שקרוב לודאי שההסתברויות לכך ששתי קומבינציות דומות-אך-לא-זהות יהיו מעניינות הן תלויות זו בזו. אבל אי אפשר להכחיש את זה שיש כאן הרבה, הרבה מקום לתמרן. וכשעושים את אותו הניסוי הרבה פעמים עם פרמטרים קצת שונים, תוצאות לא סבירות יצוצו מתישהו.

וגם את זה xkcd אמר קודם:


נהניתם? התעניינתם? אם תרצו, אתם מוזמנים לתת טיפ:

Buy Me a Coffee at ko-fi.com