זוג או פרד (כן, עם ד’!)

הפנו את תשומת לבי למהומה זוטא שהתפתחה בבלוגספרה העברית סביב משחק הזוג-או-פרט. תחילתה בפוסט של תודעה כוזבת על כך שהמשחק אינו הוגן (אסביר בקרוב), והמשכה בשתי צורות שונות: מתקפה על ה”רציונליות” בבלוג של מודי, והרחבה לתקיפת הרולטה (והקזינו בכלל) בבלוג של ניצן. אני רוצה להתייחס לכל העניינים הללו (חוץ מעניין הקזינו שראוי לפוסט נפרד).

ובכן, הבה ונדבר על זוג או פרט (או כפי שאני הכרתי אותו תמיד - וגם אחד מהמגיבים ב”תודעה כוזבת” - “זוג או פרד”). תזכורת קלה למי שלא היה אף פעם ילד: במשחק משחקים שני שחקנים, שאחד הוכרז מראש בתור “זוג” והשני בתור “פרט”. שני השחקנים שולפים בו זמנית יד שבה זקופות כמה אצבעות. סופרים את סך כל האצבעות השלופות - אם הוא זוגי, אז “זוג” מנצח; אחרת, “פרט” מנצח.

מה שנמצא בבסיס טענת חוסר ההוגנות של שחר היא ההנחה (שהוא עצמו מכיר בכך שהיא בעייתית) שבמשחק כל אחד שולף בין אצבע אחת לחמש אצבעות, והבחירה ביניהן היא אקראית. האם מישהו משחק כך במציאות? בוודאי שלא, אבל מה היה קורה אם כן? ובכן, קל לראות שאז המשחק אינו “הוגן”, במובן זה שאחת האפשרויות יכולה לצאת בהסתברות גדולה יותר מהשנייה. אין צורך אפילו להיכנס לחישובים מורכבים; אם כל אחד מוציא בין אצבע אחת לחמש אז יש \( 5 \) אפשרויות לשחקן, ולכן \( 25 \) תוצאות אפשריות למשחק בכללותו; האפשרויות הללו מתחלקות לזוג ופרט, אבל יש מספר אי זוגי שלהן, ולכן אחת מהאפשרויות תזכה ביותר מקרים מהשניה (לפחות 13 מתוך 25). כמובן שאפשר גם לעשות את החישוב במדוייק: אם השחקנים מגרילים אצבע בין 1 ל-5 הם בעצם מגרילים “זוג” בהסתברות \( \frac{2}{5} \) (ההסתברות לבחור או 2 או 4) ו”פרט” בהסתברות \( \frac{3}{5} \). השחקן “זוג” מנצח אם ורק אם שני השחקנים שלפו מספר אצבעות “זוגי” בו זמנית, או מספר אצבעות “אי זוגי” בו זמנית, כלומר ב-\( \frac{2}{5}\cdot\frac{2}{5}+\frac{3}{5}\cdot\frac{3}{5}=\frac{4+9}{25}=\frac{13}{25} \) מהמקרים; לכן “זוג” תהיה התוצאה הנפוצה ביותר.

אם נכתוב תוכנית מחשב שבאמת מגרילה מספרים ונספור מה התוצאה הנפוצה יותר, נראה של”זוג” יש יתרון קטן. מודי אפילו טורח לכתוב תוכנית כזו אך משום מה אצלו הוא לא טורח לספור את התוצאות, כך שלא ברור לי מה התוכנית באה להגיד. למעשה, מודי טוען שההסתברות היא חצי-חצי, מהנימוק הבא: “הרלוונטיות של מספר האצבעות שייך אך ורק לאפשרות החלוקה שלהן בשתיים… מבחינה סטטיסטית זוג או פרט לא שונה בהרבה מעץ או פלי - השחקן מכריז על הבחירה שלו אבל התוצאה נקבעת על בסיס הבחירה של היריב. כפי שהמתמטיקה מלמדת אותנו לא משנה אם נבחר במספר זוגי או אי זוגי הרי שסוג הבחירה של היריב היא 50:50 (זוגי או אי-זוגי) והבחירה הזו תשפיע על התוצאה באותו היחס בדיוק.”

זו לא בדיוק “טעות” אלא רק חוסר הבנה (או סירוב לקבל) של תנאי המשחק ששחר הציג, שבהם השחקנים לא בוחרים בין זוגי ואי-זוגי בהסתברות 50:50 אלא דווקא בהסתברות 40:60. כל זה, כמובן, אם נדבקים לניסוח של שחר. במציאות אף אחד לא משחק כך; ראשית, כבר בפוסט של שחר הועלתה הטענה שגם אפס הוא משתתף חוקי במשחק (כשחקן ותיק אני יכול לאשר, אם כי איני בטוח אם לא המצאתי את זה באופן בלתי תלוי בשאר השחקנים). שנית, לרוב השחקנים בוחרים אצבעות מתוך מרחב קטן יותר (לא זכור לי שאף אחד שלף אי פעם ארבע או חמש; אני עצמי שלפתי שלוש פעמים רבות כך ששלוש הוא לגיטימי). אבל, אם ההנחה הבסיסית של שחר נכונה וכל שחקן שולף אצבע בין 1 ל-5 בהסתברות אחידה, הוא צודק.

מודי מנצל את זה למתקפה על הרציונליות. לא פחות: “איך עובדת החשיבה הרציונלית? היא לוקחת בעיה מתחום כלשהוא, מפשיטה אותה (תרתי משמע) והופכת אותה לבעיה בתחום אחר, טהור יותר, שבו אנחנו יודעים לפתור את הבעיה, ואז משליכים את הפתרון על התחום שממנו התחלנו… הסיבה היחידה להניח התפלגות אחידה היא כי זה קל ונוח לחישובים, וכי אין סיבה א-פריורי לבחור משהו אחר. הבחירה הזו היא בלתי רציונלית בעליל, ולכן כל הניתוח הרציונלי-לכאורה הוא לא יותר משעשוע אינטלקטואלי ריק, שאין לו שום קשר למציאות.”

אני חושב שמודי צודק כאן לחלוטין - הבחירה בהתפלגות אחידה כאן היא נאיבית מדי ואין פלא שהתוצאה שהיא מניבה לא אומרת כלום. אני חושב שהבעיה בטיעון של מודי היא במניעים שהוא מייחס לשחר (מכיוון שהניתוח פשוט בכל מקרה - כפי שתכף אראה - אני לא חושב ששחר בחר בהנחת האחידות כי זה “קל ונוח” אלא פשוט כי זה המודל של המשחק שעליו הוא חשב). עוד בעיה בטיעון של מודי הוא ההתלהמות שלו (“שעשוע אינטלקטואלי ריק”? בטיעון דומה אפשר לפסול כל עיסוק בידורי), וההנחה שלו שמה ששחר עשה הוא מייצג של החשיבה הרציונלית.

אני נוטה לחשוב שהחשיבה הרציונלית דווקא לא הייתה מסתפקת בגישה של שחר. בדיוק בשביל זה נוצרה תורת המשחקים - לטפל במצבים מורכבים כאלו. שחר מניח שכל שחקן הוא “אהבל” - פשוט מגריל מספר, בלי לחשוב על האופן שבו זה יעזור לו לנצח, וזה בוודאי לא מה שקורה. אם כך, מה עשר האגורות של תורת המשחקים כאן?

נניח לרגע שאני השחקן “זוג”. נניח שאני יודע שהיריב שלי מוציא באקראי אצבע בין 1 ל-5; מה משתלם לי להוציא? תגידו, ראינו שגם לך משתלם להוציא אצבע באקראי כי אז יש לך הסתברות זכיה של \( \frac{13}{25} \). האם איני יכול לשפר אותה? אני יודע שהיריב מוציא זוג בהסתברות \( \frac{2}{5} \) ופרט בהסתברות \( \frac{3}{5} \); אם תמיד אוציא פרט בעצמי, אזכה כשהיריב מוציא פרט, כלומר בהסתברות \( \frac{15}{25} \) שגדולה מ-\( \frac{13}{25} \). אז האסטרטגיה “תוציא תמיד פרט” עדיפה עבורי.

אלא שכאן נכנס לתמונה מה שהופך את תורת המשחקים למעניינת - העובדה שיש שניים לטנגו. השחקן “פרט” יכול לחשוב שזה מה שחשבתי עליו. הוא יגיד לעצמו “הממ, נניח ש”זוג” מוציא תמיד פרט, אז לי כדאי תמיד להוציא זוג, כי כך אזכה בהסתברות \( 1 \)!”.

בא השחקן “זוג” ואומר לעצמו “הממ, פרט יודע שאני תמיד ארצה לשחק פרט, ולכן הוא עצמו ישחק תמיד זוג, אז לי כדאי להוציא תמיד זוג, ואז אזכה בהסתברות 1!”

בא “פרט” ואומר “הממ, זוג משחק תמיד זוג, והאיוקן מוצאו באוסטרליה, ולכן כדאי לי תמיד להוציא פרט!” והנה נכנסנו ללולאה אינסופית. אף שחקן לא באמת יבחר בגישת הניתוח הטיפשית הזו.

מה השחקנים יעשו, אם כך, אם הם רציונליים? הם ינסו לבחור באפשרות שמבטיחה להם את הרווח הגדול ביותר, ללא תלות במה שהיריב עושה. לערך הזה קוראים “המינימקס” (שילוב של “מינימום” ו”מקסימום”, שנובע מכך שאנחנו רוצים לבחור באסטרטגיה שתמקסם את הרווח שלנו בכל סיטואציה אפשרית, בהינתן שהיריב עשה את כל שביכולתו כדי להביא למינימום את הרווח שלנו). המינימקס המדובר עומד בבסיס משפט שהוכיח ג'ון פון-נוימן, (שבין המוני הדברים שעשה היה גם) ממייסדי תורת המשחקים, שהוא בדיוק מה שאנחנו נזקקים לו כדי לנתח את הסיטואציה שלפנינו. המשפט עוסק במשחקי סכום-אפס - משחקים שבהם כל רווח של השחקן האחד מגיע על חשבון השחקן השני. בפרט, משחקים שבהם יש מנצח אחד ומפסיד אחד הם כאלו. מה שמשפט המינימקס אומר הוא שאם השחקנים יכולים לפעול באופן הסתברותי (הנחה שמקובלת עלינו במשחק הזה), אז התוצאה האופטימלית שכל אחד משני השחקנים יכולים להגיע אליה זהה, וקיימת אסטרטגיה של כל אחד מהם שנותנת אותה (למשחק קיימת רק תוצאה אחת - הזכיה של השחקן הראשון, שהיא גם ההפסד של השחקן השני; “זכיה” של מינוס 1 לשחקן הראשון פירושה רווח של 1 לשחקן השני, כך שההגדרה הזו לא מגבילה אותנו).

צריך טיפה להסביר מהי “התוצאה האופטימלית” כאן. נניח שזכיה מקנה נקודה אחת, והפסד גורם להפסד נקודה אחת (זה הכרחי, כי סכום הזכיה במשחק צריך להיות אפס - זו המהות של “משחק סכום אפס”). אז גם אם השחקנים יגרילו אפשרויות, תמיד יהיה מנצח יחיד שיקבל 1 ומפסיד יחיד שיפסיד 1. מה שהמשפט אומר הוא שבתוחלת, כשמשחקים הרבה מאוד פעמים, לשני השחקנים תהיה אותה תוצאה אופטימלית. מה היא תהיה במקרה זה? מטעמי סימטריה בין שני השחקנים היא יכולה להיות רק אפס, ותוצאה כזה יכול להתקיים במשחק הזה רק אם הסתברות הזכיה של כל שחקן היא חצי בדיוק. כלומר, אפילו בלי לטרוח להיכנס לניתוחי אסטרטגיות מורכבים, משפט המינימקס מראה לי מייד שהאסטרטגיות הטובות ביותר של השחקנים לא יכולות להבטיח להם יותר מזכיה בהסתברות חצי; ושהם יכולים להבטיח זאת.

ובכן, מרגע שאנחנו יודעים שאפשר לזכות רק בהסתברות חצי, לא קשה להציג אסטרטגיה שעושה זאת: כל שחקן בוחר בין שליפת מספר זוגי של אצבעות ובין מספר אי זוגי של אצבעות בהסתברות חצי (וזו, אני מאמין, האסטרטגיה שרוב השחקנים נוקטים בה). מדוע אם אני, למשל, “זוג”, האסטרטגיה הזו באמת מבטיחה לי הסתברות נצחון של חצי בלי תלות ביריב? כי אם היריב שלף מספר זוגי של אצבעות, יש לי הסתברות חצי לנצח (אם אבחר, בהסתברות חצי, מספר זוגי של אצבעות), ואם הוא שלף מספר אי זוגי של אצבעות יש לי הסתברות חצי לנצח (אם אבחר, בהסתברות חצי, מספר אי זוגי של אצבעות). מן הסתם גם עבור “פרט” מתקיים אותו ניתוח. סוף משחק.

אם כן, שחר טעה. לא נכון לומר על המשחק שהוא אינו הוגן, בשום צורה שהיא; מה שאפשר לומר הוא שאם משחקים את המשחק בצורה לא נכונה, זה יכול ליצור יתרון לאחד השחקנים על פני השני. במשחקים “מתקדמים” יותר כמו אבן-נייר-ומספריים היתרון הזה מנוטרל. גם מודי טעה - הגישה הרציונלית לא מניחה הנחות מופרכות כי ככה נוח לה - הגישה הרציונלית היא מה שג’ון פון-נוימן נוקט בו, ובסופו של דבר היא מגיעה למסקנה הנכונה. כמובן שאפשר לטעון שפון-נוימן הוא טרחן; הרי כל ילד יודע (תרתי משמע) שהכי טוב לבחור 50:50 בין זוג ופרט. מה צריך מתמטיקאי בשביל זה? ובכן, זה שכל ילד “יודע” זאת לא אומר שזה נכון; פון-נוימן מוכיח שזה נכון (וכמובן, באותה הזדמנות הוא מטפל בעוד זיליארד משחקים אחרים, מורכבים בהרבה). לפעמים התחושה האינטואיטיבית שלנו לגבי מה נכון היא שגויה לחלוטין, ודילמת האסיר היא דוגמה מוצלחת ביותר לכך. כל כך מוצלחת, שאיני יכול להתאפק מלגרור גם אותה לדיון הזה, עם טיעון ששמעתי לא מזמן שמראה כי המתמטיקה “טועה” לגבי הדילמה (וההיסק הסופי והמקומם היה שתורת המשחקים היא “חסרת משמעות לגבי בני אדם ומערכות מורכבות”).

הטיעון הולך כך: “נקח לדוגמא את דילמת האסיר. מה שמטריד בה הוא שלכאורה האסטרטגיה הנכונה היא לבגוד תמיד. זה נובע מכך שהתנהגות רציונלית במסגרת התיאוריה מוגדרת ככזו שלא תלויה בהחלטות השחקן השני. אבל מה קורה כאשר יש קורלציה נסתרת בין השחקנים. בדילמת האסיר שני השחקנים סימטריים לחלוטין. אין להם עבר, אין להם דפוס התנהגות, אין שום הבדל ביניהם. לכם, לדעתי, גם הפתרון חייב להיות סימטרי. כלומר, בגידה הדדית או שתוף פעולה הדדי. הפתרון המיטבי לכן הוא שתוף פעולה הדדי. תוכלו לומר שכל שחקן יכול לחשוב לעצמו שאם הוא משתף פעולה, גם השני פועל כך וניתן לנצל זאת ולבגוד. אבל, שוב, בבעיה זו השחקנים סימטריים לחלוטין. אין שום גורם שיגרום לאחד לפעול בצורה אחרת מהשני. מסתתרת כאן קורלציה.”

אני משאיר את מציאת הטעות בטיעון כתרגיל לקורא (על בסיס הפוסט הישן שלי על דילמת האסיר). מה שכן מעניין בציטוט הזה, לטעמי, הוא “דרך העבודה” שמוצגת בו - כזו שמתבססת חזק מדי על טיעון הסימטריה (שגם אני השתמשתי בו לפני רגע). הסימטריה היא אחד מהתורמים החזקים ביותר לאינטואיציה שלנו, ולכן הטיעון הזה הוא המחשה נאה לאופן שבו האינטואיציה שלנו פשוט מעוורת אותנו. אני לא סבור שזו טעות בלעדית של כותב הציטוט; מה שהוא מתאר כאן זהה גם לתחושה האינטואיטיבית שהייתה לי כאשר שמעתי על דילמת האסיר לראשונה (“חייבת לקרות אחת משתי האפשרויות הסימטריות, אז למה שלא תצא הטובה יותר?”). העובדה שהאינטואיציה הזו מתרסקת לרסיסים היא הסיבה שבגללה דילמת האסיר חשובה כל כך, ובגללה פון-נוימן והמתמטיקאים האחרים אינם טרחנים, והרציונליות היא משהו יפה שראוי להעריך, לא לסלוד ממנו.

נהניתם? התעניינתם? אם תרצו, אתם מוזמנים לתת טיפ: