דילמת הבלונדינית האלטרואיסטית
בפוסטים הקודמים הצגתי את שיווי משקל נאש. גם מי שלא שרד אותם יוכל להתעניין (ולהבין!) בדוגמה נוספת שלו, הפעם של הבעיה המפורסמת ביותר מהתחום (עד שזכתה שספר מדע פופולרי העוסק בו יקרא על שמה) – "דילמת האסיר". הבעיה לא הומצאה על ידי נאש אלא מספר שנים לאחר שהציע את מושג שיווי המשקל שלו, והיא מעניינת בכך שהיא מראה שבאופן כללי הוא אינו בהכרח מייצג את הפתרון האופטימלי עבור הצדדים. הבעיה מנוסחת במקור עם אסירים, משטרה ואקשן, אבל לצורך אחידות אנסח אותה קודם בעזרת בלונדיניות וברונטיות (ואקשן!).
ובכן, נניח שרק נאש וחבר אחד שלו נמצאים בפאב, ונכנסות שתי ברונטיות מלוות בבלונדינית ההכרחית. כמקודם, לכל אחד מהשחקנים שתי אסטרטגיות – או ללכת על הברונטית שנושאת חן בעיניו (כל אחד מהם מעוניין בברונטית אחרת) או ללכת על הבלונדינית. כמובן ש"לא להשתתף במשחק" אינה אופציה...
ברור שהסיטואציה שבה שני הגברברים הולכים על הבלונדינית היא רעה עבור שניהם, כי הם יישארו ללא כלום. ברור גם שהסיטואציה שבה שניהם הולכים על ברונטיות נפרדות היא טובה יחסית – שניהם יזכו במערכת יחסים יציבה ונישואים מאושרים. התחכום שבבעיה הוא דווקא במקרה השלישי, שבו אחד מהגברברים (נניח נאש, מגיע לו) הולך על הבלונדינית, ואילו השני על הברונטית. לכאורה נאש אמור להיות בעננים, בזמן שהשני אמור להיות מרוצה לפחות כפי שהיה מרוצה אם שניהם היו הולכים על ברונטיות מלכתחילה. אלא שכאן נכנסת למשחק הקנאה – איך החבר של נאש יוכל לחיות עם עצמו בזמן שנאש מתהלך כטווס המתהדר בבלונדינית? ולכן הסיטואציה הזו היא הגרועה ביותר עבור השחקן השני – גרועה יותר מלחיות עם ברונטית כשלנאש אין בלונדינית להתהדר בה אלא רק ברונטית סטנדרטית משל עצמו, וגרועה אפילו יותר מהסיטואציה שבה שניהם הולכים על הבלונדינית ויוצאים בידיים ריקות – כי הוא נשאר עצמאי ויכול ללכת לפאבים בלי נאש המעצבן מכאן והבא, במקום שייאלץ להתחתן עם ברונטית ולחלום על הבלונדינית של נאש בלילה.
מכאן עולה התוצאה הפרדוקסלית לכאורה – שיווי המשקל במשחק הוא הסיטואציה שבה שני הגברים הולכים על הבלונדינית, ויוצאים ללא כלום. כדי להיווכח בכך שזה נכון מספיק לראות שלא משתלם לאף שחקן להחליף אם האסטרטגיה שלו (כלומר, ללכת על הברונטית) אם השחקן השני לא מחליף את האסטרטגיה שלו. מכיוון שאמרנו שמי שנתקע עם הברונטית בזמן שלשני יש בלונדינית כבר היה מעדיף שלשניהם לא יהיה כלום, זה מיידי.
אין במשחק נקודות שיווי משקל אחרות – המצב שבו אחד בחר בבלונדינית והשני בברונטית מופר, כאמור, על ידי כך שהבוחר בברונטית יפנה אל הבלונדינית. עם זאת, גם הסיטואציה ה"אופטימלית" במשחק – זו שבה שניהם הולכים על ברונטיות ושניהם מרוצים יחסית – נופלת. נניח שאני חברו של נאש ושנינו הלכנו על ברונטיות. האם משתלם לי להחליף בהינתן שנאש נשאר עם ברונטית? בטח, הרי בלונדינית זה הכי טוב, ונאש לא יפריע לי.
מה שחסר כאן הוא הסכם מחייב כלשהו, שיכריח הן אותי והן את נאש ללכת על ברונטיות, ולא רק ללחוץ ידיים, להסכים על כך, ואז שאחד משנינו יבגוד ברגע האחרון (מה שיקרה, כמובן, הוא ששנינו נבגוד). לכן כל כך חשוב להדגיש שמדובר במשחק לא שיתופי, כלומר משחק שבו כל אחד מהשחקנים פועל רק על דעת עצמו, ורק כדי להשיג מקסימום רווח לעצמו. חשוב להדגיש שהבעיה כאן אינה "חוסר תקשורת" בין שני השחקנים (כפי שלעתים מציגים משחקים לא שיתופיים) אלא חוסר היכולת לכפות שיתוף פעולה בין שניהם (דבר שאכן נובע לעתים מחוסר תקשורת, אך לא בהכרח).
כעת אציג את הבעיה בניסוח המקורי שלה, ויהיה אפשר להיווכח שמדובר באותה גברת בשינוי אדרת (כפי שקורה פעמים רבות במתמטיקה; ציטוט מפורסם אומר כי המתמטיקה היא האמנות של קריאה בשם אחד לדברים שונים, ובשמות שונים לאותו הדבר). שני שודדי בנק נתפסים, כל אחד מוכנס לחדר חקירות ומועבר בפרוצדורת ה"שוטר טוב, שוטר רע". המטרה: שילשין על השני. אם הוא מלשין וחברו שותק, הוא מקבל תוכנית להגנת עדים אי שם על אי טרופי באוקיינוס השקט, וחברו נכנס לכלא להרבה זמן. לעומת זאת, אם שניהם מלשינים, שניהם הולכים לכלא (אבל לפרק זמן פחות ממושך – צרת טיפשים רבים חצי נחמה). אם שניהם שותקים, אין למשטרה כלום עליהם והם משתחררים – אבל אז במקום תוכנית להגנת עדים באוקיינוס השקט יש להם את שיכון ז' ואת המשטרה שרק מחכה לתפוס אותם בפעם הבאה. לא הכי כיף בעולם.
כאן הסיטואציה האופטימלית עבור שני השחקנים היא שתיקה הדדית. עדיף להיות חופשי מאשר להיות בכלא. עם זאת, שיווי המשקל הוא בסיטואציה שבה שני הפושעים מלשינים זה על זה, ונכנסים שניהם לכלא. למה? נסו לבדוק את הסיטואציות השונות ותראו שהניתוח זהה לניתוח של בעיית הבלונדינית.
יש עוד נקודה אחת שאני רוצה להתייחס אליה. פעמים רבות מציגים את דילמת האסיר כאילו היא מראה ש"האנוכיות לא משתלמת" (כפי שנאש עצמו אמר בסרט, "אדם סמית' זקוק לשכתוב"). הרי לכאורה הסיבה לכך ששני האסירים נדפקים בסוף היא העובדה שהם פועלים רק למען הרווח שלהם, מבלי לחשוב על טובת חברם; אם הם רק היו קצת יותר אלטרואיסטים ומתחשבים בו שניהם היו שותקים וכולם היו יוצאים מורווחים.
זו דרך מחשבה יפה (נניח), אבל הבעיה בה היא שהיא שגויה בתכלית. אין לדילמת האסיר שום קשר לאנוכיות. למעשה, דילמת האסיר כלל אינה מתעניינת במטרות ובמניעים של השחקנים; החשיבות היא רק בחוסר שיתוף הפעולה שלהם.
אנסה להצדיק זאת באמצעות הדגמת סיטואציה הדומה לזו שבסיפור הקלאסי של דילמת האסיר, רק שבה שני האסירים הם אלטרואיסטים לחלוטין - כלומר, מתעניינים רק בטובת חברם, מבלי להתעניין כלל בטובתם שלהם. המודל של דילמת האסיר שראינו יתאים בדיוק גם לסיטואציה זו.
אם כן, נניח שחוקרי המשטרה מודעים לכך שהאסירים אלטרואיסטים, והם באים לכל אחד מהם בהצעה הזו: אתה תודה באשמה. אם חברך ישתוק, הוא ישתחרר ונעזוב אותו בשקט, בזמן שאתה תלך לכלא להרבה זמן. לעומת זאת, אם שניכם תודו, שניכם תלכו לכלא (אבל לפחות זמן), ואילו אם שניכם תשתקו שניכם תשתחררו, אבל נמשיך לעקוב אחריכם ולהציק לכם.
מה יכול לקרות בסיטואציה הזו? ברור שהאפשרות שבה שני האסירים שותקים עדיפה עבורם מאשר זו שבה שניהם מודים (כי אם שנינו מודים, אז חברי הולך לכלא לתקופה מסויימת, גם אם קצרה, ואילו אם שנינו שותקים, אז חברי בחוץ). כמקודם, הסיטואציה המעניינת היא זו שבה אחד האסירים מודה ואילו השני שותק. מבחינת האסיר שמודה, הוא בעננים: חברו שוחרר, והמשטרה לא תמשיך להציק לו. אז נכון, האסיר המודה עצמו תקוע עכשיו בכלא לכל החיים, אבל מה אכפת לו? הוא אלטרואיסט, והעיקר שחברו מרוצה.
אלא שכאן נכנס הטוויסט. הרי גם חברו של המודה הוא אלטרואיסט - איך אתם חושבים שהוא מרגיש? הוא אמנם חופשי ומשוחרר (למי אכפת?) אבל חברו נמק בכלא בגללו. איזה מצב נורא. ברור שהוא היה מעדיף להודות בעצמו, ולחסוך לחברו כמה שנים בכלא.
נסו לצייר טבלה עבור ה"משחק" הזה, ותראו שתקבלו בדיוק את אותה טבלה כמו זו של דילמת האסיר הקלאסית. הבעיה, אם כן, אינה האנוכיות אלא חוסר שיתוף הפעולה - חוסר שיתוף פעולה שאינו תלוי ביכולת התקשורת בין שני האסירים: אם חברי היה בא אלי ואומר "שמע, אני מודה בהכל ואתה שתוק", האם הייתי מתרשם מזה? ודאי שלא. אני אלטרואיסט, ולכן הייתי רץ ומודה בעצמי, כדי לחסוך לו זמן בכלא.
כל הדיונים בדילמת האסיר מעלים שאלה מרכזית אחת: אם המודל המתמטי הזה אומר ששני האסירים ילשינו, למה בחיים האמיתיים זה לא קורה ושני האסירים שותקים? התשובה לכך היא, כמובן, שבחיים האמיתיים הסיטואציה מורכבת יותר - מי שמלשין היום יודע שבפעם הבאה שהוא יהיה בסיטואציה דומה, מצבו יהיה רע ומר, בעוד שאם הוא ישתוק היום בפעם הבאה ייתכן שגם חברו ישתוק ושניהם ירוויחו. אם הוא שואב את הידע שלו מהקולנוע, הוא גם יודע שתוכניות להגנת עדים נגמרות רע תמיד...
תורת המשחקים מנסה לטפל גם בסיטואציות המורכבות הללו, אבל זה כבר עניין לדיון נפרד, ארוך הרבה יותר. בינתיים, אשמח לשמוע דוגמאות נוספות לדילמת האסיר שבהן אתם נתקלים בחיי היום-יום שלכם.
נהניתם? התעניינתם? אם תרצו, אתם מוזמנים לתת טיפ: