נפלאות אי התבונה (חלק ד')
משסיימנו לעסוק במשחקי סכום-אפס, נוכל סוף סוף להציג את המושג של שיווי משקל נאש. הרעיון הבסיסי שבהכללה של נאש מבוסס על אותו רעיון מנחה שקיים גם במשפט המינימקס: למצוא אסטרטגיות ש"לא משתלם" לשחקן להחליף בהינתן מה ששאר השחקנים עושים. "שיווי משקל נאש" הוא פשוט בחירה של אסטרטגיה לכל אחד מהשחקנים כך שלאף שחקן לא משתלם לשנות את האסטרטגיה שלו כל עוד שאר השחקנים לא משנים את שלהם. ההבדל המרכזי שמתחייב מהכללת המשחק לכזה שאינו סכום אפס הוא שייתכנו מספר קומבינציות שכאלו של אסטרטגיות – כלומר, יכולה להיות יותר מנקודת שיווי משקל אחת למשחק.
אנסה להדגים את המושג באמצעות דוגמת הבלונדינית. בפוסט קודם כתבתי שהסיטואציה בה כל חבריו של נאש הולכים על הברונטיות והוא עצמו הולך על הבלונדינית היא דוגמה לשיווי משקל נאש. אנסה כעת להצדיק את הקביעה. ברור שיש כאן בחירה של אסטרטגיה לכל אחד מהשחקנים ("אני אלך על ברונטית" לכל אחד מחבריו של נאש, "אני אלך על הבלונדינית" עבור נאש עצמו), ולאף אחד מהשחקנים לא משתלם לשנות את הבחירה שלו כל עוד האחרים לא משנים את שלהם: לאף אחד מחבריו של נאש לא משתלם להחליף – אם הם יעברו לבלונדינית הם ייקלעו למריבה עם נאש ויגמרו בלי כלום, ובפרט בלי הברונטית שכרגע יש להם. גם לנאש עצמו אין שום סיבה לשנות את הבחירה שלו – הוא עם הבלונדינית, מה יותר טוב מזה?
מושג הסימטריה, שסייע לנו בהבנת משחק האבן-נייר-ומספריים, יכול לסייע לנו גם כאן - בעזרתו רואים בבירור שנקודת שיווי המשקל שתיארנו אינה נקודת שיווי המשקל היחידה במשחק. כל סיטואציה שבה כל השחקנים מלבד אחד הולכים על ברונטיות ואחד מהם (לא בהכרח נאש) הולך על בלונדינית היא שיווי משקל. אלו נקודות שיווי המשקל היחידות – אם אף אחד לא בוחר ללכת על הבלונדינית, לכל אחד משתלם להחליף (כל עוד האחרים לא מחליפים בעצמם), ואם יש יותר ממישהו אחד על הבלונדינית, כבר עדיף למי שהלך עליה לוותר וללכת על ברונטית במקום זה.
אלוהים אדירים, איזו דוגמה סקסיטית. תזכירו לי לספר לכם על משפט החתונה של הול, הוא אפילו יותר גרוע.
חשוב לציין שנאש עשה יותר מאשר להמציא את מושג שיווי המשקל – הוא הוכיח משפט שמכליל את משפט המינימקס, ומראה שבכל משחק (מהסוג שעליו אנו מדברים) קיימת נקודת שיווי משקל נאש אחת לפחות. כמקודם, המשפט נכון רק כאשר מתירים בחירה אקראית של אחת מהאסטרטגיות האפשריות. כאן יכולה להתעורר שאלה טבעית – האם שיווי משקל נאש באמת מהווה הכללה של האסטרטגיות האופטימליות שעליהן דיברנו במשחק סכום אפס? בהמשך נראה בעיה נוספת בתורת המשחקים, "דילמת האסיר", שבה נקודת שיווי המשקל היחידה אינה מניבה לאף אחד מהשחקנים את הרווח הגדול ביותר שהיו יכולים להפיק אם היו משתפים פעולה, כך שהמילה "אופטימלית" לא נראית במקום כאן.
עם זאת, לא קשה לראות כי שיווי המשקל הוא אכן הכללה של המושג הקודם. נניח שיש לנו משחק סכום אפס של שני שחקנים (המשחק שבו עסקו פון נוימן ומורגנשטרן). על פי משפט המינימקס יש לכל אחד מהשחקנים אסטרטגיה אופטימלית, והרווח שהאסטרטגיה של השחקן הראשון מניבה הוא בדיוק ההפסד שהאסטרטגיה של השחקן השני מניבה (זכרו כי זה יכול להיות גם מספר שלילי, כלומר השחקן הראשון מפסיד והשני מרוויח).
הבחירה של כל אחד מהשחקנים באסטרטגיה האופטימלית היא בבירור נקודת שיווי משקל של המשחק: נניח שאני משחק נגד נאש, ונניח כי נאש בחר באסטרטגיה האופטימלית וכך גם אני. על פי משפט המינימקס, הרווח שיש לנאש כרגע הוא הרווח המקסימלי שהוא מסוגל להפיק מהמשחק בלתי תלות באסטרטגיה שלי, כלומר לא משנה מה אעשה, לא ייתכן שהרווח שלו יקטן.
כעת, בחירת האסטרטגיות של שנינו לא תהיה נקודת שיווי משקל רק אם משתלם לי להחליף את האסטרטגיה שלי בהינתן שנאש דבק באסטרטגיה שלו. "משתלם לי" פירושו שאני מרוויח יותר – אבל אני במשחק סכום אפס והרווח הנוכחי שלי הוא בדיוק ההפסד הנוכחי של נאש, ולכן כשהרווח שלי יגדל, הרווח של נאש יקטן, בסתירה למה שאמרתי בפסקה הקודמת. מכאן שאכן זוהי נקודת שיווי משקל.
זה כיוון אחד של ההכללה: הפתרון שמובטח על ידי משפט המינימקס הוא נקודת שיווי משקל. הכיוון השני, להיווכח בכך שנקודת שיווי משקל במשחק סכום-אפס לשני שחקנים היא אופטימלית באופן שעליו דיברנו, הוא קל יותר, וכדאי לחשוב עליו עצמאית כדי לוודא שהמושגים ברורים.
נהניתם? התעניינתם? אם תרצו, אתם מוזמנים לתת טיפ: