ילדים (הסתברותיים) זה שמחה

תורת ההסתברות היא כר פורה לחידות שונות ומשונות שמעוררות ויכוחים מזוויעים, גם בקרב מתמטיקאים, מהטעם הפשוט שקיים פער גדול בין ניסוחים מתמטיים-פורמליים של בעיות, ובין ניסוחים מילוליים שלהם. הרבה פעמים המודל המילולי פשוט אינו מוגדר היטב וניתן למספר ניסוחים מתמטיים שונים ולא שקולים, והשאלה באיזה ניסוח מתמטי יש לבחור הופכת ל”פילוסופית” - ופילוסופיה (בפרט כשהיא נוחתת על מתמטיקאים) גורמת תמיד לויכוחים מזוויעים.

במקור נתקלתי בבעיה הזו כאשר באחת התגובות בבלוג קישרו לאתר שהציג אותה. באתר התפתח ויכוח ארוך כאורך הגלות שלא קראתי את כולו. אני צידדתי בפתרון שבאתר, ולא חשבתי עוד על השאלה עד שנתקלתי בה שוב לפני מספר ימים, הגעתי למסקנה שאפשר לכתוב עליה פוסט קצר ונחמד בבלוג, והתחלתי לכתוב. באמצע שמתי לב לכך שכל מה שחשבתי לא נכון, ושיש לחידה הזו עוקץ בעייתי יותר משנדמה. אם כן, נעבור לאקשן.

החידה הולכת כך: לחברכם הטוב יש שני ילדים, אך אין לכם שמץ של מושג מה מינם. אתם באים לביתו ודופקים על הדלת. את הדלת פותחת בת. מה ההסתברות שהילד השני הוא בן? באתר שקישרתי אליו לא הולכים לבית ודופקים על דלת אלא החבר עצמו מספר שאחד מילדיו הוא בת.

כמובן שיש בחידה הזו נתון מובלע - אנחנו מניחים שכאשר ילד נולד, בהסתברות $latex \frac{1}{2}$ הוא יהיה בן, ובהסתברות $latex \frac{1}{2}$ הוא יהיה בת. האינטואיציה שלנו אומרת לנו שאין תלות בין הלידה של הילד שפתח לנו את הילד והלידה של הילד השני - ולכן ההסתברות שהילד השני יהיה בת היא $latex \frac{1}{2}$. זה נשמע הגיוני, אלא שאז באים המתמטיקאים (והאתר) וטוענים שההסתברות היא בכלל $latex \frac{2}{3}$. איך זה ייתכן?

ובכן, הנימוק המתמטי ה”יבש” הוא זה: אפשר לחשוב על הרכב הילדים במשפחת החבר כאיבר במרחב הסתברותי שמכיל בסך הכל ארבעה איברים: $latex \left\{ GG,GB,BG,BB\right\} $, כש-$latex BG$ אומר “בן בכור, בת צעירה”, $latex GB$ אומר “בת בכורה, בן צעיר” וכדומה. מה ההסתברות לקבלת כל איבר במרחב? בדיוק $latex \frac{1}{4}$; למשל, ההסתברות של $latex GB$ היא מכפלת ההסתברויות של “הילד הראשון יהיה בת” ($latex \frac{1}{2}$) ושל “הילד השני יהיה בן” (גם כן $latex \frac{1}{2}$). אנו כופלים את ההסתברויות שכן מאורעות אלו הם בלתי תלויים (כפי שכבר אמרתי - מינו של אחד הילדים לא משפיע על מינו של השני).

כעת, השאלה שלנו היא “בהינתן שידוע שאחד מהילדים היא בת, מה ההסתברות שהילד השני הוא בן”? וזוהי שאלה קלאסית בהסתברות מותנית. אם נסמן ב-$latex A$ את המאורע “יש בן במשפחה” וב-$latex B$ את המאורע “יש בת במשפחה” אז ההסתברות של $latex A$ בהינתן ש-$latex B$ נכון נתונה על ידי $latex \frac{P\left(A\cap B\right)}{P\left(B\right)}$. ההסתברות $latex P\left(A\cap B\right)$ היא בעצם ההסתברות של אחד משני האיברים $latex GB,BG$, כלומר $latex \frac{1}{2}$; וההסתברות $latex P\left(B\right)$ היא ההסתברות של אחד משלושת האיברים $latex GB,BG,GG$ (כל איבר פרט לזה שמייצג את “יש רק בנים במשפחה”), כלומר $latex \frac{3}{4}$. לכן סה”כ מקבלים הסתברות של $latex \frac{1/2}{3/4}=\frac{2}{3}$, וסיימנו. או שלא?

בואו ננסה להבין שוב מה הלך כאן כרגע. אמרתי “בהתחלה היו ארבע אפשרויות להרכב המשפחה. אפשרות אחת נפלה, כי אנחנו יודעים שיש בת במשפחה, ולכן כל אחת משלוש האפשרויות הנותרות סבירה באותה מידה, ובשתיים מהן יש בן במשפחה, אז הסיכוי לבן הוא $latex \frac{2}{3}$”. לא יודע מה אתכם, אבל לי זה נשמע משכנע בהחלט. רק חבל שזה לא נכון.

הסיבה שזה לא נכון היא שיש נתון נוסף מאחורי הקלעים, שעד כה התייחסנו אליו באופן מאוד מאוד מובלע. הנתון הזה הוא השאלה “איך נבחר מי שיפתח את הדלת?” (או לחילופין, השאלה “איך החבר שמספר לך על הילדים בוחר על מי ומה לספר?”). כדי לראות שהשאלה הזו היא קריטית, הבה נבחן כמה סיטואציות אפשריות. אם, למשל, הבית שוביניסטי ויש בו חוק לפיו אם דופקים בדלת, אז בן זכר חייב לפתוח אלא אם אין בנים כאלו, אז אם בת פתחה לנו את הדלת ההסתברות שהילד השני הוא בן היא אפס, שהרי אם הוא היה בן, זה הוא שהיה פותח לנו את הדלת. הסתברות $latex 0$, ולא $latex \frac{2}{3}$; כבר אנחנו רואים שיש כאן בעיה.

אם, לעומת זאת, החוק היה “הילד הבכור תמיד פותח את הדלת”, ההסתברות הייתה בבירור $latex \frac{1}{2}$, כי המין של הילד הבכור אינו תלוי במין של הילד הצעיר. פורמלית, המאורע “הבן הבכור שפתח את הדלת הוא זכר” מורכב מהאיברים $latex BG,BB$, והמאורע “הבן הבכור שפתח את הדלת הוא זכר והילד הנוסף הוא בת” מורכב מהאיבר הבודד $latex BG$, כך שההסתברות המותנית היא חצי, גם מבחינה מתמטית מדוייקת.

אם כן, היה לנו אפס והיה לנו חצי. לאן נעלם השני-שליש? אה, הוא חוזר אם אנחנו מניחים שהבית הוא פמיניסטי ואם יש בת, היא זו שפותחת את הדלת. במקרה זה, המאורע “בת פתחה את הדלת” מורכב מהאיברים $latex GB,BG,GG$ (כל האפשרויות פרט ל”יש רק בנים במשפחה”), וכאן שני שליש מהמאורעות אכן מייצגים משפחות עם בן, ולכן מקבלים הסתברות של $latex \frac{2}{3}$.

בקצרה, ההסתברות שמקבלים תלויה באופן קריטי בבחירה מסויימת שמתרחשת מאחורי הקלעים. אבל אף אחת משיטות הבחירה שהצגתי אינה “טבעית”; מה קורה אם שיטת הבחירה היא הפשוטה ביותר שניתן להעלות על הדעת בהקשר הזה, ולכן גם זו שכנראה רוב האנשים מניחים באופן בלתי מודע - ילד שנבחר באקראי משני הילדים פותח את הדלת? במקרה הזה עלינו להרחיב קצת את מרחב ההסתברות שלנו, כי מבוצעת בו שתי הגרלות - גם מגרילים את הרכב המשפחה, וגם מגרילים איזה ילד יפתח את הדלת. הדבר קצת דומה למה שקרה בוריאציה שהצגתי על בעית מונטי הול, זו שעסקה באסירים שעומדים להיות מוצאים להורג - גם שם, האופן שבו השומר בחר לספר דברים לאסירים השפיע על ההסתברות המותנית שלהם להיתלות.

אם כן, מרחב ההסתברות שהצגתי קודם היה טיפה “מזוייף”. מרחב יותר מדוייק יכיל זוגות מהצורה $latex \left(BB,1\right)$ וכדומה, כשהמספר אומר מהו מספרו של הילד שפתח לנו את הדלת. במרחב הזה יש שמונה איברים (אילו?) שכולם שווי הסתברות. כעת, המאורע של “בת פתחה לנו את הדלת” הוא הקבוצה $latex \left\{ \left(GG,1\right),\left(GG,2\right),\left(GB,1\right),\left(BG,2\right)\right\} $. המאורע של “בת פתחה את הדלת וגם הילד השני הוא בן” הוא הקבוצה $latex \left\{ \left(GB,1\right),\left(BG,2\right)\right\} $. כלומר, ההסתברות היא $latex \frac{1}{2}$, כמו שהאינטואיציה אומרת. זו הבעיה המרכזית בחידה הזו - הניתוח המתמטי הפשטני (זה שפשוט חוטף את המאורע $latex \left\{ GB,BG,GG\right\} $ ללא הצדקה) נותן תוצאה שונה מהאינטואיציה ולכן החידה מקבלת הילה מונטי-הולית סביבה. יש כאן לקח טוב - אם כבר מנסים ללכת באופן מתמטי ומדויק, צריך ללכת עם זה עד הסוף ולא להשאיר אף הנחה קבורה מתחת לפני השטח.


נהניתם? התעניינתם? אם תרצו, אתם מוזמנים לתת טיפ:

Buy Me a Coffee at ko-fi.com