פרדוקס המבחן האמריקאי
נתקלתי בדף הפייסבוק של מכון דוידסון בחידה הזו, שכבר ראיתי אינספור גלגולים שלה ברחבי האינטרנט:
החידה מוצגת לפעמים בתור “פרדוקס” למרות שאני חושב שהיא אינה כזו; השם “פרדוקס המבחן האמריקאי” הוא המצאה שלי כדי שתהיה לפוסט כותרת מעניינת.
ובכן, מה התשובה?
מי שרוצה להיות ממש קטנוני כנראה יגיד ש”באופן אקראי” לא מגדיר חד משמעית באיזו הסתברות כל אפשרות נבחרת ולכן אין תשובה, אבל אני לא אוהב את ההתחכמות הזו. מבחינתי, אם אומרים “באופן אקראי” ולא אומרים במפורש מהי האקראיות, הכוונה היא לבחירה בהסתברות אחידה, כלומר יש הסתברות של 25 אחוז לבחור כל אחת מהאפשרויות (יש סיטואציות שבהן בחירה בהסתברות אחידה אינה אפשרית - למשל, “נבחר באקראי מספר טבעי” זה לא משהו שיכולים לעשות בהסתברות אחידה - אבל כל עוד זה אפשרי, אין סיבה לא להניח את זה). אז תחת ההנחה הזו, מה התשובה?
מכיוון שיש סיכוי של 25 אחוז לבחור בתשובה כלשהי, האינטואיציה הראשונית היא כמובן שהתשובה הנכונה היא 25 אחוז - הרי התשובה הראשונה היא אחת מארבע התשובות האפשריות ברשימה, ולכן… אבל אז אנחנו מסתכלים קצת יותר טוב על רשימת התשובות ורואים שמישהו התחכם וש-25 מופיע פעמיים בתור תשובה נכונה. כלומר, ההסתברות לבחור את 25 היא דווקא 50 אחוז. וברשימה יש גם את 50 אחוז, אבל ההסתברות לבחור אותו היא רק 25 אחוז. בקיצור, משהו מבורחש פה. ומבורחש באופן שמתבסס על הפניה עצמית, מה שהופך את החידה לנחמדה.
אבל אני לא חושב שהחידה קשה במיוחד, אם עוצרים לרגע לחשוב באופן הגיוני. יש בסך הכל שלושה ערכים מספריים ברשימה - 25, 50 ו-60. ההסתברות שלנו לבחור בתשובה “25” היא 50 אחוז; ההסתברות לבחור בתשובה “50” היא 25 אחוז; וההסתברות לבחור בתשובה “60” היא 25 אחוז. מכאן שאף אחת מהתשובות הללו לשאלה לא יכולות להיות נכונות. לכן התשובה הנכונה לשאלה “אם תבחרו באופן אקראי תשובה לשאלה הזו מבין ארבע האפשרויות הבאות, מה הסיכויים שתבחרו בתשובה הנכונה” היא 0 אחוז.
עכשיו, בוודאי חלקכם יצעק כעת “אבל 0 בכלל לא נמצא ברשימה! אתה מרמה!”. אבל אני לא מבין למה זו רמאות. יש שאלה - קל לראות שהתשובה לשאלה הזו היא 0. חוץ מזה יש גם רשימת תשובות לשאלה. כולן שגויות. לא ידוע לי על חוק טבע שאומר שאחרי כל שאלה עם רשימת תשובות, אחת התשובות חייבת להיות נכונה. כמובן שרצוי שזה יהיה כך, אבל אין בעיה לרשום שאלות-עם-תשובות שבהן זה לא קורה. למשל:
באיזו שנה פרסם איינשטיין את תורת היחסות הפרטית?
- ב-1543.
- ב-1610.
- ב-1687.
- ב-1864.
כל התאריכים הללו הם כמובן שגויים כי איינשטיין עדיין לא נולד במאוחר שבהם. אז מה, האם יש פרדוקס בשאלה? ברור שלא. סתם רשימת תשובות גרועה (ומה התשובה הנכונה? ב-1905).
זה סוגר מבחינתי את הניסוח של החידה שדוידסון פרסמו. אבל למה לעצור כאן? הרי אפשר להפוך את החידה למעניינת הרבה יותר! בואו ננסח אותה מחדש:
אם תבחרו באופן אקראי תשובה לשאלה הזו מבין ארבע האפשרויות הבאות, מה הסיכויים שתבחרו בתשובה הנכונה?
- 0 אחוז.
- 25 אחוז.
- 25 אחוז.
- 50 אחוז.
אה, ומה קורה עכשיו? הוספתי את 0 לרשימה. האם התשובה הנכונה עדיין תהיה 0 אחוז? כמובן שלא, כי כעת יש הסתברות של 25 אחוז לבחור את 0 מהרשימה, ולכן הפתרון האפשרי הזה נופל כמו שנפלו כל יתר הפתרונות. אם כן, מה התשובה הנכונה לשאלה?
התשובה היא שאין תשובה נכונה לשאלה. לא ברשימה, לא מחוץ לרשימה ולא בשום מקום ביקום.
האם זה “פרדוקס”? שאלה טובה. לדעתי לא. בואו נתבונן בשאלה האמריקאית הבאה:
באיזו שנה פרסם ניוטון את תורת היחסות הפרטית?
- ב-1543.
- ב-1610.
- ב-1687.
- ב-1864.
כמובן שברשימה אין את התשובה הנכונה לשאלה הזו, אבל זה בגלל שאין לשאלה הזו בכלל תשובה. ניוטון פשוט לא פרסם את תורת היחסות הפרטית. כמובן, תוכלו לומר ש”אין תשובה” היא תשובה לגיטימית ולא אתווכח איתכם; אבל אז גם “אין תשובה” היא תשובה לגיטימית לניסוח שלי של פרדוקס המבחן האמריקאי. מה שאני אומר הוא שאין תשובה מספרית, כלומר הסתברות כלשהי שהיא מענה לשאלה “אם תבחרו באופן אקראי תשובה לשאלה הזו מבין ארבע האפשרויות הבאות, מה הסיכויים שתבחרו בתשובה הנכונה?”
אז “פרדוקס” במשמעות החביבה עלי של המילה הזו (סתירה שאנחנו מגיעים אליה מתוך הנחות יסוד שכולן מקובלות עלינו) אין פה. אבל זו עדיין חידה נחמדה, בזכות ההתייחסות העצמית שיש בה.
והאם אפשר להשתגע עוד קצת? כמובן. הנה עוד ניסוח:
אם תבחרו באופן אקראי תשובה לשאלה הזו מבין ארבע האפשרויות הבאות, מה הסיכויים שתבחרו בתשובה הנכונה?
- 25 אחוז.
- 50 אחוז.
- 50 אחוז.
- 60 אחוז.
מה קורה פה? יש שתי תשובות נכונות. מצד אחד, אם “התשובה הנכונה” היא 25 אחוז, אז אכן יש סיכוי של 25 אחוז שנבחר בה; מצד שני, אם “התשובה הנכונה” היא 50 אחוז, אז אכן יש סיכוי של 50 אחוז שנבחר בה (60 אחוז, כרגיל, לא רלוונטי). ושוב, אין כאן פרדוקס או בעיה מתמטית, רק ניסוח כושל של שאלה שיוצר את הרושם שיש רק תשובה נכונה אחת (בגלל היידוע: במקום לומר “בתשובה נכונה” אומרים “בתשובה הנכונה”). הנה איך זה קורה בצורה לא מתמטית:
באיזו שנה פרסם איינשטיין את תורת היחסות?
- ב-1543.
- ב-1610.
- ב-1905.
- ב-1915.
כאן שתי התשובות האחרונות נכונות (יחסות פרטית פורסמה ב-1905 ויחסות כללית פורסמה ב-1915) ולא נראה שיש עם זה בעיה כלשהי, אלא אם מורידים לתלמידים נקודות במבחן על בחירה באחת מהתשובות הנכונות.
השתכנעתם? יפה, אפשר לעצור פה. לא השתכנעתם? אוקיי, בואו נדבר טיפה על איך עושים הסתברות במתמטיקה ואיך ייראה ניתוח הסתברותי של החידה הזו. במובן מסויים אני הולך למחוץ פה יתוש על ידי כך שאשליך עליו פיל, אבל זה פיל שמעניין לראות.
יותר מכל תחום מתמטי אחר, תורת ההסתברות סובלת מהפער שבין ניסוחים מילוליים מעורפלים שנפוצים מאוד בחיי היום יום, והניסוח הפורמליסטי. זו אולי אחת הסיבות לכך שכל כך הרבה “פרדוקסים” מגיעים מתחום ההסתברות; רוב האנשים מסוגלים להבין את הניסוחים המילוליים המעורפלים וחושבים באמצעותם בעצמם על פתרונות לבעיות הסתברותיות, אבל בלי הפורמליזם מאוד קל ללכת לאיבוד ולעבוד על עצמך (הבעיה של מונטי הול היא הדוגמה הקלאסית לכך; חפשו מישהו שטוען שההסתברות היא חצי-חצי והקשיבו להסברים שלו; תקבלו ככל הנראה טיעון מילולי יפה ובנוי היטב, שקורס בגלל שטיעונים מילוליים הם מעורפלים בצורה שמאפשרת להנחות שגויות להסתתר בפנים). כך גם המצב בבעיה הנוכחית. אז אתחיל מלתאר את הפורמליזם המתמטי - תיאור מפורט יותר נמצא בפוסט שמיועד לכך. באופן כללי, כאשר יש לנו סיטואציה הסתברותית כלשהי, כגון הטלת מטבע או בחירה אקראית של אחת מבין ארבע תשובות במבחן אמריקאי, אנחנו מניחים שקיימת קבוצה \( X \) שכוללת את כל התוצאות האפשריות של הסיטואציה ההסתברותית. הרעיון הוא שכל שתי תוצאות אפשריות הן זרות, כלומר לא ייתכן ששתיהן יקרו בו זמנית, ושאחת מהתוצאות האפשריות מתרחשת בודאות. עבור הטלת קוביה, \( X \) תהיה קבוצת המספרים מ-1 עד 6 (כי אנחנו לא מניחים שתוצאה אפשרית היא “קת’ולהו צץ ממעמקי האדמה ובולע את הקוביה”). עבור המבחן האמריקאי שלנו, \( X \) תהיה הקבוצה \( X=\left\{ 1,2,3,4\right\} \) - קבוצת המספרים מ-1 עד 4, שמתארת את מספר התשובה שבחרנו. ה-\( X \) הזה נקרא מרחב המדגם שלנו.
כעת, בנוסף ל-\( X \), יש לנו גם פונקציה \( p:X\to(0,1] \) שמתאימה לכל איבר במרחב המדגם את ההסתברות שהוא יתרחש - הסתברות אצלנו היא מספר ממשי בין 0 ל-1, ואנו מניחים שכל אברי מרחב המדגם הם בעלי הסתברות חיובית (שאין בו איברים “מיותרים”). הדרישה היחידה שלנו מ-\( p \) היא שיתקיים מה שאמרתי קודם - שאחד מאברי \( X \) ייבחר בודאות, מה שאומר שסכום ההסתברויות הכולל של כל התוצאות שווה ל-1: \( \sum_{x\in X}p\left(x\right)=1 \). במקרה של התפלגות אחידה, \( p\left(x\right)=p\left(y\right) \) לכל \( x,y\in X \) ולכן \( p\left(x\right)=\frac{1}{\left|X\right|} \) (בהנחה ש-\( X \) היא קבוצה סופית, כמובן; אני לא אדבר כאן על הסתברות על מרחב מדגם אינסופי, שהיא סבוכה הרבה יותר).
אחרי שיש לנו את \( X \) אפשר לדבר על מאורעות מעל \( X \). פורמלית, מאורע הוא קבוצה של אברי \( X \). מעשית, רוב הדברים שנגיד על סיטואציה הסתברותית כלשהי יהיו בלשון של מאורעות ולא של אברי מרחב המדגם. הנה דוגמה: בהטלת קוביה אחת, “התוצאה היא זוגית” היא מאורע (הקבוצה \( \left\{ 2,4,6\right\} \)). בהטלת שתי קוביות, “יצא 3” הוא מאורע - הקבוצה \( \left\{ \left(1,2\right),\left(2,1\right)\right\} \) שכוללת את שתי הטלות הקוביות האפשריות שנתנו לנו את התוצאה 3.
כאשר \( X \) היא קבוצה סופית אז קבוצת המאורעות היא אוסף כל תתי-הקבוצות של \( X \) (מה שמסומן מבחינה מתמטית ב-\( 2^{X} \)). אם \( X \) אינסופית אז לא בהכרח כל תת-קבוצה של \( X \) יכולה להיחשב מאורע (מסיבות טכניות שלא כאן המקום להיכנס אליהן), ולכן ההגדרה של אוסף המאורעות האפשריים מעל \( X \) הוא חלק מהגדרת המרחב ההסתברותי שלנו, אבל שוב - עבורנו זה לא רלוונטי. אצלנו ההסתברות של מאורע היא פשוטה - סכום ההסתברויות של איבריו. אם \( A\subseteq X \) אז \( p\left(A\right)=\sum_{x\in A}p\left(x\right) \).
אם כן, הסיטואציה ההסתברותית בחידות שלנו היא פשוטה מאוד - \( X=\left\{ 1,2,3,4\right\} \) עם \( p\left(x\right)=\frac{1}{4} \) לכל \( x\in X \). בואו נדבר עכשיו על החידה הראשונה. האפשרויות הן 25 אחוז, 50 אחוז, 60 אחוז ו-25 אחוז. בואו ניתן להם שמות: \( a_{1},a_{2},a_{3},a_{4} \) עם \( a_{1}=a_{4}=\frac{1}{4} \) ו-\( a_{2}=\frac{1}{2} \) ו-\( a_{3}=\frac{3}{5} \).
לב האתגר הוא בעצם להבין איך מנסחים מתמטית את המאורע שמתאר את “אם תבחרו באופן אקראי תשובה לשאלה הזו מבין ארבע האפשרויות הבאות, מה הסיכויים שתבחרו בתשובה הנכונה?”.
המאורע שמעניין אותנו, ואת ההסתברות שלו אנחנו מנסים לחשב, הוא קבוצה \( A\subseteq X \) שמקיימת שההסתברות שלה, מה שאני מסמן \( p\left(A\right) \), שווה לערך של אבריה - מה שדורש, בפרט, שכל אבריה יהיו בעלי אותו ערך. פורמלית: \( A=\left\{ n\in X\ |\ a_{n}=p\left(A\right)\right\} \) (ומכיוון ש-\( p \) מתארת התפלגות אחידה, אפשר גם יותר פשוט: \( A=\left\{ n\in X\ |\ a_{n}=\frac{|A|}{\left|X\right|}\right\} \)).
זו כמובן הגדרה עם הפניה עצמית מובהקת, אבל זה לא אומר שההגדרה אינה חוקית! תחת זאת אפשר לעבור על כל ה-\( A\subseteq X \) האפשריות ולשאול את עצמנו האם הן מקיימות אותה. כבר עשינו את זה קודם באופן לא פורמלי, וזה לא הולך להשתנות גם עכשיו. למשל, עבור \( A=\left\{ 1,4\right\} \) נקבל ש-\( a_{1}=a_{4}=\frac{1}{4} \) אבל \( p\left(A\right)=\frac{1}{2} \) ולכן \( A \) הזו לא מקיימת את ההגדרה. בדומה, עבור \( A=\left\{ 2,3\right\} \) נקבל אמנם ש-\( p\left(A\right)=\frac{1}{2} \) ולכן \( a_{2}=p\left(A\right) \), אבל \( a_{3}\ne p\left(A\right) \) ולכן זה מתקלקל לנו. מי כן עובדת? הקבוצה \( A=\emptyset \) - קבוצה ריקה, שעבורה \( p\left(A\right)=0 \), ולכן לכל \( n \) מתקיים ש-\( a_{n}\ne p\left(A\right) \) ולכן \( A=\left\{ n\in X\ |\ a_{n}=p\left(A\right)\right\} \) אכן מתקיים עבורה.
אם נעבור לניסוח השני של החידה, כלומר נשנה את \( a_{3} \) ל-\( a_{3}=0 \), נקבל שגם \( A=\emptyset \) כבר לא מקיימת את הקריטריון, שכן \( \left\{ n\in X\ |\ a_{n}=p\left(\emptyset\right)\right\} =\left\{ n\in X\ |\ a_{n}=0\right\} =\left\{ a_{3}\right\} \ne\emptyset \). אז מה קורה פה? פשוט מאוד: המשוואה \( A=\left\{ n\in X\ |\ a_{n}=p\left(A\right)\right\} \) אינה נכונה לכל \( A\subseteq X \) ולכן אין תשובה נכונה בניסוח הזה. ובניסוח השלישי? גם \( A=\left\{ 1\right\} \) וגם \( A=\left\{ 2,3\right\} \) מקיימות את המשוואה ולכן שתיהן תשובות נכונות. מבחינה מתמטית כל העניין פשוט ביותר ונטול בעיות. למרות שיש פה הפניה עצמית. לא כל הפניה עצמית גורמת לחורבן המתמטיקה!
אם כן, אין פרדוקס ואין קושי ואין שום דבר מחוכם, אבל לטעמי אלו חידות חביבות מספיק כדי להצדיק מעט מחשבה ואת הפוסט הזה.
נהניתם? התעניינתם? אם תרצו, אתם מוזמנים לתת טיפ: