חישוב קוונטי - עקרון אי הודאות של הייזנברג, פרדוקס EPR ומשפט בל
בפוסט הקודם שלי על חישוב קוונטי הצגתי פרוטוקול קטן וחביב שבאמצעותו אליס ובוב יכולים לעשות מה שנראה כמו “תקשורת מיידית בלי מגבלת מרחק” בעזרת המצב הקוונטי \( \left|00\right\rangle +\left|11\right\rangle \). בפוסט הזה אני רוצה לדבר קצת על ההשלכות הפיזיקליות של התכונות המוזרות של מצבים כמו \( \left|00\right\rangle +\left|11\right\rangle \) - מצבים שנקראים שזורים. מבלי להיכנס להגדרות פורמליות, שני קיוביטים (המרכיבים של המצב הקוונטי \( \left|00\right\rangle +\left|11\right\rangle \)) הם “שזורים” אם יש ביניהם קורלציה כלשהי - או אם תרצו, אם אי אפשר לתאר את המערכות הקוונטיות שלהם באופן בלתי תלוי זו בזו. כפי שנראה, המצבים התמימים הללו אומרים דברים לא טריוויאליים בכלל - במובן מסויים, קיומם מצביע על כך שאנחנו חייבים לוותר על אחד מבין שלושה דברים: או על התקווה שלנו שניתן להיפטר מהאקראיות של תורת הקוונטים באמצעות “משתנים חבויים” (ואסביר מה זה אומר בהמשך); או על מה שנקרא בפיזיקה עקרון המקומיות (וגם אותו אסביר בהמשך), או שנוותר בכלל על ההנחה שהמתמטיקה שלנו מתארת בצורה נכונה את הטבע (במילים אחרות, לוותר על הפיזיקה כולה, אבל על זה לא נדבר בכלל). בניסוח מקוצר, משפט בל אומר שאין בתורת הקוונטים משתנים חבויים מקומיים. אבל כדי להסביר בדיוק מה זה אומר, נצטרך לחזור עוד קצת אחורה, אל שנת 1905.
בשנת 1905 עבד במשרד הפטנטים בברן בחור צעיר, בסך הכל בן 26, אפילו לא דוקטור בפיזיקה עדיין, בשם אלברט איינשטיין. אותו בחור צעיר פרסם באותה השנה ארבעה מאמרים בכתב העת הנחשב ביותר בעולם לפיזיקה. כל אחד מאותם ארבעה מאמרים נחשב כיום לפריצת דרך אדירה בפיזיקה. שניים מהם הציגו את תורת היחסות הפרטית; מאמר אחר הסביר את תופעת התנועה הבראונית והיווה תרומה חשובה למכניקה הסטטיסטית; והרביעי הציע פתרון לבעיית האפקט הפוטואלקטרי, ובכך הניח את הבסיס לתורת הקוונטים. בתודעה הציבורית השם של איינשטיין מתקשר מייד אל תורת היחסות (ואני אנצל את ההזדמנות כדי להזכיר שיש בעצם “שתי” תורות יחסות - פרטית וכללית - והתורה הפרטית משמעותית יותר קלה להבנה מאשר התורה הכללית), אבל את פרס הנובל שהוא קיבל בשנת 1921, איינשטיין קיבל בכלל בזכות ההסבר שלו לאפקט הפוטואלקטרי. כך שאיינשטין נחשב בקרב הפיזיקאים גם לאחד מאבות תורת הקוונטים, ולא רק לממציא תורת היחסות.
רק מה, איינשטיין לא ממש התלהב ממה שתורת הקוונטים הפכה להיות. הבעיה הבסיסית היא שתורת הקוונטים היא “הסתברותית” - כשאנחנו מבצעים מדידה, על פי הפורמליזם המתמטי שכבר ראינו, אנחנו לא יודעים בודאות מה נקבל - יש כמה תוצאות אפשריות ואחת מהן נבחרת באופן אקראי. אנחנו יודעים לכמת את האקראיות הזו בצורה מדוייקת (וכך עשינו בפוסט הקודם) אבל אנחנו לא מסוגלים לומר משהו ודאי.
תחושתו של איינשטיין הייתה שהאקראיות הזו מעידה על כך שתורת הקוונטים אינה שלמה; שתיאור פיזיקלי מלא של העולם לא יכלול אקראיות שכזו. מה שאיינשטיין בעצם אמר הוא זה - המודל המתמטי כולל אקראיות, אבל הוא לא מאמין שגם המציאות כוללת את האקראיות הזו, ולכן במודל המתמטי חסר משהו. בלשון ציורית, איינשטיין אהב לומר ש”אלוהים אינו משחק בקוביות” במובן של “בתיאור שלם של המציאות לא יכלל הרכיב ההסתברותי של תורת הקוונטים”. הציטוט הזה (שהוא חזר עליו בשלל וריאציות) הוא אחד מהמפורסמים ביותר של איינשטיין, עד לרמה שבה אנשים עושים בו שימוש מבדר במיוחד בנסיון להוכיח שאיינשטיין האמין באלוהים (לרוב תוך התעלמות משלל הדברים שאיינשטיין - שהתבטא בערך בכל נושא שהוא ובצורה בהירה למדי - אמר ספציפית בנושא אלוהים).
בשנת 1935 פרסם איינשטיין מאמר עם בוריס פודולסקי ונתן רוזן (המאמר ידוע בתור ה-EPR paper - ראשי התיבות של שמותיהם) שבו הם ניסו להצביע על בעיה קונקרטית בתורת הקוונטים. בתיאורים מדע-פופולריים המאמר לרוב מתואר כטוען את הטענה הבאה: תורת הקוונטים טוענת שאם יש לנו מערכת קוונטית שמורכבת משני חלקים, והחלקים הללו מרוחקים אחד מהשני ואנחנו גורמים לאחד החלקים לקרוס על ידי מדידה, התוצאה של זה תהיה שגם החלק השני יקרוס, כלומר יש “השפעה מיידית מרחוק” של מערכת אחת על השניה - אבל זה סותר את תורת היחסות הפרטית שאוסרת על השפעה מיידית מרחוק שכזו.
זה בערך העניין, אבל רק בערך; במאמר של EPR הטיעונים מנוסחים בצורה שונה לגמרי. כמובן שקטונתי מלהעביר את מלוא הרעיון, אבל אנסה להעביר את רוח הדברים כפי שאני מבין אותם (ובכל מקרה אני ממליץ לסקרנים לקרוא את המאמר עצמו, הוא לא ארוך או קשה במיוחד, אם כי צריך להתרגל לטרמינולוגיה קצת שונה מזו המודרנית).
לפני שנתחיל אני צריך להציג מושג חדש ומרכזי בתורת הקוונטים שלא הזכרתי עד כה - עקרון אי-הודאות של הייזנברג. נתחיל בבדיחה ידועה, שכנראה תהיה ברורה רק למי שכבר מכירים את העקרון: שוטר עוצר את הייזנברג בכביש המהיר וצועק עליו “תגיד לי, יש לך מושג באיזו מהירות אתה נוסע?!”. עונה לו הייזנברג המחייך “לא, אבל אני יודע בדיוק איפה אני נמצא!”
מה אומר הייזנברג? קחו חלקיק. בפיזיקה קלאסית לחלקיק יש מיקום, ויש לו תנע (תנע נקבע על פי מהירות החלקיק והמסה שלו). בפיזיקה קלאסית אנחנו מסוגלים לדעת בו זמנית את שניהם. אבל מה קורה במכניקת הקוואנטים? ובכן, מיקום ותנע הן תכונות שניתן למדוד - קיימים אופרטורי מדידה שצריך להפעיל על המצב הקוונטי של החלקיק כדי למצוא את המיקום ואת התנע. מדידת המיקום תגרום לקריסה של פונקציית הגל של החלקיק למצב בסיס כלשהו שבו נדע בדיוק מה מיקום החלקיק. אבל מה התנע שלו? נוכל למדוד את החלקיק גם עבור תנע, אבל זה יגרום לקריסה נוספת של פונקציית הגל, הפעם אל מצב בסיס של תנע. רק מה, הקריסה הזו “קלקלה” לנו את המיקום של החלקיק - פונקציית הגל של החלקיק כרגע נמצאת במצב שהוא ודאי מבחינת הערך של התנע של החלקיק, אבל לא מבחינת המיקום שלו.
במילים אחרות, יש לנו שתי מדידות שכל אחת מהן “מקלקלת” את השניה. אבל זו לא אשמתם של אמצעי מדידה לא מדויקים; זה פשוט שהחלקיק לא יכול להיות בו זמנית במצב ודאי מבחינת המיקום שלו וגם מבחינת התנע שלו (לפחות - לא יכול להיות מבחינת המודל של תורת הקוונטים - בהמשך נראה שהסיפור מן הסתם מורכב יותר). מכל הדברים בעולם, זה מזכיר לי את ה”התהפכות” של התמונה שלנו במראה שכתבתי עליה פוסט פעם. שם מה שקרה הוא שהתמונה שראינו במראה הייתה “מקולקלת” (הפוכה) באחד מהצירים, ועל ידי מניפולציות יכלנו לשנות את הציר ה”מקולקל” (או אפילו לקלקל את שלושתם ביחד) אבל לא יכלנו להגיע למצב שבו כל הצירים תקינים. אז חשבו על כך שהסופרפוזיציה היא מין מצב כזה שאנחנו יכולים “לתקן” בציר אחד (להקריס אותו למצב שבו יש לנו ודאות לגבי ערך מסויים) אבל המחיר הוא שאנחנו “מקלקלים” ציר אחר, ואי אפשר אף פעם להגיע למצב שבו כל הצירים “תקינים”.
כמובן, הייזנברג לא מסתפק בנפנוף ידיים מילולי; אפשר לכמת את כמות אי הודאות. תחשבו על המיקום ועל התנע בתור משתנים מקריים, שיכולים לקבל ערכים שונים בהסתברויות שונות, ונסמן את סטיות התקן שלהם ב-\( \sigma_{x} \) ו-\( \sigma_{p} \) בהתאמה, אז מתקיים אי השוויון הבא: \( \sigma_{x}\sigma_{p}\ge\frac{\hbar}{2} \) כאשר \( \hbar \) הוא קבוע פלאנק שכבר הזכרתי (חלקי 2 פאי כי ככה נוח לפיזיקאים). כמובן, המתמטיקאי שבי תוהה מה קורה כשאנחנו יודעים בודאות את המיקום ולכן \( \sigma_{x}=0 \); הרעיון הוא, כמובן, שבסיטואציה הזו \( \sigma_{p}=\infty \). אפשר לפרמל את זה, אבל לא אטרח לעשות זאת. אי השוויון יותר מעניין במקרים שבהם אנו מנסים לבצע מדידות שאמורות לתת לנו מידע גם על המיקום וגם על התנע גם יחד - הוא מגביל את היכולת שלנו להיות ודאיים עבור שני הערכים הללו סימולטנית.
האם יש משהו קסום בתנע ובמקום כך שעקרון אי הודאות מתקיים עבורם אבל לא עבור שום דבר אחר? כמובן שלא. יותר טוב לשאול את השאלה ההפוכה - קחו שני גדלים מדידים של מערכת קוונטית כלשהי - מתי הם לא יקיימו אי ודאות? ובכן, בואו נזכר בפורמליזם: גודל מדיד מיוצג על ידי אופרטור לינארי, אז במקרה שלנו האופרטורים ייקראו \( A,B \). הערכים שניתנים למדידה הם הערכים העצמיים של האופרטור, ולאחריהם אנחנו “קורסים” לתוך אחד מהמרחבים העצמיים שלו. רק כשאנחנו נמצאים במצב שהוא וקטור עצמי של האופרטור \( A \) יש לנו ודאות לגבי הערך המדיד של המערכת ש-\( A \) מתאר. לכן, כדי שנוכל להגיע למצב שבו יש לנו ודאות סימולטנית עבור הגדלים ש-\( A,B \) מתארים אנחנו צריכים להיות במצב שהוא וקטור עצמי משותף של \( A,B \).
הסיטואציה הטובה יותר מבחינתנו היא זו שבה קיים למרחב שלנו בסיס של וקטורים עצמיים הן של \( A \) והן של \( B \) (לאו דווקא עם אותם ערכים עצמיים, כמובן). במקרה כזה אומרים ש-\( A,B \) הם לכסינים סימולטנית. הזכרתי את הנושא הזה בבלוג בעבר והוכחתי אז תנאי הכרחי ומספיק לכך ששני אופרטורים יהיו לכסינים סימולטנית: הם צריכים להתחלף בכפל, כלומר שיתקיים \( AB=BA \) (“כפל” כאן הוא הרכבת טרנספורמציות; \( AB \) פירושו “קודם תפעילו את \( B \) ואז תפעילו את \( A \) על התוצאה”). בניסוח אחר - האופרטור \( AB-BA \) הוא אופרטור האפס. עכשיו, האופרטור \( AB-BA \) הוא כל כך חשוב באופן כללי שיש לו שם: הקומוטטור של \( A,B \). במובן מסויים, הקומוטטור מודד “עד כמה” \( A,B \) לא מתחלפים בכפל (כשאם הוא 0 זה המקרה המנוון שבו הם כן). סימון מיוחד לקומוטטור הוא זה: \( \left[A,B\right]=AB-BA \).
ולמה אני מתאר את כל זה? כי הדרך לניסוח הכללי ביותר של עקרון אי הודאות עוברת דרך הקומוטטור. בהינתן אופרטור \( A \) נסמן ב-\( \left\langle A\right\rangle \) את התוחלת שלו (ממוצע משוקלל של הערכים האפשריים שלו כשהמשקלות הם ההסתברויות של אותם ערכים). נסמן ב-\( \sigma_{A}=\sqrt{\left\langle A^{2}\right\rangle -\left\langle A\right\rangle ^{2}} \) את סטיית התקן שלו (זו ההגדרה הסטנדרטית בתורת ההסתברות ולא אסביר אותה כעת), וכעת נוכל לנסח פורמלית את עקרון אי הודאות: \( \left|\left\langle \left[A,B\right]\right\rangle \right|\le\sigma_{A}\sigma_{B} \). כפי שאפשר להבין מהמשוואה, כאשר \( A,B \) מתחלפים והקומוטטור שלהם הוא 0, אז עקרון אי הודאות לא אומר כלום בעצם (כי מכפלת סטיות התקן תמיד תהיה גדולה או שווה ל-0 ולא משנה מה) ולכן המשוואה הזו מכלילה גם את המקרה שבו יש אי ודאות וגם את המקרה שבו אין.
סיימנו עם עקרון אי הודאות ונוכל לעבור לדבר על EPR. המטרה של EPR במאמר שלהם הייתה להראות שאם תורת הקוונטים מהווה תיאור שלם של המציאות, אז היא בהכרח סותרת את עקרון אי הודאות של הייזנברג (ולכן את עצמה). לטעמי האופן שבו הם עושים את זה הוא יפה ומעניין ומאיר עיניים. רק מה, הסיבה שבגללה הוא נכשל בסופו של דבר היא הנחה ש-EPR מניחים כמעט כבדרך אגב.
ובכן, EPR מתחילים בלדבר על מהי תורה פיזיקלית שלמה. הם מצפים מתורה פיזיקלית שלמה שלכל אלמנט של המציאות יהיה בה אלמנט מתאים בתורה המתמטית. מהו “אלמנט של המציאות”? זו שאלה מורכבת מכדי שיענו עליה במאמר קצר ולכן EPR בכלל לא מנסים; הם מסתפקים בלתת תנאי שלדעתם הוא מספיק כדי שמשהו ייחשב אלמנט של המציאות: אם יש לנו מערכת, ויש ערך מספרי כלשהו שמתאר אותה שאנחנו מסוגלים לדעת בודאות מבלי למדוד את המערכת כדי לגלות אותו, אז אותו ערך מספרי מתאים לאלמנט כלשהו של המציאות. תחשבו על כדור תותח שאנחנו יורים בכיוון ובעוצמה שידועים לנו במדוייק, ואנחנו מחכים פרק זמן כלשהו לאחר היריה: נוכל, תוך שימוש בחוקי המכניקה הידועים לנו, לחשב את המיקום של הכדור לאחר שחלף פרק הזמן הזה ולדעת אותו בודאות (לפחות במכניקה הניוטונית!). כלומר, המספר שמציין את המיקום מתאים לאלמנט במציאות שהוא “המיקום של הכדור”. אם המכניקה הניוטונית לא הייתה מתייחסת למיקום של הכדור, היא לא יכלה להיות תורה שלמה של המציאות.
כעת, נניח לרגע שתורת הקוונטים היא תיאור שלם של המציאות. נזכור שבתורה הזו, פונקציית הגל של מערכת כוללת את כל האינפורמציה שאפשר לומר עליה; ועקרון אי הודאות של הייזנברג קובע שאם \( A,B \) הם אופרטורים לא מתחלפים, אז הכמויות המספריות שהם מייצגים לא יכולות להיות קיימות במציאות בו זמנית. לחלקיק לא יכול להיות גם תנע חד משמעי וגם מיקום חד משמעי בו זמנית…
עד כאן, בסדר גמור, היכן ה”פרדוקס”? כאן מגיע הרעיון היפה של EPR. הם אומרים - בואו נסתכל על מערכת קוונטית שזורה. לצורך העניין, ולמרות שזה לא מה ש-EPR אמרו כי הטרמינולוגיה עוד לא הייתה קיימת אז, אפשר לומר שאנחנו מסתכלים על המערכת \( \left|00\right\rangle +\left|11\right\rangle \). אנחנו יודעים שאם נמדוד את אחד מהקיוביטים ביחס, נאמר, לאופרטור \( A \), אז המערכת תקרוס למצב כזה שגם הקיוביט השני יהיה בו. כלומר, המערכת של הקיוביט השני תתואר על ידי פונקציית גל \( \psi_{A} \) כלשהי שממנה ניתן יהיה להסיק בודאות מה יהיה הערך של המדידה ש-\( A \) מייצג. מכיוון שאפשר לדעת את זה מבלי למדוד את הקיוביט השני, זה מתאים לקריטריון של EPR עבור “אלמנט של המציאות”. בדומה, אם נבצע מדידה עבור \( B \) במערכת של הקיוביט הראשון, אז המערכת של הקיוביט השני תתואר על ידי \( \psi_{B} \) שממנה ניתן יהיה להסיק בודאות מה הערך של המדידה ש-\( B \) מייצג.
ועכשיו הפאנץ’: EPR אומרים - בואו נניח שאין אינטראקציה בין שני הקיוביטים. אז המדידה של הקיוביט הראשון לא יכולה להשפיע על הקיוביט השני. זה אומר ש-\( \psi_{A} \) ו-\( \psi_{B} \) אמורות לתאר שתיהן את אותה מציאות. שימו לב להבדל שבין העובדה ש-\( \psi_{A},\psi_{B} \) הם תיאורים מתמטיים שונים ובין זה שהתיאורים השונים הללו אמורים לתאר, בסופו של דבר, את אותה מציאות. כעת, \( A,B \) מקיימים את עקרון אי הודאות של הייזנברג ולכן הגדלים המתאימים להם אינם יכולים להיות במציאות בו זמנית; ומצד שני, זו בדיוק המשמעות של היות \( \psi_{A},\psi_{B} \) שני תיאורים שונים של אותה מערכת; משני התיאורים הללו ניתן לדעת בודאות מה יהיו הגדלים המתאימים למדידה עבור \( A \) ועבור \( B \). קיבלנו סתירה לעקרון אי הודאות של הייזנברג!
המסקנה ש-EPR מסיקים היא פשוטה מאוד - תורת הקוונטים אינה שלמה. הם לא מציעים במפורש פתרון ל”פרדוקס”, אבל הגישה הרווחת אחרי EPR היא שישנם “משתנים חבויים” במציאות שתורת הקוונטים מנסה לתאר: שיש עוד מידע במערכות שלנו שפשוט חומק מהמודל המתמטי של תורת הקוונטים. למשל, ייתכן שכל האספקט ההסתברותי של תורת הקוונטים נובע מכך שחסר לנו מידע שאינו נכלל במודל המתמטי שתורת הקוונטים מספקת, אבל אם רק יהיה לנו את אותו מידע נוסף, המערכת תהפוך לדטרמיניסטית. זה רעיון הגיוני מאוד, וכל עוד ההיכרות שלי עם פיזיקה הסתפקה בספרי מדע פופולרי זה גם בדיוק מה שאני חשבתי.
לכן כל כך מפתיע ומעניין לגלות שזה פשוט לא נכון. או ליתר דיוק - זה לא נכון כל עוד אנחנו מתעקשים על משהו ש-EPR הניחו כמובן מאליו במאמר שלהם - לוקליות.
לוקליות פירושה ששתי מערכות מרוחקות זו מזו אינן יכולות להשפיע אחת על השניה. מתורת היחסות הפרטית עולה ששום דבר בעולם לא נע יותר מהר מהאור, ולכן (נפנוף ידיים) אם נשים מערכות מספיק רחוק זו מזו, ואז נעשה משהו לאחת מהן, אז המידע על הפעולה הזו לא יוכל להגיע מיידית אל המערכת השניה - הזמן שיקח לו “לפעפע” אל המערכת השניה חסום על ידי הזמן שייקח לאור להגיע מהמערכת הראשונה לשניה. זה מאפשר לנו ליצור מערכות שבהן האחת לא משפיעה על השניה (לפחות לא מייד) - ובמאמר שלהם, EPR הניחו קיום של מערכת כזו כמובן מאליו. בפוסט הקודם שלי אני הנחתי בדיוק את ההפך - אליס ובוב היו בשתי קצוות היקום, אליס ביצעה מדידה בקיוביט שלה, וזה איכשהו השפיע על הקיוביט של בוב. אז מי צודק ומי טועה? כאן זו לא שאלה פילוסופית, תודה לאל, אלא שאלה עם תשובה פשוטה מאוד: EPR טעו ותורת הקוונטים צדקה. יש השפעה מיידית מרחוק ואין משתנים חבויים, כל עוד הדרישה שלנו מהמשתנים החבויים הללו היא שהם יצייתו בעצמם לעקרון הלוקליות. לעומת זאת, יש תיאור של תורת הקוונטים עם משתנים חבויים לא לוקליים, אבל לא אכנס אליו בכלל כי מה אני מבין בזה (ובפרט, בהתנגדויות שיש לפיזיקאים למודלים לא לוקליים).
אבל רגע, איך אפשר לדעת מי צודק ומי טועה? כאן נכנס לתמונה הגיבור השלישי שלנו בפוסט - הפיזיקאי ג’ון סטיוארט בל. בשנת 1964 פרסם בל מאמר קצר שבו הוא הראה תוצאה מבריקה לחלוטין: שאפשר לבנות ניסוי סטטיסטי שבו תורת הקוונטים נותנת תוצאה אחת, אבל תורת-הקוונטים-עם-משתנים-חבויים נותנת תוצאה אחרת. הניסוי אכן בוצע, פעמים רבות, והתוצאות הן חד משמעיות בעד תורת הקוונטים ונגד משתנים חבויים מקומיים. הניסוי מאוד דומה באופיו ל”משחק” שעשינו בפוסט הקודם - אפשר להראות שבתורת הקוונטים עם משתנים חבויים מקומיים יש חסם עליון כלשהו על ערך מסויים שקשור אליו (זה מה שנקרא “אי-שוויון בל”) אבל על פי תורת הקוונטים הרגילה אפשר לעבור את החסם הזה - והמדידות בפועל אכן מצביעות על שבירת החסם הזה. עכשיו, בואו ניכנס לפרטים.
אני לא אכנס לפורמליזם עד הסוף, אבל הרעיון ב”משתנה חבוי לוקלי” הוא שבהינתן מצב קוונטי של מערכת, אין לנו את כל המידע עליה, והמידע הזה נמצא במשתנה (או קבוצת משתנים, או משתנים שהם פונקציות - הבנתם את הרעיון) שממנה ניתן להסיק דטרמיניסטית איך המערכת תגיב למדידות. חשבו למשל על כך שהמערכת \( \left|00\right\rangle +\left|11\right\rangle \) מגיעה עם משתנה חבוי \( \lambda \) בתחום \( \left[0,1\right] \). כשאנו מבצעים מדידה, מה שקורה למעשה הוא שנקבל את התוצאה 0 אם \( 0\le\lambda\le\frac{1}{2} \) ואת התוצאה 1 אחרת. אם כשמערכת כמו \( \left|00\right\rangle +\left|11\right\rangle \) נוצרת, הערך של \( \lambda \) נוצר באקראי ובהתפלגות אחידה מתוך התחום \( \left[0,1\right] \), האפקט שנקבל הוא שקריסה ל-0 וקריסה ל-1 נראות כאילו הן מתרחשות בהסתברות זהה, אבל למעשה ההגרלה ה”אמיתית” היא לא בזמן המדידה אלא פשוט תלויה בתכונה דטרמיניסטית של המערכת שמתפלגת באופן סטטיסטי.
בואו נעבור לתיאור ניסוי בל כלשהו. לא בדיוק מה שבל תיאר במאמר, אבל גרסה דומה שקצת יותר נוחה לנו. הרעיון הוא פשוט: שוב יש לנו את אליס ובוב, ושוב הם מרוחקים זה מזו מאוד, ושוב כל אחד מהם מקבל לידיו חלקיק. החלקיקים נוצרו בדרך כלשהי עם תכונות כלשהן על ידי גורם מרכזי כלשהו, נקרא לו אוסקר. חלק מהעניין הוא שלא חשוב לנו באיזו דרך הם בדיוק נוצרו, כפי שנראה בחשבון המתמטי.
אליס מקבלת חלקיק אחד, מגרילה ביט ובוחרת לפי הערך שקיבלה מדידה אחת משתיים אפשריות שאפשר להפעיל על החלקיק. נקרא לתוצאת המדידה מהסוג הראשון \( A \) ולתוצאת המדידה מהסוג השני \( B \). ההנחה שלנו היא ש-\( A,B\in\left\{ -1,1\right\} \), כלומר התוצאות האפשריות של המדידה הן או 1 או מינוס 1. בוב עושה אותו סיפור עם החלקיק שלו, לתוצאות המדידה שלו אקרא \( X,Y \) וגם הן בקבוצה \( \left\{ -1,1\right\} \).
עכשיו, נניח שאנחנו בעולם עם משתנים חבויים מקומיים. אז יש משתנה \( \lambda \) (שכזכור, יכול לייצג גם קבוצת משתנים או משהו מורכב יותר) שתוצאות המדידה הן פונקציה דטרמיניסטית שלו. הדבר ההסתברותי היחיד בכל הסיפור הוא שלב יצירת הפרמטר \( \lambda \) על ידי אוסקר. מרגע זה, הערכים של \( A,B,X,Y \) כבר נקבעו. פורמלית, הם משתנים מקריים שנגזרים ממרחב הסתברות שבו \( \lambda \) מייצג את הניסויים הבסיסיים. אם אתם לא מכירים את המושג (וכדאי להכיר), יש לי פוסט על זה. שימו לב להנחה מרכזית כאן - מכיוון שאנחנו מניחים שהמשתנים החבויים הם מקומיים, אנחנו מניחים שהמדידה שאליס מבצעת לא יכולה להשפיע על המדידה שבוב מבצע, ולהפך.
מה שאנחנו רוצים לחשב הוא את התוחלת של ביטוי שנראה קצת מסורבל לעין במבט ראשון (אבל נבחר בגלל שהוא עובד). הביטוי הזה מאפשר לא רק לערכים של \( A,B,X,Y \) לבוא לידי ביטוי אלא גם לקורלציה ביניהם. והנה הוא:
\( AX+BX+BY-AY \)
או במילים אחרות, אחרי פישוט,
\( \left(B+A\right)X+\left(B-A\right)Y \)
עכשיו, הטענה שלי היא שהביטוי הזה הוא תמיד או 2 או \( -2 \). למה? ובכן, בואו נניח ש-\( A,B,X,Y \) קיבלו ערכים קונקרטיים (פורמלית הייתי צריך לכתוב \( A=a \) וכאלה, אבל אתם מבינים גם ככה). תזכרו שכל הערכים הללו הם או 1 או \( -1 \). אם \( A,B \) קיבלו ערכים שונים אז \( B+A=0 \) בהכרח, בעוד ש-\( B-A \) הוא או 2 או \( -2 \). הביטוי \( \left(B+A\right)X \) ייעלם, אם כן, ואילו \( \left(B-A\right)Y \) שווה ל-2 או מינוס 2 שמוכפל ב-1 או במינוס 1 - כלומר, נקבל \( 2 \) או \( -2 \). באופן דומה, אם \( A=B \) אז \( B+A \) הוא 2 או \( -2 \), בזמן ש-\( B-A=0 \) ושוב נקבל שערך הביטוי כולו הוא 2 או \( -2 \).
זה אומר שהתוחלת של הביטוי כולו חסומה על ידי 2: \( \mbox{E}\left[AX+BX+BY-AY\right]\le2 \). למי שרוצה לראות את זה פורמלית, פשוט צריך להיזכר בהגדרת התוחלת: \( \mbox{E}\left[Z\right]=\sum z\cdot\mbox{P}\left(Z=z\right) \) - כלומר, תוחלת של משתנה מקרי היא סכום של הערכים שהוא יכול לקבל כפול הההסתברות שהוא יקבל אותם. כאן \( Z=AX+BX+BY-AY \) והוא יכול לקבל רק שני ערכים. כלומר, \( \mbox{E}\left[Z\right]=2\mbox{P}\left(Z=2\right)-2\mbox{P}\left(Z=-2\right)\le2 \).
עכשיו, תוחלת מקיימת תכונה נפלאה שנקראת לינאריות. במקרה שלנו זה אומר שמתקיים:
\( \mbox{E}\left[AX+BX+BY-AY\right]=\mbox{E}\left[AX\right]+\mbox{E}\left[BX\right]+\mbox{E}\left[BY\right]-\mbox{E}\left[AY\right] \)
למה זה נפלא? כי את אגף ימין של הביטוי אנחנו יכולים לחשב בניסוי. את \( AX+BX+BY-AY \) אנחנו לא יכולים לחשב בניסוי, כי בשביל לחשב את הביטוי כולו נצטרך לדעת, למשל, גם את \( A \) וגם את \( B \), אבל אנחנו יכולים לחשב רק אחד מהם - לא מובטח לנו שאחרי מדידה של אחד מהם לא נקלקל את המערכת והערך של \( B \) שנקבל לא יהיה הערך שמחושב מ-\( \lambda \) אלא ערך שמושפע מהמדידה של \( A \).
אבל בביטוי באגף ימין אנחנו יכולים לטפל זוג-זוג בנפרד. איך? פשוט מאוד. למשל, כדי לחשב את \( \mbox{E}\left[AX\right] \) אליס ובוב ישוו תוצאות מכל הניסויים שבהם הם מדדו את \( A \) ואת \( X \) (רבע מהם). הם יכפילו את הערכים של \( A,X \), יספרו כמה פעמים קיבלו 1 וכמה פעמים קיבלו \( -1 \), יעריכו מזה את ההסתברות לקבלת הערכים הללו ויחשבו את התוחלת לפי הנוסחה. שמתם לב להנחה שלנו פה, שבכלל אפשר לחשב תוחלת על ידי מדידה בפועל? מעין הנחה שחוק המספרים הגדולים “עובד”? זו לא הנחה טריוויאלית כלל, ואחת הדרכים להיפטר מהתוצאה של בל היא להגיד שדווקא ההנחה הזו שגויה; אבל מבין כל האפשרויות, זו נראית הכי פחות סבירה, בהתבסס על הנסיון שלנו עם תורת ההסתברות ויכולת התיאור שלה את המציאות.
אם כן, אפשר לבצע את החישוב בפועל. וכשמבצעים את החישוב בפועל עבור מערכת ספציפית שתכף אתאר מגלים, למרבה ההפתעה, ש-\( \mbox{E}\left[AX\right]+\mbox{E}\left[BX\right]+\mbox{E}\left[BY\right]-\mbox{E}\left[AY\right] \) יוצא \( 2\sqrt{2} \), כלומר מפר את החסם המתמטי שהוא אמור לקיים. מה קורה פה? קיבלנו סתירה במתמטיקה? מה השתבש?
ובכן, לא, לא קיבלנו סתירה במתמטיקה - המודל המתמטי של תורת הקוונטים דווקא חוזה את תוצאת ה-\( 2\sqrt{2} \) עבור המערכת הספציפית המדוברת. בואו נבין איך, ולמה החישוב שביצעתי קודם והניב את החסם של 2 לא רלוונטי עבור המערכת הזו.
המערכת שבה נבצע את הניסוי תהיה בנויה באופן הבא: אוסקר מייצר זוג קיוביטים שזורים במצב הקוונטי \( \frac{\left|01\right\rangle -\left|10\right\rangle }{\sqrt{2}} \). כאן הקורלציה בין הקיוביטים היא הפוכה - אם המערכת קורסת למצב \( \left|01\right\rangle \) זה אומר שהקיוביטים נמצאים במצבים שונים. רק שאליס ובוב לא הולכים למדוד את הקיוביטים שלהם ביחס לבסיסים הרגילים, אלא עם אופרטורי מדידה קצת יותר מתוחכמים. הזכרתי בפוסט קודם בחטף את מטריצות פאולי, והנה אזכיר אותן שוב:
\( \sigma_{x}=\left[\begin{array}{cc}0 & 1\\1 & 0\end{array}\right],\sigma_{y}=\left[\begin{array}{cc}0 & -i\\i & 0\end{array}\right],\sigma_{z}=\left[\begin{array}{cc}1 & 0\\0 & -1\end{array}\right] \)
המטריצות הללו מגדירות אופרטורי מדידה. בואו ניזכר מה זה אומר. נניח שאנחנו מודדים את המצב \( \frac{\left|01\right\rangle -\left|10\right\rangle }{\sqrt{2}} \) ביחס לאופרטור \( \sigma_{z} \) (או, אם להיות מדוייקים, ביחס לאופרטור \( \sigma_{z}\otimes I \), כלומר אנחנו מודדים רק את הקיוביט של אליס). הוקטורים העצמיים של האופרטור הזה הם \( \left|0\right\rangle \) ו-\( \left|1\right\rangle \) ולכן קל לראות שבהסתברות \( \frac{1}{2} \) אנו קורסים אל \( \left|01\right\rangle \) ומודדים את הערך 1, ובהסתברות \( \frac{1}{2} \) אנו קורסים אל \( \left|10\right\rangle \) ומודדים את הערך \( -1 \) (זכרו: הערך העצמי של האופרטור שאל המרחב שלו קרסנו הוא תוצאת המדידה שאנחנו מקבלים).
עכשיו בואו נעשה משהו יותר מעניין. בואו נסתכל על אופרטור מדידה שמורכב מתוך האופרטורים שכבר ראינו, ספציפית זה: \( -\frac{\sigma_{z}+\sigma_{x}}{\sqrt{2}} \). המטריצה של האופרטור הזה היא \( -\frac{1}{\sqrt{2}}\left[\begin{array}{cc}1 & 1\\1 & -1\end{array}\right] \). למצוא לה ערכים ווקטורים עצמיים זה חישוב סטנדרטי (אם כי לא כיפי יותר מדי) של אלגברה לינארית: מקבלים שהערכים העצמיים הם \( 1 \) ו-\( -1 \), כצפוי (הרי אני רוצה להשתמש פה באופרטורים שאלו הערכים הנצפים שלהם, וה-\( \frac{1}{\sqrt{2}} \) נועד בדיוק לשם כך) אבל הוקטורים העצמיים הם פחות סטנדרטיים מאשר קודם: \( \left[\begin{array}{c}1-\sqrt{2}\\1\end{array}\right] \) הוא הוקטור העצמי של הערך העצמי 1, ואילו \( \left[\begin{array}{c}1+\sqrt{2}\\1\end{array}\right] \) הוא הוקטור העצמי של \( -1 \). נסו ותיווכחו בעצמכם. בכתיב קוונטי הוקטורים העצמיים הם \( \left(1-\sqrt{2}\right)\left|0\right\rangle+\left|1\right\rangle \) ו-\( \left(1+\sqrt{2}\right)\left|0\right\rangle +\left|1\right\rangle \). שימו לב שזה כתיב לא מנורמל. הנורמה בריבוע של הוקטור העצמי הראשון היא \( \left(1-\sqrt{2}\right)^{2}+1^{2}=4-2\sqrt{2} \) ושל השני היא \( 4+2\sqrt{2} \), וצריך לחלק בשורש של זה כשמבצעים את המדידות.
עכשיו נניח שאנחנו משתמשים באופרטור הזה בתור אופרטור המדידה של בוב, ומבצעים את המדידה שלו על תוצאת המדידה של אליס. מה נקבל? ובכן: אם קרסנו למצב \( \left|01\right\rangle \) אז מה שרלוונטי לנו הוא המצב \( \left|1\right\rangle \) של הקיוביט של בוב. ההסתברות לקרוס למצב שמיוצג על ידי וקטור עצמי היא ריבוע הערך המוחלט של המקדם של \( \left|1\right\rangle \) בוקטור העצמי, כלומר הסתברות של \( \frac{1}{4-2\sqrt{2}} \) שהמדידה תחזיר ערך 1 והסתברות \( \frac{1}{4+2\sqrt{2}} \) שהמדידה תחזיר \( -1 \) (בדקו שסכום ההסתברויות הזה הוא 1!).
אם המדידה של אליס גרמה לקריסה אל \( \left|0\right\rangle \), מה קורה? ובכן, כמעט אותו דבר. אם תבדקו תראו שההסתברות שהמדידה תחזיר 1 היא \( \frac{\left(1-\sqrt{2}\right)^{2}}{4-2\sqrt{2}} \) ושהיא תחזיר \( -1 \) היא \( \frac{\left(1+\sqrt{2}\right)^{2}}{4+2\sqrt{2}} \). מספרים לא כיפיים. האם זה הולך לאנשהו?
ובכן, בואו ננסה לסכם מהן התוצאות האפשריות של המדידות:
אליס מקבלת 1 ובוב מקבל 1 בהסתברות \( \frac{1}{2}\cdot\frac{1}{4-2\sqrt{2}} \)
אליס מקבלת \( -1 \) ובוב מקבל 1 בהסתברות \( \frac{1}{2}\cdot\frac{\left(1-\sqrt{2}\right)^{2}}{4-2\sqrt{2}} \)
אליס מקבלת 1 ובוב מקבל \( -1 \) בהסתברות \( \frac{1}{2}\cdot\frac{1}{4+2\sqrt{2}} \)
אליס מקבלת \( -1 \) ובוב מקבל \( -1 \) בהסתברות \( \frac{1}{2}\cdot\frac{\left(1+\sqrt{2}\right)^{2}}{4+2\sqrt{2}} \)
עכשיו, אם עוד לא איבדתם אותי או שאתם מציצים אחורה, בוודאי תבינו שמה שאני מעוניין בו הוא לא תוצאות המדידה של אליס ובוב לחוד אלא במכפלה של הערכים שהם קיבלו. כאן יש רק שתי תוצאות אפשריות:
המכפלה היא 1 בהסתברות \( \frac{1}{2}\left(\frac{1}{4-2\sqrt{2}}+\frac{\left(1+\sqrt{2}\right)^{2}}{4+2\sqrt{2}}\right) \)
המכפלה היא \( -1 \) בהסתברות \( \frac{1}{2}\left(\frac{1}{4+2\sqrt{2}}+\frac{\left(1-\sqrt{2}\right)^{2}}{4-2\sqrt{2}}\right) \)
ועכשיו קל לחשב את תוחלת המכפלה: היא ההסתברות של 1 פחות ההסתברות של \( -1 \) (בעצם כפלנו את ההסתברות הראשונה ב-1 ואת השניה ב-\( -1 \)):
\( \frac{1}{2}\left(\frac{1}{4-2\sqrt{2}}+\frac{\left(1+\sqrt{2}\right)^{2}}{4+2\sqrt{2}}-\frac{1}{4+2\sqrt{2}}-\frac{\left(1-\sqrt{2}\right)^{2}}{4-2\sqrt{2}}\right)=\frac{1}{\sqrt{2}} \)
עשיתי את כל החישוב המזעזע הזה ידנית כדי שנראה שזה לא כזה נורא, אבל אני לא מתכנן לחזור עליו שוב, לכן אני יכול להסתפק בלהסביר עכשיו מה בדיוק עושים בניסוי בל. כזכור, בל אומר להגדיר ארבעה אופרטורים \( A,B,X,Y \) ולחשב את \( \mbox{E}\left[AX\right]+\mbox{E}\left[BX\right]+\mbox{E}\left[BY\right]-\mbox{E}\left[AY\right] \). אצלנו האופרטורים הללו יהיו:
\( A=\sigma_{z} \)
\( B=\sigma_{x} \)
\( X=-\frac{\sigma_{z}+\sigma_{x}}{\sqrt{2}} \)
\( Y=\frac{\sigma_{z}-\sigma_{x}}{\sqrt{2}} \)
מה שהוכחנו עד כה היה בעצם ש-\( \mbox{E}\left[AX\right]=\frac{1}{\sqrt{2}} \). עכשיו, סימון מקובל בתורת הקוונטים לתוחלת הוא \( \left\langle AX\right\rangle \) ולכן זה הסימון שבו אשתמש. מבלי לבצע את יתר החישובים אני אטען שמתקיים:
\( \left\langle AX\right\rangle =\frac{1}{\sqrt{2}} \)
\( \left\langle BX\right\rangle =\frac{1}{\sqrt{2}} \)
\( \left\langle BY\right\rangle =\frac{1}{\sqrt{2}} \)
\( \left\langle AY\right\rangle =-\frac{1}{\sqrt{2}} \)
מה שאומר ש-\( \left\langle AX\right\rangle +\left\langle BX\right\rangle +\left\langle BY\right\rangle -\left\langle AY\right\rangle =2\sqrt{2} \), וזה מפר את החסם של אי שוויון בל!
כאמור, התוצאה המוזרה הזו היא אכן מה שמתקבל בניסויים - ועכשיו אנחנו רואים שהפורמליזם המתמטי של תורת הקוונטים מסכים עם הניסויים. זו דוגמה מוחצת לאופן שבו תורת הקוונטים “מנצחת” את האינטואיציה היומיומית שלנו; כמובן שיש אינספור אחרות.
ייתכן שכבר איבדתם אותי לגמרי ולכן בואו נעשה סיכום קצר. יצאנו מנקודת הנחה שיש לתורת הקוונטים תיאור שלם יותר עם משתנים חבויים מקומיים. זה איפשר לנו לבצע חישוב הסתברותי עבור התוחלת של הביטוי \( AX+BX+BY-AY \) שמייצג תוצאות של ניסוי מסויים. החישוב הוכיח מתמטית שהתוחלת לא עולה על \( 2 \), אבל אחר כך ניתחנו את התוחלת עבור ניסוי קונקרטי תוך שימוש במודל הרגיל של תורת הקוונטים וקיבלנו \( 2\sqrt{2} \), מה שמפר את התוצאה המתמטית הקודמת. זה אומר שאנחנו חייבים לוותר על משתנים חבויים מקומיים, או לוותר על משהו מהאופן שבו אנו מניחים שהמתמטיקה “עובדת” או “מתארת את המציאות”.
אם אנחנו מוותרים על המשתנים החבויים לגמרי, אז כבר לא ניתן לדבר על הביטוי \( AX+BX+BY-AY \) בכלל כי הוא לא מוגדר היטב - הוא מניח שלניסוי \( A \) ולניסוי \( B \) יש בו זמנית ערכים, ואליס פשוט לא יודעת את שניהם בו זמנית כי היא מודדת רק אחד מהם. על פי המודל הרגיל של תורת הקוונטים שאיתו אנו עובדים, זה פשוט לא נכון - ייתכן מאוד שהמצב הקוונטי של המערכת שלנו הוא כזה שבו יש ערך מוחלט לאחד הניסויים, אבל לא לניסוי השני.
עם זאת, במקום לוותר על משתנים חבויים לגמרי אפשר לוותר רק על דרישת המקומיות - כלומר, שמערכות נפרדות לא ישפיעו זו על זו; ובניסוי שלנו, שהמדידה שאליס מבצעת לא תשפיע על המדידה שבוב מבצע. אם המדידה של אליס כן משפיעה, אז הביטוי \( AX+BX+BY-AY \) שחסמנו לא באמת מתאר את הערכים שיתקבלו בתהליך המדידה - למשל, יש שם \( AX \) אבל מה שצריך להיות שם הוא \( AX^{\prime} \) כאשר \( X^{\prime} \) הוא “הערך של המדידה \( X \) שבוב מבצע אחרי שהוא השתנה כתוצאה מהמדידה של אליס”. גם זה מפיל את אי-שוויון בל ו”מציל” אותנו מסתירה. כפי שכבר אמרתי קודם, קיימות תיאוריות של משתנים חבויים לא מקומיים, אבל אני לא מבין בהן כלום ולא אתאר אותן יותר בפירוט.
נהניתם? התעניינתם? אם תרצו, אתם מוזמנים לתת טיפ: