מטריצות צמודות, הרמיטיות, אוניטריות

אולי התוצאה המעניינת ביותר באלגברה לינארית בסיסית היא הקשר שיש בין טרנספורמציות לינאריות \( T:V\to V \) המוגדרות על מרחב וקטורי ממימד סופי \( V \) ובין מטריצות. כזכור, מרגע שבו אנחנו קובעים בסיס \( B \) ל-\( V \), אוטומטית נובעת מכך התאמה חד-חד-ערכית ועל בין אוסף הטרנספורמציות הלינאריות \( T:V\to V \) (לפעמים אכתוב “אופרטור לינארי” במקום; המילה “אופרטור” רומזת שמדובר על טרנספורמציה ממרחב לעצמו) ובין המטריצות מסדר \( n\times n \) מעל אותו שדה כמו \( V \), כאשר \( n \) הוא מימד המרחב \( V \). הרעיון בהתאמה הזו הוא שמתקיים השוויון \( \left[T\right]_{B}\left[v\right]_{B}=\left[T\left(v\right)\right]_{B} \) - במילים, הכפלת המטריצה שמייצגת את האופרטור \( T \) בוקטור הקואורדינטות שמייצג את הוקטור \( v \) על פי הבסיס \( B \) מחזירה את וקטור הקואורדינטות של \( T\left(v\right) \) על פי \( B \). עבור בסיסים שונים, ל-\( T \) יהיו מטריצות מייצגות שונות, ואחד מהדברים שעוסקים בהם באלגברה לינארית הוא השאלה הבאה: בהינתן \( T \), אילו בסיסים קיימים שבהם \( \left[T\right]_{B} \) היא פשוטה במיוחד (למשל, אלכסונית)?

על כל זה כבר דיברתי בעבר. ההקשר הנוכחי שלנו הוא מרחבים וקטוריים עם מבנה נוסף - מרחבי מכפלה פנימית. בפרט, אנחנו רוצים להבין איך המושג של אופרטור צמוד בא לידי ביטוי במטריצות. כזכור, אם \( T \) הוא אופרטור אז קיים אופרטור יחיד \( T^{*} \) כך שמתקיים \( \left\langle T\left(v\right),u\right\rangle =\left\langle v,T^{*}\left(u\right)\right\rangle \) לכל \( v,u\in V \). הוכחת הקיום של \( T^{*} \) היא אמנם קונסטרוקטיבית, במובן זה שאפשר להבין ממנה איך למצוא את \( T^{*} \), אבל בדרך עקיפה וסבוכה; יהיה הרבה יותר פשוט לקבוע בסיס כלשהו ולמצוא ל-\( T^{*} \) מטריצה מייצגת על פי הבסיס הזה בהינתן המטריצה המייצגת של \( T \). אלא שכפי שנראה בקרוב, כבר אי אפשר לקחת “סתם” בסיס - כדי שמציאת המטריצה של \( T^{*} \) מתוך המטריצה של \( T \) תהיה פשוטה, אנחנו צריכים לקחת בסיס אורתונורמלי למרחב. למזלנו מובטח לנו שתמיד יש כזה, אבל מציאה של בסיס כזה עשויה להיות כרוכה לפעמים בחישובים לא נעימים.

אם כן, יהא \( B=\left\{ b_{1},\dots,b_{n}\right\} \) בסיס אורתונורמלי ל-\( V \)ותהא \( T \) טרנספורמציה כלשהי. נסמן \( A=\left[T\right]_{B} \). איך נראית \( A \)? העמודה ה-\( j \)-ית של \( A \) היא בעצם וקטור הקואורדינטות, לפי \( B \), של \( T\left(b_{j}\right) \) (למה? ובכן, צריך להוכיח את זה). עכשיו, עבור בסיסים אורתונורמליים אנחנו יודעים למצוא בקלות את הקואורדינטות של וקטור \( v \) לפי הבסיס \( B \): הקואורדינטה שמתאימה לאיבר הבסיס \( b_{i} \) היא פשוט \( \left\langle v,b_{i}\right\rangle \). לכן במקרה שלנו, \( A_{ij}=\left\langle T\left(b_{j}\right),b_{i}\right\rangle \) (הכניסה בשורה ה-\( i \) והעמודה ה-\( j \) במטריצה היא המכפלה הפנימית \( \left\langle T\left(b_{j}\right),b_{i}\right\rangle \)).

באופן דומה, אם \( A^{*} \) היא המטריצה המייצגת של \( T^{*} \) אז יתקיים עבורה \( A_{ij}^{*}=\left\langle T^{*}\left(b_{j}\right),b_{i}\right\rangle \). עכשיו אעשה תעלול קטן ופשוט אחליף את האינדקסים: \( A_{ji}^{*}=\left\langle T^{*}\left(b_{i}\right),b_{j}\right\rangle \). כעת שימו לב לזה:

\( A_{ij}=\left\langle T\left(b_{j}\right),b_{i}\right\rangle =\left\langle b_{j},T^{*}\left(b_{i}\right)\right\rangle =\overline{\left\langle T^{*}\left(b_{i}\right),b_{j}\right\rangle }=\overline{A_{ji}^{*}} \)

מה הלך פה? השתמשתי במעברים פה בכך ש-\( T^{*} \) צמודה ל-\( T \), ובכך שמכפלה פנימית מקיימת הרמיטיות - אפשר להחליף את הסדר של שני המוכפלים, במחיר של הצמדה (במשמעות של “צמוד מרוכב”) של הערך של המכפלה (כבר הסברתי בעבר למה ההצמדה הזו הכרחית). הגענו למסקנה ש-\( A^{*} \) מתקבלת מ-\( A \) על ידי הצמדה (מרוכבת) ושחלוף של \( A \) (הפיכת השורה ה-\( i \) של \( A \) לעמודה ה-\( i \) של \( A^{*} \)). לדוגמה, אם

\( A=\left[\begin{array}{cc}1 & -3\\5-i & i\end{array}\right] \)

אז

\( A^{*}=\left[\begin{array}{cc}1 & 5+i\\-3 & -i\end{array}\right] \)

זה מוביל אותנו להגדרה - אם \( A \) היא מטריצה ריבועית, אז \( A^{*} \) היא המטריצה שמתקבלת משחלוף והצמדה של \( A \) והיא נקראת המטריצה הצמודה של \( A \). זה זמן טוב להזכיר עוד מטריצה שגם היא נקראת לפעמים “המטריצה הצמודה” והתנגשות השמות הזו היא אסון - מטריצה שקראתי לה המטריצה המצורפת ל-\( A \), שמסומנת בתור \( \mbox{adj}A \) ותיארתי בעבר בבלוג.

עכשיו, דיברנו על אופרטורים צמודים לעצמם ועל אופרטורים אוניטריים, וההגדרות עוברות באופן חלק למטריצות: מטריצה שמקיימת \( A^{*}=A \) נקראת מטריצה צמודה לעצמה או מטריצה הרמיטית, ואילו מטריצה שמקיימת \( A^{-1}=A^{*} \) נקראת מטריצה אוניטרית. בואו ננסה להבין איך הן נראות.

בתור התחלה, אם \( A^{*}=A \) עבור מטריצה שכל הכניסות בה ממשיות, פירוש הדבר הוא שהמטריצה סימטרית. כי היא שווה לשחלוף של עצמה. עבור כניסות מרוכבות המצב קצת יותר מסובך. הנה דוגמה למטריצה הרמיטית:

\( \left[\begin{array}{cc}1 & -i\\i & 1\end{array}\right] \)

כמו שאתם רואים, היא לא בדיוק סימטרית. אם נפרק אותה לסכום של שתי מטריצות שאחת מהן כוללת את כל הרכיבים הממשיים והשניה את כל הרכיבים המדומים נקבל שהמטריצה הממשית היא סימטרית, בעוד שהמטריצה המדומה היא אנטי-סימטרית (מטריצה אנטי סימטרית היא מטריצה \( A \) כך ש-\( A^{t}=-A \)). בפרט, האיברים על האלכסון הראשי של המטריצה שווים להצמדה של עצמם ולכן הם חייבים להיות מספרים ממשיים “טהורים”. זה יהיה חשוב בהמשך.

בואו נעבור לדבר על מטריצות אוניטריות. ראשית כל אני רוצה להבין מה הדטרמיננטה של מטריצה כזו יכולה להיות. אם \( A^{-1}=A^{*} \) אז \( A\cdot A^{*}=I \) ולכן \( 1=\left|I\right|=\left|AA^{*}\right|=\left|A\right|\left|A^{*}\right| \). ומהי \( \left|A^{*}\right| \)? תחושת הבטן היא ש-\( \left|A^{*}\right|=\overline{\left|A\right|} \), כלומר הדטרמיננטה של הצמוד היא ההצמדה המרוכבת של הדטרמיננטה של \( A \). לא קשה לראות את זה ישירות מההגדרה הפורמלית של דטרמיננטה, למשל בתור סכום של מכפלות. זכרו שלכל מספר מרוכב \( z \) מתקיים \( z\cdot\overline{z}=\left|z\right|^{2} \), ולכן המסקנה היא ש-\( \left|\det A\right|^{2}=1 \) (עברתי לסמן דטרמיננטה ב-\( \det \) מסיבות ברורות). מכאן שהדטרמיננטה של \( A \) חייבת להיות 1 בערכה המוחלט (מכיוון שהיא עשויה להיות מספר מרוכב זה עדיין נותן לה לא מעט אפשרויות).

עכשיו בואו נעבור לדבר על מקרה קונקרטי יותר. ראשית כל, הבה וניזכר באופן כללי מהי ההופכית של מטריצה מסדר \( 2\times2 \) כלשהי. אם

\( A=\left[\begin{array}{cc}a & b\\c & d\end{array}\right] \)

אז ההופכית שלה היא

\( A^{-1}=\frac{1}{\left|A\right|}\left[\begin{array}{cc}d & -b\\-c & a\end{array}\right] \)

לא מאמינים? פשוט תכפילו ותראו… הנוסחה הזו היא מקרה פרטי של המשפט לפיו \( A^{-1}=\frac{\mbox{adj}A}{\left|A\right|} \) שהראיתי בעבר. עכשיו, באופן כללי מתקיים

\( A^{*}=\left[\begin{array}{cc}\overline{a} & \overline{c}\\\overline{b} & \overline{d}\end{array}\right] \)

כך שאם מתקיים \( A^{-1}=A^{*} \) אנחנו יכולים להסיק את \( c,d \) בתור פונקציות של \( a,b \):

\( c=-\left|A\right|\overline{b} \)

\( d=\left|A\right|\overline{a} \)

מכיוון ש-\( \left|A\right|=ad-bc \) אז בפרט נקבל \( \left|A\right|=\left|A\right|a\overline{a}+\left|A\right|b\overline{b}=\left|A\right|\left(\left|a\right|^{2}+\left|b\right|^{2}\right) \), כלומר \( \left|a\right|^{2}+\left|b\right|^{2}=1 \).

כעת, אפשר לכתוב קונקרטית \( \left|A\right|=e^{i\theta} \) עבור \( 0\le\theta\le2\pi \) - זו דרך ההצגה הקוטבית של מספר מרוכב עם ערך מוחלט 1. לכן נקבל שמטריצה \( A \) מסדר \( 2\times2 \) היא אוניטרית אם ורק אם היא מהצורה

\( \left[\begin{array}{cc}a & b\\-e^{i\theta}\overline{b} & e^{i\theta}\overline{a}\end{array}\right] \)

כך ש-\( \left|a\right|^{2}+\left|b\right|^{2}=1 \).

במקרה של מטריצה עם מקדמים ממשיים העסק הופך לפשוט מאוד: במקרה הזה \( \overline{a}=a,\overline{b}=b \) ואילו \( e^{i\theta} \) יכול להיות רק 1 או \( -1 \). לכן נקבל שיש בדיוק שני סוגים של מטריצות אוניטריות ממשיות:

\( \left[\begin{array}{cc}a & b\\-b & a\end{array}\right] \)

או

\( \left[\begin{array}{cc}a & b\\b & -a\end{array}\right] \)

בשני המקרים חייב להתקיים \( a^{2}+b^{2}=1 \).

עכשיו, כל מטריצה כזו מגדירה אופרטור לינארי על \( \mathbb{R}^{2} \). מה האופרטורים הללו עושים? ראשית כל, השוויון הנחמד \( a^{2}+b^{2}=1 \) מזכיר לי את הזהות המתמטית \( \sin^{2}\theta+\cos^{2}\theta=1 \), אז בואו נסמן \( a=\cos\theta \) ו-\( b=-\sin\theta \) (שימו לב שצריך להוכיח שזה אפשרי - אשאיר זאת לכם). אז מטריצה מהסוג הראשון היא מהצורה

\( \left[\begin{array}{cc}\cos\theta & -\sin\theta\\\sin\theta & \cos\theta\end{array}\right] \)

יש סיכוי טוב שהמטריצה הזו מוכרת לכם, אבל במקרה שלא, בואו נבין מה המשמעות של כפל בה. מספיק להבין איך היא פועלת על אברי הבסיס הסטנדרטי:

\( \left[\begin{array}{cc}\cos\theta & -\sin\theta\\\sin\theta & \cos\theta\end{array}\right]\left[\begin{array}{c}1\\0\end{array}\right]=\left[\begin{array}{c}\cos\theta\\\sin\theta\end{array}\right] \)

\( \left[\begin{array}{cc}\cos\theta & -\sin\theta\\\sin\theta & \cos\theta\end{array}\right]\left[\begin{array}{c}0\\1\end{array}\right]=\left[\begin{array}{c}-\sin\theta\\\cos\theta\end{array}\right] \)

אני מתעצל לצייר את זה, אבל ציירו! השוויון הראשון אומר שהוקטור האופקי שפונה “ימינה” (לצד החיובי של ציר \( x \)) עובר לוקטור שיוצר זווית של \( \theta \) מעל הכיוון החיובי של ציר \( x \). הוקטור שפונה “למעלה” עובר לוקטור שיוצר זווית \( \theta \) משמאל לכיוון החיובי של ציר \( y \), ובסך הכל המטריצה מסובבת את שני הוקטורים הללו בזווית \( \theta \) נגד כיוון השעון. מכיוון שהיא עושה זאת לוקטורים של בסיס כלשהו למרחב, זה מה שהיא עושה לכל וקטור - זוהי מטריצת סיבוב בזווית \( \theta \) (ובחרתי את \( a \) להיות \( \cos\theta \) ואת \( b \) להיות \( -\sin\theta \) כדי לקבל סיבוב במובן שאנחנו רגילים אליו - אם הייתי בוחר, למשל \( a=\sin\theta \) ו-\( b=\cos\theta \) עדיין הייתי מקבל סיבוב, אבל חשבו מה תהיה הזווית ומה יהיה הכיוון של הסיבוב).

מי שעדיין לא משוכנע יכול לכתוב במפורש מה המטריצה עושה על וקטור כללי, אבל כזה שנכתב בצורה קוטבית, של רדיוס וזווית עם הכיוון החיובי של ציר \( x \):

\( \left[\begin{array}{cc}\cos\theta & -\sin\theta\\\sin\theta & \cos\theta\end{array}\right]\left[\begin{array}{c}r\cos t\\r\sin t\end{array}\right]=\left[\begin{array}{c}r\cos\theta\cos t-r\sin\theta\sin t\\r\sin\theta\cos t+r\sin t\cos\theta\end{array}\right]=\left[\begin{array}{c}r\cos\left(t+\theta\right)\\r\sin\left(t+\theta\right)\end{array}\right] \)

כאשר המעבר האחרון נובע מהזהויות הטריגונומטריות הסטנדרטיות על סכום זוויות, וכעת אפשר לראות בבירור שהכפל במטריצה סובב את הוקטור בזווית של \( \theta \).

אם כן, הבנו מה עושה כל מטריצה אוניטרית מהצורה \( \left[\begin{array}{cc}a & b\\-b & a\end{array}\right] \). מה עם מטריצות מהצורה השניה? יש כמה דרכים להבין מה הן עושות, אבל בואו נתחיל מדרך שבה כדאי לנקוט תמיד עם מטריצות לא ברורות - ננסה ללכסן. המטריצה שלנו, כזכור, היא מהצורה

\( \left[\begin{array}{cc}a & b\\b & -a\end{array}\right] \)

כאשר \( a^{2}+b^{2}=1 \). הפולינום האופייני, אם כן, הוא

\( \left(a-x\right)\left(-a-x\right)-b^{2}=x^{2}-a^{2}-b^{2}=x^{2}-1 \)

והשורשים שלו הם 1 ו-\( -1 \). מה אומר ערך עצמי 1? שיש תת-מרחב ממימד 1 - קו ישר העובר דרך הראשית - שהאופרטור מקבע - משאיר במקום ללא שינוי. ומה זה ערך עצמי \( -1 \)? זהו קו ישר שהאופרטור מעביר כל נקודה בו אל הנגדי שלה - הנקודה האחרת על אותו קו שמרחקה מהראשית זהה. נסו לצייר את זה ותראו (אני מקווה) חיש קל שהאופרטור הזה הוא אופרטור של שיקוף ביחס לציר שהוא הישר שהאופרטור מקבע. בואו נמצא אותו על ידי כך שנמצא וקטור עצמי שמתאים לערך העצמי 1. לשם כך צריך לפתור את מערכת המשוואות הלינארית

\( \left[\begin{array}{cc}a-1 & b\\b & -a-1\end{array}\right]\left[\begin{array}{c}x\\y\end{array}\right]=\left[\begin{array}{c}0\\0\end{array}\right] \)

נניח ש-\( b\ne0 \) ונפתור אותה עם דירוג סטנדרטי, תוך שימוש בכך ש-\( a^{2}+b^{2}=1 \):

\( \left[\begin{array}{cc}a-1 & b\\b & -a-1\end{array}\right]\to\left[\begin{array}{cc}-1 & b+\frac{a\left(a+1\right)}{b}\\b & -a-1\end{array}\right]\to\left[\begin{array}{cc}1 & -\frac{1+a}{b}\\b & -\left(1+a\right)\end{array}\right]\to\left[\begin{array}{cc}1 & -\frac{1+a}{b}\\0 & 0\end{array}\right] \)

מכאן נקבל שכל פתרון של המשוואה הוא מהצורה \( \left(\frac{1+a}{b}t,t\right) \). אם נבחר, לצורך נוחות, \( t=b \) נקבל את היוצר \( \left(1+a,b\right) \). בדקו ישירות כדי לראות שהוא אכן וקטור עצמי!

אם תחזרו לאחד הפוסטים המוקדמים שלי על אלגברה לינארית תראו שכבר חישבנו פעם במפורש את המטריצה עבור אופרטור שיקוף, אבל הגענו לתוצאה שנראית מפחידה בהרבה. מטריצת השיקוף דרך ציר שנפרש על ידי \( \left(x,y\right) \) הייתה

\( \frac{1}{x^{2}+y^{2}}\left[\begin{array}{cc}x^{2}-y^{2} & 2xy\\2xy & y^{2}-x^{2}\end{array}\right] \)

ומה שראינו עכשיו הוא שאם \( \left(x-1\right)^{2}+y^{2}=1 \) אז המטריצה שמתקבלת היא מהצורה

\( \left[\begin{array}{cc}x-1 & y\\y & 1-x\end{array}\right] \)

שהיא נחמדה יותר, אבל לא תמיד \( \left(x-1\right)^{2}+y^{2}=1 \) ולא פשוט למצוא \( \left(x,y\right) \) שמקיימים את זה אם נתון לנו הישר שאנו רוצים לשקף דרכו.

בואו ננסה להבין את האופרטור הזה בצורה נוספת, כפי שעשינו עבור סיבוב - לכתוב הכל בצורה טריגונומטרית ולראות מה מקבלים:

\( \left[\begin{array}{cc}\cos\theta & \sin\theta\\\sin\theta & -\cos\theta\end{array}\right]\left[\begin{array}{c}r\cos t\\r\sin t\end{array}\right]=\left[\begin{array}{c}r\cos\theta\cos t+r\sin\theta\sin t\\r\sin\theta\cos t-r\sin t\cos\theta\end{array}\right]=\left[\begin{array}{c}r\cos\left(\theta-t\right)\\r\sin\left(\theta-t\right)\end{array}\right] \)

זה מזכיר סיבוב, אבל זה לא סיבוב בגלל שהזווית של הוקטור המקורי, \( t \), הפכה למינוס \( t \). קצת חשבון מראה שעבור \( t=\frac{\theta}{2} \) נקבל נקודות שבת של האופרטור, ולכן הפעולה שהאופרטור מבצע היא שיקוף ביחס לציר שהזווית שלו עם הכיוון החיובי של ציר \( x \) היא \( \frac{\theta}{2} \).

כל החישובים הללו מראים את שלל הדרכים שבהן ניתן להגיע למסקנה הבאה: האופרטורים הלינאריים היחידים על \( \mathbb{R}^{2} \) שמשמרים זווית ואורך הם סיבובים ושיקופים. זו לא תוצאה מובנת מאליה, ולדעתי זה יפה למדי איך שאפשר להגיע אליה בהתבסס על מה שאנחנו כבר יודעים על טרנספורמציות אוניטריות וקצת חשבונות.

אחרי שסיימנו עם המשחקים והדוגמאות מגיעה מאליה השאלה - מה הלאה? מה האתגר האמיתי שלנו? התשובה היא שהגיע הזמן לנסות להבין איך המושג של לכסינות של מטריצות משתלב עם מרחבי מכפלה פנימית, ובניסוח קונקרטי - בהינתן אופרטור לינארי מעל מרחב מכפלה פנימית, מתי קיים למרחב בסיס אורתונורמלי שבו האופרטור מיוצג על ידי מטריצה ריבועית, כלומר מתי קיים למרחב בסיס אורתונורמלי שמורכב כולו מוקטורים עצמיים של האופרטור? בשאלה הזו נעסוק בפוסט הבא בנושא.

נהניתם? התעניינתם? אם תרצו, אתם מוזמנים לתת טיפ: