דמיון מטריצות

בפוסט הקודם דיברתי על ייצוג טרנספורמציות לינאריות באמצעות מטריצות. מה שאולי לא הובלט מספיק שם היה שאת אותה טרנספורמציה לינארית אפשר לייצג באמצעות המון מטריצות, וכל מטריצה מייצגת המון טרנספורמציות לינאריות; מה שקובע חד משמעית את הקשר בין טרנספורמציות ומטריצות הוא בחירה של בסיסים עבור המרחבים שמעורבים בטרנספורמציה. מכאן עולות כמה שאלות - ראשית, האם כל מטריצה יכולה לייצג כל טרנספורמציה לינארית, או שמראש טרנספורמציה יכולה להיות מיוצגת רק על ידי תת-קבוצה מסויימת של מטריצות, וכל מטריצה יכולה לייצג רק תת-קבוצה מסויימת של טרנספורמציות? שנית, איך אפשר, בהינתן מטריצה שמייצגת טרנספורמציה על ידי בסיס אחד, לעבור למטריצה שמייצגת אותה על ידי בסיס אחר? ושלישית, האם קיימים בסיסים שבהם יותר “נוח” לייצג טרנספורמציה מאשר בסיסים אחרים? לשאלות הללו יש תשובות לא רעות בכלל שאני רוצה להציג.

נתחיל בדוגמה שמבהירה מייד מה התשובה לאחת השאלות - מטריצת האפס, זו שכולה אפסים, תמיד מייצגת את טרנספורמציית האפס, כי כשכופלים אותה בוקטור כלשהו תמיד מקבלים אפס. בדומה, טרנספורמציית האפס (שמעבירה כל איבר לאפס) תמיד תהיה מיוצגת על ידי מטריצת האפס. אז ברור שלא כל מטריצה יכולה לייצג כל טרנספורמציה. למעשה, התכונות של המטריצה יכולות ללמד אותנו דברים על התכונות של כל הטרנספורמציות שיכולות להיות מיוצגות על ידה. אז נתחיל בלהבין את הקשר בין מטריצות שונות שמייצגות את אותה הטרנספורמציה, והצעד הראשון בדרך לשם הוא המושג של מטריצת מעבר בין בסיסים.

נניח שיש לנו מרחב וקטורי \( V \) ויש לו שני בסיסים סדורים \( B=\left\{ b_{1},\dots,b_{n}\right\} \) ו-\( C=\left\{ c_{1},\dots,c_{n}\right\} \). נניח גם שיש לנו וקטור \( v \), שנתון לנו על ידי וקטור הקואורדינטות שלו לפי \( B \): \( \left[v\right]_{B} \). האם יש לנו דרך נוחה לקבל את וקטור הקואורדינטות שלו על פי \( C \)? כמובן, אפשר לתת תשובות לשאלה הזו שהן ספציפיות למרחב הוקטורי שבו אנו עובדים - אפשר לקחת את וקטור הקואורדינטות \( \left[v\right]_{B} \), לחשב ממנו ייצוג מפורש נוח כלשהו עבור \( v \) ואז לחשב מהייצוג המפורש הזה את \( \left[v\right]_{C} \). אלא שלא באמת צריך את זה. בואו נזכור שלכל טרנספורמציה \( T:V\to V \) אפשר לדבר על המטריצה \( \left[T\right]_{B}^{C} \) שמייצגת את \( T \) על פי הבסיסים \( B,C \). כאן קורה משהו טיפה מוזר - \( T \) היא ממרחב כלשהו אל עצמו, ועם זאת אנו מתעקשים להשתמש בשני בסיסים שונים - אבל הפורמליזם תקין, ומתקיים \( \left[T\right]_{B}^{C}\left[v\right]_{B}=\left[T\left(v\right)\right]_{C} \). כעת, בואו נבחר בתור \( T \) טרנספורמציה פשוטה במיוחד: טרנספורמציית הזהות, \( I \), שמקיימת \( I\left(v\right)=v \) לכל \( v\in V \). כעת מה יקרה? \( \left[I\right]_{B}^{C}\left[v\right]_{B}=\left[v\right]_{C} \) ממש על פי הגדרה, כלומר \( \left[I\right]_{B}^{C} \) היא מטריצה שההכפלה בה עושה בדיוק את מה שרצינו. למטריצה כזו אני קורא מטריצת המעבר מהבסיס \( B \) לבסיס \( C \), ואולי כדאי להזהיר מראש שיש ספרים שדווקא קוראים לה מטריצה המעבר מ-\( C \) אל \( B \), אלוהים יודע למה.

את מטריצת המעבר הזו קל לחשב: פשוט לוקחים את אברי \( B \), מוצאים את וקטורי הקואורדינטות שלהם לפי הבסיס \( C \) ואלו עמודות מטריצת המעבר, שאסמן \( M_{B}^{C} \) לצורך פשטות.

כעת, כמו שהגדרתי את \( M_{B}^{C} \) אני יכול באותה מידה בדיוק להגדיר את \( M_{C}^{B} \) שמעבירה מהבסיס \( C \) לבסיס \( B \). כעת עולה מאליה השאלה מהי המטריצה \( M_{C}^{B}M_{B}^{C} \), והתשובה האולי לא מפתיעה היא שמדובר על מטריצת היחידה \( I \) (כן, אותו סימון לטרנספורמציה ומטריצה! אהההה!) שבה יש 1-ים על האלכסון הראשי ו-0-ים בכל מקום אחר. למטריצת היחידה התכונה הנחמדה שאם כופלים אותה בוקטור כלשהו הוא אינו משתנה, כך שהיא מייצגת את הטרנספורמציה “לא משנים כלום, אפילו לא את הקואורדינטות” שהיא בדיוק גם הטרנספורמציה ש-\( M_{C}^{B}M_{B}^{C} \) מבצעת (אם העברנו קואורדינטות מ-\( B \) אל \( C \) אבל אז חזרנו מ-\( C \) אל \( B \) אז לא עשינו כלום). בדומה גם \( M_{B}^{C}M_{C}^{B}=I \).

באופן כללי אם יש לנו שתי מטריצות \( P,Q \) מסדר \( n\times n \) - כלומר, ריבועיות, כך ש-\( PQ=QP=I \) אומרים על שתיהן שהן הפיכות ומסמנים \( Q=P^{-1} \). מה שראינו כרגע הוא שמטריצות המעבר בין בסיסים הן הפיכות וראינו גם מה ההופכי שלהן. איך כל זה קשור לשאלה המקורית שלי על מטריצות שונות שמייצגות את אותה טרנספורמציה? טוב ששאלתם.

תהא לה \( T:V\to V \) טרנספורמציה ממרחב אל עצמו (לפעמים קוראים בשם “אופרטור” לכזו טרנספורמציה, אבל זה לא קשר מחייב) ויהיו \( B,C \) בסיסים של \( V \). לצורך פשטות אסמן את \( \left[T\right]_{B}^{B} \) פשוט כ-\( \left[T\right]_{B} \)(כלומר, אם אותו בסיס משמש גם בתור הבסיס של המקור וגם בתור הבסיס של היעד - מה שאפשרי רק עבור אופרטורים - כותבים אותו רק פעם אחת) וכעת השאלה שלי היא מה טיב הקשר בין \( \left[T\right]_{B} \) ובין \( \left[T\right]_{C} \). הפתרון טמון באבחנה הבאה: להפעיל את \( \left[T\right]_{C} \) על וקטור קואורדינטות על פי \( C \) זה אותו דבר בדיוק כמו לקחת וקטור קואורדינטות על פי \( C \), להמיר אותו לוקטור קואורדינטות על פי \( B \), להפעיל את \( \left[T\right]_{B} \) על התוצאה, ואת התוצאה הזו להמיר חזרה לבסיס \( C \). בנוסחה:

\( \left[T\right]_{C}=M_{B}^{C}\left[T\right]_{B}M_{C}^{B} \)

ובניסוח טיפה שונה: אם \( P \) היא מטריצת המעבר מהבסיס \( C \) לבסיס \( B \), אז \( \left[T\right]_{C}=P^{-1}\left[T\right]_{B}P \). זה מראה שאם אנחנו רוצים לעשות שינוי במערכת הקואורדינטות שבה אנו מייצגים את המרחב, כל שעלינו לעשות הוא לחשב את מטריצת המעבר בין שתי מערכות הקואורדינטות, ואז נוכל לתקן בהתאם את הכל - גם וקטורים, וגם מטריצות שמתארות טרנספורמציות מורכבות.

באופן לא ממש מפתיע, כפי שקורה בדרך כלל באלגברה לינארית, גם הכיוון השני נכון. כלומר, אם \( P \) היא מטריצה הפיכה כלשהי, אפשר לחשוב עליה כעל מטריצת מעבר בין בסיסים, ולכן אם יש לנו שתי מטריצות ריבועיות \( A,B \) כך ש-\( A=P^{-1}BP \) אז \( A,B \) מייצגות את אותה הטרנספורמציה בבסיסים שונים.

באופן כללי במתמטיקה, לא רק באלגברה לינארית, צצה לפעמים סיטואציה שבה שני איברים \( a,b \) קשורים ביניהם על ידי משוואה מהצורה \( a=x^{-1}bx \). דוגמה קלאסית היא תמורות בתורת החבורות; לא אכנס לכך כעת, אבל כדאי לדעת שזה קיים. אם \( a=x^{-1}bx \) אז אומרים ש-\( a \) התקבל מ-\( b \) על ידי הצמדה על ידי \( x \); במקרה של מטריצות, אם מטריצה \( A \) מתקבלת ממטריצה \( B \) על ידי הצמדה, אומרים ש-\( A \) דומה ל-\( B \).

שימו לב לכך ש-\( A=I^{-1}AI \) ולכן כל מטריצה דומה לעצמה; לכך שאם \( A=P^{-1}BP \) אז \( B=PAP^{-1} \) ולכן \( B \) דומה ל-\( A \) (על ידי הצמדה ב-\( P^{-1} \)); ואם \( A=P^{-1}BP \) ו-\( B=Q^{-1}CQ \) אז \( A=\left(QP\right)^{-1}C\left(QP\right) \) (התוצאה האחרונה נובעת מהטענה הטכנית שלא הוכחתי לפיה \( \left(AB\right)^{-1}=B^{-1}A^{-1} \) לכל זוג מטריצות הפיכות \( A,B \)). שלוש הטענות הללו יחד מראות כי דמיון מטריצות הוא יחס שקילות: אפשר לחלק את מרחב כל המטריצות לקבוצות כך שבכל קבוצה כל המטריצות דומות זו לזו. מסקנה אחת מכך היא שאם יש לי שתי טרנספורמציות שמיוצגות (כל אחת בבסיס אחר) על ידי אותה מטריצה, הן מיוצגות בדיוק על ידי אותן מטריצות. זה בפרט מראה שתכונות מסויימות של הטרנספורמציה שבאות לידי ביטוי במטריצות שמייצגות אותה חייבות להישמר על ידי הצמדה. אולי הדוגמה הכי בולטת היא הפיכות - אם טרנספורמציה היא הפיכה (כלומר, חח”ע ועל) אז גם כל המטריצות שמייצגות אותה חייבות להיות הפיכות, ולכן הצמדה של מטריצה הפיכה גם היא הפיכה. למעשה, יש עוד מספר תכונות חשובות שנשמרות אבל כדי להציג אותן יש צורך להתעסק קצת יותר לעומק במטריצות וזאת טרם עשיתי.

השאלה הבאה היא האם לכל מטריצה יש ייצוג “נוח”, כלומר האם כל מטריצה דומה למטריצה פשוטה כלשהי. זה כמובן מעלה את השאלה מהי מטריצה פשוטה; תשובה אפשרית אחת היא מטריצה אלכסונית, כי במטריצה כזו פעולת הכפל מתנהגת באופן פשוט מאוד. התשובה היא שמטריצות רבות אכן דומות למטריצה אלכסונית, אך לא כולן; הזיהוי של הסיטואציה שבה יש דמיון למטריצות אלכסוניות הוא אחד מהנושאים שאני מתכוון לדבר עליהם. למרות שלא כל המטריצות דומות למטריצות אלכסוניות אפשר להראות שכל מטריצה דומה למטריצה שהיא “כמעט אלכסונית” - צורת ז'ורדן, אבל לשם כך יש צורך שהשדה שמעליו אנו עובדים יהיה סגור אלגברית - עוד מושג שעליו אדבר בהמשך. לעת עתה נעזוב את ענייני דמיון המטריצות שכן עדיין חסר לנו מושג או שניים לפני שנוכל להתמודד איתם.


נהניתם? התעניינתם? אם תרצו, אתם מוזמנים לתת טיפ:

Buy Me a Coffee at ko-fi.com