מרחבי מכפלה פנימית - לפעמים הצמדה היא באמת הצמדה

בסוף הפוסט האחרון שלי על אלגברה לינארית הבטחתי שנדבר על מה שקורה כשלוקחים מרחב מכפלה פנימית ומתחילים לדבר על טרנספורמציות לינאריות מעליו. אני רוצה להתחיל עם הסוג הפשוט ביותר של טרנספורמציות לינאריות - פונקציונלים לינאריים.

תזכורת קצרה: \( V \) הוא מרחב מכפלה פנימית אם הוא מרחב וקטורי מעל \( \mathbb{C} \) שמוגדרת בו פונקציה \( \left\langle \cdot,\cdot\right\rangle :V\times V\to\mathbb{C} \) שהיא לינארית במשתנה הראשון (כלומר, \( \left\langle \lambda x+y,z\right\rangle =\lambda\left\langle x,z\right\rangle +\left\langle y,z\right\rangle \)), הרמיטית - \( \left\langle x,y\right\rangle =\overline{\left\langle y,x\right\rangle } \) (“כמעט” סימטרית עד כדי הצמוד למעלה, שאת הסיבות לו הסברתי בעבר) וחיובית, כלומר \( \left\langle x,x\right\rangle \ge0 \) ושוויון הוא רק כש-\( x=0 \). פונקציונל לינארי במקרה שלנו הוא פונקציה לינארית \( f:V\to\mathbb{C} \). הדמיון למכפלה פנימית די ברור - פונקציונל פועל על איבר אחד ואילו מכפלה פנימית על שניים, אבל שניהם מחוייבים ללינאריות מסוג כלשהו. אם המרחב \( V \) הוא סוף-ממדי (ואני מתכנן לדבר רק על מרחבי מכפלה פנימית סוף ממדיים; מה שקורה במרחבים אינסוף מימדיים הוא נושא לסדרת פוסטים ארוכה אף יותר מהנוכחית), הדמיון הוא לחלוטין לא מקרי - מסתבר שכל פונקציונל לינארי על \( V \) ניתן לתיאור באופן יחיד באמצעות המכפלה הפנימית (במרחב אינסוף ממדי זה פשוט לא נכון, אם כי לא אציג דוגמאות נגדיות כעת).

בואו ראשית כל נשחק במשחק הבא: ניקח \( y\in V \) כלשהו ונחשוב עליו כעל “קבוע”. אז אפשר להגדיר פונקציה \( f_{y}:V\to\mathbb{C} \) של “מכפלה פנימית ב-\( y \)”, כלומר \( f_{y}\left(x\right)=\left\langle x,y\right\rangle \). קל לראות ש-\( f_{y} \) היא פונקציונל לינארי, פשוט בגלל הלינאריות של המכפלה הפנימית; מה שקורה במרחב סוף ממדי הוא שכל פונקציונל לינארי \( f \) ניתן להצגה כ-\( f_{y} \) עבור \( y \) אחד ויחיד ספציפי. איך מוצאים אותו? בעזרת הכלי הסטנדרטי שלנו להתמודדות עם מרחבי מכפלה פנימית - בסיסים אורתונורמליים.

ניקח בסיס אורתונורמלי \( u_{1},\dots,u_{n} \) למרחב. בהינתן \( x\in V \) כלשהו, אנחנו יודעים ש-\( x=\sum\left\langle x,u_{i}\right\rangle u_{i} \) (זוכרים? כשמייצגים איבר בבסיס אורתונורמלי, המקדם של איבר הבסיס \( u_{i} \) בצירוף הלינארי הוא בדיוק המכפלה הפנימית של \( x \) ב-\( u_{i} \). קוראים לזה “מקדם פורייה” של \( x \) בבסיס \( u_{1},\dots,u_{n} \)). אנחנו גם יודעים איך מכפלה פנימית של שני איברים כלליים נראית: אם \( y=\sum\left\langle y,u_{i}\right\rangle u_{i} \) הוא איבר תמים אחר של \( V \) ואנו כופלים אותו ב-\( x \), נקבל:

\( \left\langle x,y\right\rangle =\left\langle \sum\left\langle x,u_{i}\right\rangle u_{i},\sum\left\langle y,u_{j}\right\rangle u_{j}\right\rangle =\sum_{i,j}\left\langle x,u_{i}\right\rangle \overline{\left\langle y,u_{j}\right\rangle }\left\langle u_{i},u_{j}\right\rangle =\sum_{i}\left\langle x,u_{i}\right\rangle \overline{\left\langle y,u_{i}\right\rangle } \)

כעת, אם נפעיל את \( f \) על \( x \) ונשתמש בלינאריות שלו, נקבל ש-\( f\left(x\right)=\sum\left\langle x,u_{i}\right\rangle f\left(u_{i}\right) \). זה מאוד מזכיר את המשוואה שלמעלה, אם \( f\left(u_{i}\right)=\overline{\left\langle y,u_{i}\right\rangle } \), ובניסוח אחר \( \left\langle y,u_{i}\right\rangle =\overline{f\left(u_{i}\right)} \). זה מוביל אותנו להגדרה הבאה: \( y=\sum\overline{f\left(u_{i}\right)}u_{i} \). כעת קל לוודא שאכן \( f\left(x\right)=\left\langle x,y\right\rangle \) לכל \( x\in V \). כדי לוודא ש-\( y \) הוא יחיד, נניח כי ישנם \( y_{1},y_{2} \) כך ש-\( \left\langle x,y_{1}\right\rangle =f\left(x\right)=\left\langle x,y_{2}\right\rangle \) לכל \( x \), כלומר \( \left\langle x,y_{1}-y_{2}\right\rangle =0 \) לכל \( x \). במרחב סוף ממדי זה יכול לקרות רק אם \( y_{1}-y_{2}=0 \), כלומר \( y_{1}=y_{2} \) (למה בעצם אם \( \left\langle x,y\right\rangle =0 \) לכל \( x \) זה גורר ש-\( y=0 \)? תרגיל טוב).

בפוסט שלי על פונקציונלים לינאריים הערתי שיש איזומורפיזם בין \( V \) ובין \( V^{*} \)- מרחב הפונקציונלים הלינאריים מעל \( V \), אך הוא אינו “קנוני” - כלומר, עבור בחירות בסיס שונות עבור \( V \) נקבל איזומורפיזמים שונים ואין דרך להכריע מי מביניהם יותר “נכון”. במקרה שבו \( V \) הוא מרחב מכפלה פנימית, קיבלנו איזומורפיזם קנוני לעילא ולעילא - \( y\mapsto f_{y} \), שאינו תלוי בבחירת בסיס זה או אחר למרחב. כמובן שאני קצת משקר כאן - האיזומורפיזם הזה עדיין תלוי בבחירת מכפלה פנימית למרחב, והיא שקולה לבחירת בסיס, אבל נעזוב את זה.

בואו נעבור לדבר עכשיו על משהו אחר - אופרטורים לינאריים, כלומר טרנספורמציות לינאריות \( T:V\to V \) מ-\( V \) לעצמו. השאלה הראשונה שאני שואל היא שאלה של סימטריה: נניח שיש לי וקטורים \( x,y \), ואני מפעיל את \( T \) על \( x \) ואז כופל את התוצאה עם \( y \) - האם אקבל את אותו הדבר כאילו הפעלתי את \( T \) על \( y \) וכפלתי את \( x \) בזה? כלומר, האם \( \left\langle Tx,y\right\rangle =\left\langle x,Ty\right\rangle \)? התשובה היא שלא תמיד, ושאופרטורים שמקיימים את התכונה הזו הם מעניינים למדי - הם נקראים אופרטורים הרמיטיים (ומעל \( \mathbb{R} \)- סימטריים). קחו רגע ונסו להסביר לעצמכם למה השוויון \( \left\langle Tx,y\right\rangle =\left\langle x,Ty\right\rangle \) כלל לא מובן מאליו.

אוקיי, אז לא תמיד מתקיים \( \left\langle Tx,y\right\rangle =\left\langle x,Ty\right\rangle \). עדיין, התחושה האינטואיטיבית היא שמידת מה של סימטריה צריכה להיות כאן, והתחושה הזו מדוייקת - לכל אופרטור \( T \) מותאם אופרטור \( T^{*} \) - הצמוד ההרמיטי של \( T \) - כך ש-\( \left\langle Tx,y\right\rangle =\left\langle x,T^{*}y\right\rangle \). זה המשפט העיקרי שאני רוצה להוכיח בפוסט. כעת אפשר לתאר אופרטור הרמיטי בצורה קצת יותר פשוטה: זה אופרטור שמקיים \( T=T^{*} \), כלומר הוא שווה לצמוד ההרמיטי שלו; כלומר הוא צמוד לעצמו. זה עוד שם לאופרטורים הרמיטיים.

הוכחת הקיום של \( T^{*} \) היא מחוכמת ואלגנטית. הבה ונקבע את \( y \) לרגע, אז אפשר להגדיר פונקציונל לינארי \( f\left(x\right)=\left\langle Tx,y\right\rangle \). במילים אחרות, בהינתן \( x \) נתעלל בו על ידי הפעלת \( T \) עליו ואז מכפלה פנימית של כל זה עם \( y \). זה אכן פונקציונל כי \( T \) היא טרנספורמציה לינארית ומכפלה פנימית היא לינארית. אם \( f \) הזו היא פונקציונל, אז יש איזה שהוא \( z \) שמגדיר אותה: \( f\left(x\right)=\left\langle x,z\right\rangle \). במילים אחרות, \( \left\langle x,z\right\rangle =\left\langle Tx,y\right\rangle \), ולכן אם קיים בכלל \( T^{*} \) שהוא צמוד הרמיטי של \( T \), אז הוא מקיים \( \left\langle x,z\right\rangle =\left\langle x,T^{*}y\right\rangle \). במילים אחרות, אנחנו נדחפים להגדרה \( T^{*}\left(y\right)=z \).

באופן הזה אפשר להגדיר את \( T^{*} \) לכל איבר \( y\in V \). צריך לוודא שאכן קיבלנו אופרטור לינארי; שום דבר לא מבטיח לנו שהתנאי ההכרחי שמצאנו עבור \( T^{*} \) (שקבע באופן יחיד איך הוא חייב להיראות) הוא גם מספיק כדי שהוא אכן יהיה אופרטור לינארי; זה ה”קסם” שיש כאן. אם כן, יהיו \( y_{1},y_{2} \) כך ש-\( T^{*}\left(y_{1}\right)=z_{1} \) ו-\( T^{*}\left(y_{2}\right)=z_{2} \); נרצה להראות ראשית ש-\( T^{*}\left(y_{1}+y_{2}\right)=z_{1}+z_{2} \). נסמן \( T^{*}\left(y_{1}+y_{2}\right)=z \); אנחנו יודעים ש-

\( \left\langle x,z\right\rangle =\left\langle Tx,y_{1}+y_{2}\right\rangle =\left\langle Tx,y_{1}\right\rangle +\left\langle Tx,y_{2}\right\rangle =\left\langle x,z_{1}\right\rangle +\left\langle x,z_{2}\right\rangle =\left\langle x,z_{1}+z_{2}\right\rangle \)

השוויון \( \left\langle x,z\right\rangle =\left\langle x,z_{1}+z_{2}\right\rangle \) עבור ערך ספציפי של \( x \) לא מספיק כדי להסיק ש-\( z=z_{1}+z_{2} \), אבל מכיוון שזה נכון עבור כל \( x \) זה מספיק (שוב - למה?). באופן דומה גם מראים ש-\( T^{*}\left(\lambda y\right)=\lambda T^{*}\left(y\right) \) ולכן \( T^{*} \) אכן לינארית.

עכשיו, אנחנו יודעים שבמרחב סוף-ממדי כל טרנספורמציה לינארית ניתנת לייצוג באמצעות מטריצות; נניח שקבענו איזה בסיס אורתונורמלי של המרחב, \( B=\left\{ u_{1},\dots,u_{n}\right\} \), ואנחנו מסתכלים על \( \left[T\right]_{B} \) - המטריצה המייצגת של \( T \) ביחס לבסיס הזה. מה הקשר בינה ובין המטריצה המייצגת של \( \left[T^{*}\right]_{B} \)? האם יש לנו תיאור קונקרטי וקל לחישוב של האופן שבו הייצוג הנוח של \( T \) הופך לייצוג נוח של \( T^{*} \)? התשובה חיובית, במקרה שבו \( B \) אורתונורמלי. זכרו שהעמודה ה-\( i \)-ית של המטריצה \( \left[T^{*}\right]_{B} \) היא בדיוק וקטור הקואורדינטות לפי \( B \) של \( T^{*}\left(u_{i}\right) \) (הפעלת \( T^{*} \) על איבר הבסיס ה-\( i \) ב-\( B \)), או במילים אחרות - הכניסה ה-\( j,i \) של \( \left[T^{*}\right]_{B} \) היא בדיוק \( \left\langle T^{*}\left(u_{i}\right),u_{j}\right\rangle \). בואו נעשה תעלול אלגברי זריז:

\( \left\langle T^{*}\left(u_{i}\right),u_{j}\right\rangle =\overline{\left\langle u_{j},T^{*}\left(u_{i}\right)\right\rangle }=\overline{\left\langle T\left(u_{j}\right).u_{i}\right\rangle } \)

אבל מה זה \( \left\langle T\left(u_{j}\right).u_{i}\right\rangle \)? זה בדיוק המקדם של \( u_{i} \) בצירוף הלינארי שמגדיר את \( T\left(u_{j}\right) \). במילים אחרות, זו הכניסה ה-\( i,j \) של המטריצה \( \left[T\right]_{B} \)!

זה מוביל אותנו להגדרה הבאה: אם \( A \) היא מטריצה ריבועית כלשהי מעל המרוכבים, אז המטריצה הצמודה שלה מוגדרת בתור \( A^{*}=\overline{A^{t}} \), כלומר ביצוע שחלוף והצמדה, כלומר \( A_{ij}^{*}=\overline{A_{ji}} \). כשמדובר במטריצות קל למדי לראות שמתקיימות התכונות הבאות של הצמדה (שאני מנסח בלשון טרנספורמציות כי הן תקפות באותה מידה גם לטרנספורמציות):

  1. \( \left(T+S\right)^{*}=T^{*}+S^{*} \)
  2. \( \left(\lambda T\right)^{*}=\overline{\lambda}T^{*} \)
  3. \( \left(TS\right)^{*}=S^{*}T^{*} \)
  4. \( \left(T^{*}\right)^{*}=T \)

ארבע התכונות הללו מראות לנו שיש מבנה אלגברי כלשהו לפעולה של “קח טרנספורמציה והחזר את הצמודה שלה” - בלשון פונקציות, \( f\left(T\right)=T^{*} \). תכונות 1 ו-2 אומרות שהפונקציה הזו היא “כמעט לינארית”, עד כדי כך שהוצאת סקלר כרוכה בהצמדה שלו - פונקציה כזו נקראת אנטי-לינארית, או לינארית-צמודה. התכונה הבאה מראה ש-\( f \) הופכת איברים בכפל: \( f\left(TS\right)=f\left(S\right)f\left(T\right) \). לפונקציה שמקיימת \( f\left(ST\right)=f\left(S\right)f\left(T\right) \) קוראים הומומורפיזם ולכן ההצמדה שלנו, שעושה מעין היפוך של זה, נקראת אנטי-הומומורפיזם (מאוד אנטי כל העסק - אנטי-לינארי, אנטי-הומומורפיזם…). לסיום, תכונה 4 אומרת ש-\( f\left(f\left(T\right)\right)=T \) - לפונקציה שמקיימת את זה קוראים אינבולוציה. בקיצור, ההצמדה שלנו היא פעולה שמקיימת כמה תכונות מוכרות וחביבות על המתמטיקאים.

באופן לא מפתיע, מסתבר שאפשר להשתמש בתכונות הללו כבסיס להכללה; זה הבסיס לתחום במתמטיקה של אלגברות \( C \)-כוכב (אלגבראות \( C^{*} \)), שהן אלגבראות בנך עם פונקציה שמקיימת את תכונות 1-4 ועוד כמה תכונות שלא אכנס אליהן כעת (כמו שלא אכנס להגדרה של אלגברת בנך; כל הדברים הללו קשורים לאלגברה לינארית במרחב אינסוף ממדי). לא ארחיב לכיוון הזה עכשיו, אלא אדבר דווקא על דוגמה פשוטה ביותר לפונקציה לא טריוויאלית נוספת שמקיימת את תכונות 1-4, שאולי כבר קפצה לחלקכם לראש - הצמדה של מספרים מרוכבים. תכונות 1,2,4 שלה באות באופן טבעי לחלוטין; תכונה 3 נובעת מכך ש-\( \overline{zw}=\overline{z}\cdot\overline{w} \) ומכך שבמספרים מרוכבים הכפל הוא קומוטטיבי, כלומר \( \overline{w}\cdot\overline{z} \). הדמיון הזה מסביר את השם צמוד בהקשר הנוכחי.

הדמיון לא נגמר כאן. במספרים מרוכבים מתקיימת התכונה הנחמדה שאם \( z \) הוא מספר מרוכב כלשהו, אז \( \frac{z+\overline{z}}{2} \) הוא החלק הממשי של \( z \), ואילו \( \frac{z-\overline{z}}{2} \) הוא החלק המדומה של \( z \) (בדקו בעצמכם אם אינכם זוכרים/יודעים/מאמינים). בואו נעשה דבר דומה עם טרנספורמציות: ניקח \( T \) כלשהי ונגדיר \( T_{R}=\frac{T+T^{*}}{2} \) ו-\( T_{I}=\frac{T-T^{*}}{2} \).

עכשיו, \( T_{R}^{*}=\frac{1}{2}\left(T+T^{*}\right)^{*}=\frac{T^{*}+\left(T^{*}\right)^{*}}{2}=\frac{T+T^{*}}{2}=T_{R} \), ולכן \( T_{R} \) צמודה לעצמה; בדומה נקבל ש-\( T_{I}^{*}=-T_{I} \) - לטרנספורמציה שמקיימת את התכונה הזו קוראים אנטי-הרמיטית. כפי שאתם ודאי שמים לב, \( T_{R} \) מתנהג ביחס להצמדה כמו שמספר ממשי מתנהג ביחס אליה, ו-\( T_{I} \) מתנהג כמו שמספר מדומה טהור מתנהג ביחס אליה. כעת שימו לב לכך ש-\( T=T_{R}+T_{I} \) , כלומר כל טרנספורמציה לינארית במרחב סוף ממדי ניתן לרשום כסכום של טרנספורמציה הרמיטית וטרנספורמציה אנטי-הרמיטית (למעשה, אפשר גם להגדיר \( T_{I}^{\prime}=\frac{T-T^{*}}{2i} \) ולקבל טרנספורמציה הרמיטית ואז הפירוק הוא \( T=T_{R}+iT_{I}^{\prime} \) - שוב, בדיוק כמו עם מספרים מרוכבים). האנלוגיה הזו הלהיבה אותי מאוד בשעתו; זה תמיד מעניין לראות איך תכונות שקיימות במרוכבים הן ממש לא נחלתם הבלעדית אלא מעידות כנראה על משהו עמוק יותר מתחת לפני השטח.


נהניתם? התעניינתם? אם תרצו, אתם מוזמנים לתת טיפ:

Buy Me a Coffee at ko-fi.com