להטיל לכסון סימולטני בתת-מרחב שמור, בערך

תת-מרחבים שמורים

כזכור, בסדרת הפוסטים על אלגברה לינארית הגענו להתעסק בשאלה הבאה: נתונה טרנספורמציה לינארית $latex T:V\to V$ ואנו רוצים למצוא בסיס שבו המטריצה שמייצגת את $latex T$ היא פשוטה. המקרה הטוב ביותר כבר טופל: ראינו כי $latex T$ מיוצגת בידי מטריצה אלכסונית אם ורק אם יש ל-$latex V$ בסיס שכולו מורכב מוקטורים עצמיים של $latex T$. אני רוצה להתחיל בלהיזכר מה הלך בהוכחה הזו.

מה שעשינו היה להראות שוקטורים עצמיים השייכים לערכים עצמיים שונים הם בלתי תלויים לינארית, במובן זה שאם $latex v_{1}+\dots+v_{k}=0$ כשכל $latex v_{i}$ הוא וקטור המקיים $latex T\left(v_{i}\right)=\lambda_{i}v_{i}$ עבור $latex \lambda_{i}$-ים שונים כולם, אז $latex v_{1}=\dots=v_{k}=0$. ואז בא איזה שלב מזוויע שבו כתבתי צירוף לינארי של אוספי וקטורים שכל אחד מהם הוא בסיס לתת-מרחב עצמי אחר… אבל בעצם, עם קצת יותר סימונים והגדרות, אפשר היה לעשות את זה טיפה פחות מזוויע.

את מה שעשינו אפשר היה לנסח גם כך: לכל ערך עצמי $latex \lambda_{i}$ הגדרנו תת-מרחב $latex U_{i}\subseteq V$ - “המרחב העצמי של $latex \lambda_{i}$” - של כל הוקטורים המקיימים $latex T\left(v\right)=\lambda_{i}v$ (כל הוקטורים העצמיים של $latex \lambda_{i}$ בתוספת וקטור האפס), ואז ראינו שמתקיים $latex V=U_{1}\oplus\dots\oplus U_{k}$, כאשר $latex U_{1},\dots,U_{k}$ הם כל המרחבים העצמיים של הערכים העצמיים של $latex T$. תזכורת: להגיד ש-$latex V=U_{1}\oplus\dots\oplus U_{k}$ (“$latex V$ הוא סכום ישר של $latex U_{1},\dots,U{}_{k}$”) אומר שכל איבר ב-$latex V$ ניתן לכתיבה כסכום $latex v_{1}+\dots+v_{k}$ של איברים מ-$latex U_{1},\dots,U_{k}$, ושכל המרחבים הללו זרים זה לזה, במובן זה שאם ניקח ולו אחד מהם ונוריד אותו מהסכום, אז לו וליתר הסכום לא יהיה איבר משותף השונה מ-0 (פורמלית $latex U_{i}\cap\left(U_{1}+\dots+U_{i-1}+U_{i+1}+\dots+U_{k}\right)=\left\{ 0\right\} $; אולי טבעי יותר לדרוש ש-$latex U_{i}\cap U_{j}=\left\{ 0\right\} $ וחסל אבל זו לא דרישה חזקה מספיק). זה תרגיל טוב להוכיח שהדרישה השניה שקולה לכך שדרך ההצגה של איבר ב-$latex V$ כסכום איברים מתתי-המרחבים תהיה יחידה.

עכשיו, לכתוב את $latex V$ כסכום ישר של תתי-מרחבים כלשהם זה דבר קל למדי - קחו כל בסיס שתרצו, חלקו את אברי הבסיס לכמה קבוצות שתרצו, ותת-המרחבים שנפרסים על ידי אברי הקבוצות (כל תת-מרחב נפרס על ידי אברי קבוצה אחת) יהוו סכום ישר שנותן את $latex V$. יש אינספור דרכים לפרק את $latex V$ כך, ורובן לא אומרות לנו משהו מועיל על הטרנספורמציה הלינארית $latex T$. העסק מתחיל להיות מעניין כאשר יש לנו תת-מרחב $latex W$ שמקיים את התכונה “כל מה שקורה ב-$latex W$ (על ידי $latex T$) נשאר ב-$latex W$”, ופורמלית $latex T\left(W\right)\subseteq W$ (התמונה של כל איבר ב-$latex W$ על ידי $latex T$ נמצאת גם היא ב-$latex W$). תת-מרחב כזה נקרא תת-מרחב שמור (ביחס ל-$latex T$).

מכיוון שבמבט ראשון אולי לא ברור למה זו הגדרה מעניינת, בואו ונבין ראשית כל מה ינבע מכך שאני יודע לכתוב את $latex V$ בתור סכום ישר $latex U\oplus W$ כאשר $latex U,W$ שניהם תתי-מרחבים שמורים של $latex T$. ניקח בסיס ל-$latex U$ ובסיס ל-$latex W$ ואז איחודם הוא בסיס ל-$latex V$ ואפשר להסתכל על המטריצה המיצגת של $latex T$ בבסיס הזה. אז אני טוען שהמטריצה המייצגת תורכב משני בלוקים - תת-מטריצות ריבועיות מסויימות, כך שכל שאר המטריצה שווה לאפס. משהו כזה: $latex \left[T\right]_{V}=\left[\begin{array}{cc}\left[T\right]_{U} & 0\\0 & \left[T\right]_{W}\end{array}\right]$ (כאן אני מתעלל בסימונים בצורה נוראית - $latex \left[T\right]_{V}$ כאן פירושו “המטריצה המייצגת של $latex T$ בבסיס שזה עתה דיברתי עליו של $latex V$; באופן כללי אין לסימון $latex \left[T\right]_{V}$ משמעות כי לכל בסיס של $latex V$ שניקח נקבל מטריצה מייצגת אחרת). שימו לב ששני הבלוקים של המטריצה אינם כוללים תוכן מקרי, אלא את המטריצה המייצגת של $latex T$ לפי הבסיסים של תתי-המרחבים. הסיבה שבגללה זה עובד היא שאם נפעיל את $latex T$ על איבר בסיס של $latex U$ נקבל איבר ב-$latex U$ ולכן הוא יוצג כצירוף לינארי של אברי $latex U$ בלבד; אברי $latex W$ לא משתתפים בכלל במשחק. לכן על עמודה שמתאימה לאיבר בסיס של $latex U$ מכילה אפסים בשורות שמתאימות לבסיס של $latex W$, ואותו הדבר גם עבור העמודות שמתאימות לאברי בסיס של $latex W$. אותיר לכם לכתוב את ההוכחה הפורמלית לעצמכם אם אתם עוד לא משוכנעים.

מכאן ממשיכים באינדוקציה ומקבלים את התוצאה הכללית: אם $latex V=V_{1}\oplus\dots\oplus V_{k}$ כך ש-$latex V_{i}$ הם תתי-מרחבים שמורים של $latex T$, אז כאשר מייצגים את $latex T$ בבסיס שהוא איחוד הבסיסים של אותם תת-מרחבים, $latex T$ היא מטריצה בת $latex k$ בלוקים. מה שמעניין אותנו עכשיו הוא אם אפשר להגיד עוד משהו על האופן שבו $latex T$ מתפרקת בין כל תתי-המרחבים השמורים, וכמובן לשאול את עצמנו האם פירוק כזה קיים בכלל.

תתי-מרחבים שמורים הם הכללה ברורה של מרחבים עצמיים. אם $latex U$ הוא מרחב עצמי של טרנספורמציה $latex T$ הוא בוודאי יהיה תת-מרחב שמור שלה, כי כל מה שהפעלת $latex T$ על איבר ב-$latex U$ עושה היא לכפול אותו בסקלר, וזו פעולה שמשאירה את התוצאה בתוך התת-מרחב מעצם הההגדרה של תת-מרחב. למעשה, אם $latex v$ הוא וקטור עצמי אז תת-המרחב שנפרש על ידו בלבד הוא תת-מרחב שמור. זה מבהיר לנו מייד מדוע אם יש למרחב בסיס של וקטורים עצמיים אז $latex T$ לכסינה בבסיס זה - במקרה זה אפשר לפרק את $latex V$ לסכום ישר של $latex n$ תתי-מרחבים שכל אחד מהם ממימד 1, ולכן המטריצה שמייצגת את $latex T$ היא מטריצת “בלוקים” שבה כל בלוק הוא מטריצה מסדר $latex 1\times1$. אין כאן שום רעיון חדש - הנימוק שכבר הבאתי לכך שטרנספורמציה היא לכסינה אם יש בסיס של וקטורים עצמיים השתמש באותם נימוקים שבהם השתמשתי כאן כדי להסביר איך מתקבלת מטריצת בלוקים - אבל זו עדיין דרך מחשבה נחמדה.

אם $latex W\subset V$ הוא תת-מרחב שמור של $latex T$, אז אפשר להסתכל על $latex T$ כאשר היא מצומצמת רק לתת-מרחב $latex W$. בואו נגדיר את זה פורמלית כדי למנוע בלבול: יש לנו טרנספורמציה $latex T:V\to V$, ואפשר להגדיר טרנספורמציה חדשה $latex T_{W}:W\to W$ שפשוט מוגדרת בתור $latex T_{W}\left(w\right)=T\left(w\right)$ לכל $latex w\in W$. הנקודה היא שבגלל ש-$latex T_{W}$ מוגדרת על מרחב קטן יותר, קל יותר לחקור אותה - למשל, המטריצה המייצגת שלה תהיה קטנה יותר. עוד תכונה מעניינת שתהיה רלוונטית בהמשך היא שהפולינום המינימלי של $latex T_{W}$ מחלק את הפולינום המינימלי של $latex T$, אבל הם ממש לא חייבים להיות זהים. למה הוא מחלק? ובכן, אם $latex m\left(T\right)$ היא טרנספורמציית האפס על $latex V$ זה אומר שהיא מחזירה 0 לכל איבר של $latex V$ ולכן בפרט לכל איבר של $latex W$, ולכן $latex p$ הוא פולינום שמאפס את $latex T_{W}$; אבל כזכור, הפולינום המינימלי של $latex T_{W}$ מחלק כל פולינום אחר שמאפס את $latex T_{W}$.

לכסון סימולטני

בואו נעבור להמחשה של השימוש במושג של תת-מרחבים שמורים - לכסון סימולטני של טרנספורמציות (או מטריצות; זכרו שעבורנו זה אותו הדבר). בואו נניח ש-$latex S,T$ הם שני אופרטורים לכסינים; זה אומר שקיים בסיס שבו $latex T$ מיוצגת על ידי מטריצה אלכסונית, וקיים בסיס שבו $latex S$ מיוצגת על ידי מטריצה אלכסונית, אבל האם קיים בסיס שבו שתיהן גם יחד מיוצגות על ידי מטריצה אלכסונית? התשובה היא שלא תמיד; קל לראות שהכרחי שהן יתחלפו, כלומר שיתקיים $latex ST=TS$ (זכרו שטרנספורמציות ומטריצות לא מתחלפות תמיד בכפל - נסו למצוא דוגמאות!). הסיבה לכך היא שמטריצות אלכסוניות כן מתחלפות בכפל, ולכן אם $latex S,T$ ניתנות בו זמנית להצגה בידי מטריצות אלכסוניות הן אכן יתחלפו בכפל. זו דוגמה לתנאי הכרחי, אבל מה שמפתיע כאן הוא שהוא גם מספיק: שתי טרנספורמציות לכסינות הן בעלות לכסון משותף אם ורק אם הן מתחלפות בכפל. למעשה, ההוכחה שאציג כעת עובדת גם אם יש יותר משתי טרנספורמציות - אפילו עבור מספר אינסופי שלהן, כל עוד כולן לכסינות וכל זוג טרנספורמציות מתחלפות בכפל.

תכונת ההתחלפות-בכפל תועיל לי באופן הבא: נניח של-$latex T$ יש ערך עצמי $latex \lambda$, אז המרחב העצמי השייך לערך העצמי הזה הוא בעצם הגרעין של הטרנספורמציה $latex T-\lambda I$, ואם $latex T$ מתחלף עם $latex S$ כך גם הטרנספורמציה $latex T-\lambda I$. כעת אני יכול לטעון טענה כללית קצת יותר: אם $latex U,S$ טרנספורמציות לינאריות שמתחלפות בכפל, אז הגרעין של $latex U$ הוא תת-מרחב שמור של $latex S$, שהרי אם $latex u$ נמצא בגרעין הזה נקבל ש-$latex US\left(u\right)=SU\left(u\right)=S\left(0\right)=0$, כלומר גם $latex S\left(u\right)$ בגרעין של $latex U$.

מכאן נובע המשפט על לכסינות סימולטנית כמעט מאליו: אם לכל הטרנספורמציות יש רק ערך עצמי אחד אז כל בסיס שנבחר ילכסן את כולן בו זמנית (זכרו שהן לכסינות, כלומר הריבוי הגיאומטרי של הערך העצמי היחיד של כל אחת מהן הוא מימד $latex V$). בואו נניח אם כן שיש $latex T$ עם יותר מערך עצמי אחד, $latex \lambda_{1},\dots,\lambda_{t}$. זה מגדיר פירוק של $latex V$ לתת-מרחבים עצמיים: $latex V=W_{1}\oplus\dots\oplus W_{t}$ כש-$latex W_{i}$ הוא המרחב העצמי של $latex T$ שמתאים לערך העצמי $latex i$. כעת בואו ניקח טרנספורמציה אחרת $latex S$. אני בהחלט לא יכול לומר ש-$latex W_{i}$ הוא מרחב עצמי שלה, אבל בגלל שהיא מתחלפת עם $latex T$ אני בהחלט כן יכול לומר שהוא תת-מרחב שמור שלה, מהנימוק שהבאתי קודם (במקרה הזה, $latex U=T-\lambda I$). מה שנותר עכשיו לשים לב אליו הוא שכל $latex S$ היא לכסינה גם כשהיא מצומצמת ל-$latex W_{i}$ כי הפולינום המינימלי שלה ב-$latex W_{i}$ מחלק את הפולינום המינימלי שלה ב-$latex V$ (כאן אני מתבסס על טענה שטרם הוכחתי - שמטריצה היא לכסינה אם ורק אם לפולינום המינימלי שלה אין שורשים מרובים), ולכן אפשר באינדוקציה להניח שכל הצמצומים של הטרנספורמציות על $latex W_{i}$ הן לכסינות סימולטנית ולסיים על ידי איחוד כל הבסיסים המלכסנים-סימולטנית של כל ה-$latex W_{i}$.

למי שנראה לו שרימתי עם האינדוקציה בסוף, שימו לב לכך שבמרחב ממימד 1 כל בחירת בסיס “תלכסן סימולטנית” את כל הטרנספורמציות כי מטריצה $latex 1\times1$ היא תמיד אלכסונית; ושבגלל שבחרתי לעבוד עם $latex T$ שיש לה יותר מערך עצמי אחד, יש לה יותר מ-$latex W_{i}$ אחד ולכן המימד של כולם קטן יותר מהמימד של $latex V$ ואפשר להשתמש באינדוקציה. ההוכחה הזו מבליטה היטב את הכוח שבדיבור על תתי-מרחבים שמורים - הם מאפשרים להוכיח דברים בשיטת הפרד ומשול.

הטלות

בואו נשכח לרגע מתתי-מרחבים שמורים ונדבר על פירוק כלשהו לסכום ישר, $latex V=W_{1}\oplus\dots\oplus W_{k}$. בכל פירוק שכזה יש טרנספורמציות לינאריות שמאפיינות את הפירוק בדיוק כשם ש-$latex W_{1},\dots,W_{k}$ מאפיינות אותו - ההטלות למרחבים $latex W_{1},\dots,W_{k}$. פורמלית נהוג להגדיר באלגברה לינארית הטלה בתור כל טרנספורמציה לינארית $latex T:V\to V$ המקיימת $latex T^{2}=T$. בואו נבין למה: נסמן $latex U=\mbox{Im}T$, ניקח בסיס ל-$latex U$ ונשלים אותו לבסיס של $latex V$ וניקח את אברי הבסיס שאינם של $latex U$ ונביט במרחב $latex U^{\prime}$ שהם פורשים - נקבל ש-$latex V=U\oplus U^{\prime}$, ושאת $latex T$ אפשר לתאר כך: אם $latex v=u+u^{\prime}$ כאשר $latex u\in U$ ו-$latex u^{\prime}\in U^{\prime}$ (קיימת בדיוק דרך אחת להציג כך את $latex v$) אז $latex T\left(v\right)=u$, כלומר $latex T$ לוקחת את הרכיב של $latex v$ שנמצא בתוך $latex U$ ומוחקת את היתר. זה מתאים לאינטואיציה שיש לנו לגבי הטלות “קלאסיות” (הטלות כאלו הן בדרך כלל ביחס למערכת צירים שבה הצירים מאונכים זה לזה; גם לכך נגיע בסדרת הפוסטים הזו, אבל עוד חזון למועד).

את הרעיון הזה אפשר להכליל למקרה של $latex V=W_{1}\oplus\dots\oplus W_{k}$. במקרה הזה, כל וקטור $latex v$ ניתן להציג בצורה יחידה כ-$latex v=w_{1}+\dots+w_{k}$ כאשר $latex w_{i}\in W_{i}$; נגדיר טרנספורמציה לינארית $latex E_{i}:V\to V$ על ידי $latex E_{i}\left(v\right)=w_{i}$. קל לראות שזוהי הטלה, כלומר $latex E_{i}^{2}=E_{i}$וקל לראות ש=$latex \mbox{Im}E_{i}=W_{i}$. מההגדרה נובע גם כמעט מייד ש-$latex E_{i}E_{j}=0$ אם $latex i\ne j$, ועם עוד טיפה עבודה אפשר לראות ש-$latex I=\sum E_{i}$, כלומר הסכום של כל ההטלות הללו נותן לנו את טרנספורמציית הזהות.

מה שבאמת מעניין הוא שכל קבוצה של $latex k$ הטלות $latex E_{1},\dots,E_{k}$ שמקיימות את התכונה שהרכבה של שתיים מהן היא אפס וסכום כולן הוא הזהות מגדירות פירוק של $latex V$ לסכום ישר של מרחבים שהם התמונות של ההטלות. גם זו טענה קלה יחסית אבל אוכיח אותה כאן כי היא לא מיידית כמו הכיוון השני. לפני כן רק אסביר לאן אני חותר עם זה - לב האתגר במשפט הפירוק הפרימרי (שהוא המטרה העיקרית של הפוסט הזה ואחד מה”גביעים הקדושים” בסדרת הפוסטים כולה באופן כללי) הוא למצוא הטלות שמקיימות תכונות מסויימות, ואז הפירוק נובע מהן בדיוק על פי המשפט שזה עתה אוכיח.

טוב, אז מה עושים? ראשית מגדירים $latex W_{i}=\mbox{Im}E_{i}$. עכשיו צריך להראות גם שכל איבר ב-$latex V$ ניתן לכתיבה כסכום של איברים ב-$latex W_{i}$-ים הללו, וגם שדרך ההצגה הזו היא יחידה. התכונה הראשונה נובעת מכך ש-$latex I=\sum E_{i}$: פשוט נשים לב לכך ש-$latex v=I\left(v\right)=\sum E_{i}\left(v\right)$ והנה קיבלנו הצגה של $latex v$ כסכום של איברים ב-$latex W_{i}$. כדי לראות שדרך ההצגה הזו היא יחידה, בואו קודם כל נשים לב לכך שאם $latex v\in W_{i}$ אז $latex E_{i}\left(v\right)=v$ ואילו $latex E_{j}\left(v\right)=0$. למה? כי אם $latex v\in W_{i}$ זה אומר ש-$latex v$ הוא בתמונה של $latex E_{i}$, כלומר $latex v=E_{i}\left(u\right)$, ולכן $latex E_{i}\left(v\right)=E_{i}^{2}\left(u\right)=E_{i}\left(u\right)=v$ ובדומה, $latex E_{j}\left(v\right)=E_{j}E_{i}\left(u\right)=0$.

כעת, אם $latex v=w_{1}+\dots+w_{k}$ אז מהתכונות לעיל נובע ש-$latex E_{i}\left(v\right)=w_{i}$ - אבל הערך של $latex E_{i}\left(v\right)$ ודאי אינו תלוי באופן שבו אנו בוחרים לפרק את $latex v$ לסכום! במילים אחרות, גם אם היינו כותבים $latex v=\alpha_{1}+\dots+\alpha_{k}$ כך ש-$latex \alpha_{i}\in W_{i}$ היינו מקבלים $latex E_{i}\left(v\right)=\alpha_{i}$ ולכן $latex w_{i}=\alpha_{i}$ ודרך ההצגה הזו היא יחידה.

עכשיו אפשר לחזור למרחבים שמורים. מה שמעניין אותנו הוא השאלה הבאה: נתון פירוק $latex V=W_{1}\oplus\dots\oplus W_{k}$ ונתונה טרנספורמציה $latex T$ - מתי כל המרחבים $latex W_{i}$ הם תתי-מרחבים שמורים של $latex T$? התשובה מקסימה, לטעמי, באלגנטיות שלה: אם ורק אם $latex T$ מתחלפת עם ההטלות $latex E_{i}$ המתאימות למרחבים.

כיוון אחד הוא קלי קלות: אם $latex T$ מתחלפת עם $latex E_{i}$ ו-$latex w\in W_{i}$ אז $latex T\left(w\right)=TE_{i}\left(w\right)=E_{i}T\left(w\right)\in W$ כשסימן השייכות בסוף נובע מכך ש-$latex W_{i}$ הוא תמונת $latex E_{i}$. מה שמעניין הוא הכיוון השני, להראות ש-$latex T$ מתחלפת עם $latex E_{i}$.

אם כן, הבה וניקח $latex v\in V$ כלשהו ונפרק אותו לרכיביו, $latex v=\sum w_{i}$. אז $latex T\left(v\right)=\sum T\left(w_{i}\right)=\sum u_{i}$ כאשר $latex u_{i}\in W_{i}$ - זה נובע מכך שמדובר על תתי-מרחבים שמורים של $latex T$. כעת הבה ונפעיל על כל זה הטלה: $latex E_{i}T\left(v\right)=u_{i}$ (מאותן סיבות שכבר ראינו עד כה). מצד שני, $latex TE_{i}\left(v\right)=T\left(w_{i}\right)=u_{i}=E_{i}T\left(v\right)$, והנה קיבלנו ש-$latex TE_{i}=ET_{i}$ (כי ההוכחה הייתה על $latex v$ כלשהו).

הדבר הבא שאני רוצה להראות הוא אפיון אלטרנטיבי ללכסינות, שבכלל לא מדבר על ערכים עצמיים, בסיסים, ריבוי אלגברי וגאומטרי ושום דבר דומה לזה, אלא רק על הטלות. בואו נתחיל מכך שאם $latex T$ לכסינה עם ערכים עצמיים $latex \lambda_{1},\dots,\lambda_{k}$ אז כפי שכבר אמרתי מאות פעמים, אפשר לפרק את $latex V$ לסכום של מרחבים עצמיים. בואו ניקח את $latex E_{1},\dots,E_{k}$ להיות ההטלות על אותם מרחבים עצמיים, אז כמו תמיד הן יקיימו $latex I=\sum E_{i}$ ו-$latex E_{i}E_{j}=0$ לכל $latex i\ne j$. יופי. רק שהן יקיימו הפעם תכונה נוספת: $latex T=\sum\lambda_{i}E_{i}$. למה? ובכן, קחו $latex v\in V$ כלשהו, אז כמקודם $latex v=I\left(v\right)=\sum E_{i}\left(v\right)$, ומכיוון ש-$latex E_{i}\left(v\right)$ נמצא במרחב העצמי $latex W_{i}$ אז $latex T\left(E_{i}\left(v\right)\right)=\lambda_{i}E_{i}\left(v\right)$, כלומר $latex T\left(v\right)=\sum\lambda_{i}E_{i}\left(v\right)$ לכל $latex v$, ולכן $latex T=\sum\lambda_{i}E_{i}$.

מסתבר שהתכונה הזו היא גם מספיקה כדי ש-$latex T$ תהיה לכסינה. במילים אחרות, $latex T$ לכסינה אם קיימים סקלרים שונים $latex \lambda_{1},\dots,\lambda_{k}$ וטרנספורמציות לינאריות $latex E_{1},\dots,E_{k}$ שונות מאפס כך ש-$latex T=\sum\lambda_{i}E_{i}$ ו-$latex I=\sum E_{i}$ ו-$latex E_{i}E_{j}=0$ (ובאופן צפוי, $latex \lambda_{i}$ הם הערכים העצמיים שלה, ו-$latex E_{i}^{2}=E_{i}$ כך ש-$latex E_{i}$ הן הטלות). ההוכחה היא תרגיל טוב ולא שונה כל כך ממה שכבר ראינו אז אוותר עליה. במקום זה בואו נראה שימוש מיידי של התוצאה הזו: אם $latex T=\sum\lambda_{i}E_{i}$, מהו $latex T^{2}$? לכאורה על פי חוקי הכפל נקבל $latex T^{2}=\sum_{i,j}\lambda_{i}\lambda_{j}E_{i}E_{j}$, אבל אם נשתמש בכך ש-$latex E_{i}E_{j}=0$ ובכך ש-$latex E_{i}^{2}=E_{i}$ נקבל ש-$latex T^{2}=\sum\lambda_{i}^{2}E_{i}$, ובאופן כללי לא קשה לראות שאם $latex p$ הוא פולינום כלשהו אז $latex p\left(T\right)=\sum p\left(\lambda_{i}\right)E_{i}$. לא רק שהאבחנה הזו תעזור לנו בהמשך, היא כבר כעת מוכיחה מייד שאם יש לנו טרנספורמציה $latex T$, אז הערכים העצמיים של $latex p\left(T\right)$ הם בדיוק הפעלת $latex p$ על הערכים העצמיים של $latex T$ - לא תוצאה טריוויאלית כלל ממבט ראשון.

כעת אוכיח סוף סוף את הקריטריון ללכסינות שמבוסס על הפולינום המינימלי: טרנספורמציה היא לכסינה אם ורק אם לפולינום המינימלי שלה אין שורש מרובה (כלומר, הוא מהצורה $latex \left(x-\lambda_{1}\right)\cdots\left(x-\lambda_{k}\right)$ כאשר כל ה-$latex \lambda_{i}$ שונים זה מזה).

נתחיל מהכיוון הקל. נניח של-$latex T$ יש את הערכים העצמיים $latex \lambda_{1},\dots,\lambda_{k}$, אז $latex T=\sum\lambda_{i}E_{i}$. אם $latex p$ פולינום שמאפס את $latex T$, אז בהכרח $latex \sum p\left(\lambda_{i}\right)E_{i}=0$. על ידי הפעלות של $latex E_{j}$ על המשוואה הזו רואים שבהכרח נובע ממנה ש-$latex p\left(\lambda_{i}\right)=0$ לכל $latex \lambda_{i}$. כלומר: כל פולינום שמאפס את $latex T$ חייב להתאפס על ידי כל הערכים העצמיים. כמו כן, הפולינום $latex \left(x-\lambda_{1}\right)\cdots\left(x-\lambda_{k}\right)$ מאפס את כל הערכים העצמיים בו זמנית ולכן מאפס את $latex T$, ולכל פולינום שמחלק אותו קיים ערך עצמי שהוא לא מחלק. מסקנה: $latex \left(x-\lambda_{1}\right)\cdots\left(x-\lambda_{k}\right)$ הוא הפולינום המינימלי של $latex T$.

הכיוון השני הוא העיקר - נניח ש-$latex \left(x-\lambda_{1}\right)\cdots\left(x-\lambda_{k}\right)$ הוא הפולינום המינימלי של טרנספורמציה $latex T$ ונוכיח שהיא לכסינה ועם הערכים העצמיים $latex \lambda_{1},\dots,\lambda_{k}$. הרעיון יהיה לבנות הטלות שמקיימות את התכונות של המשפט שלעיל - סכומן הוא $latex I$, סכומן המשוקלל עם $latex \lambda_{1},\dots,\lambda_{k}$ הוא $latex T$, וההרכבה של כל זוג מהן היא אפס. האופן שבו מוצאים את ההטלות הללו הוא מקסים למדי ונותן לי תירוץ להציג יותר בפירוט משהו שכבר דיברתי עליו - אינטרפולציית לגראנז’.

הרעיון באינטרפולציית לגראנז’ הוא לבנות פולינום בעל ערכים נתונים. נותנים לי סדרת זוגות של נקודות $latex \left(x_{0},y_{0}\right),\left(x_{1},y_{1}\right),\dots,\left(x_{d},y_{d}\right)$ ודורשים ממני למצוא פולינום $latex g$ ממעלה $latex d$ לכל היותר שמקיים $latex g\left(x_{i}\right)=y_{i}$ לכל זוג מזוגות הנקודות (לא קשה להוכיח שאם קיים פולינום כזה, הוא יחיד - כל שני פולינומים ממעלה לכל היותר $latex d$ שמסכימים על $latex d+1$ נקודות הם זהים). הפתרון הוא להשתמש במעין בסיס (לא במובן הסטנדרטי) שמותאם לסדרת ה-$latex x_{i}$-ים הנתונה ומאפשרת, לכל סדרת $latex y_{i}$-ים, לבנות בקלות את $latex g$ המתאים. לב העניין הוא בבניה של פולינומים $latex p_{0},p_{1},\dots,p_{d}$ שכל אחד מהם מקיים $latex p_{i}\left(x_{j}\right)=\delta_{ij}$, כלומר הוא מתאפס על כל ה-$latex x$-ים פרט לאחד, ועליו הוא מקבל 1. פולינום כזה קל לבנות במפורש: $latex p_{i}\left(x\right)=\prod_{j\ne i}\frac{x-x_{j}}{x_{i}-x_{j}}$ (כאשר $latex \prod$ כאן מייצג מכפלה). הציבו בפולינום הזה $latex x_{i}$ ותראו מה מקבלים, ואחר כך חשבו מה קורה כשמציבים בו $latex x_{j}$ אחר.

עכשיו, אם ה-$latex p$-ים הללו נתונים לנו, אז את $latex g$ בונים בצורה הבאה: $latex g\left(x\right)=\sum y_{i}p_{i}\left(x\right)$. כשמציבים ב-$latex g$ את $latex x_{i}$, מה שנשאר כשהעשן מתפזר הוא $latex y_{i}$. הדבר הזה מאוד דומה להטלות, שבתורן מאוד דומות לבסיסים למרחבים וקטוריים (ובפרט לבסיס אורתונורמליים, אבל עוד חזון למועד…) ולא סתם - הנה לנו דוגמה יפה למקום שבו כל הקשרים הללו באים לידי ביטוי.

איך כל זה קשור לענייננו, תשאלו? פשוט מאוד: ניקח את סדרת ה-$latex x$-ים שלנו להיות $latex \lambda_{1},\dots,\lambda_{k}$ ונבנה פולינומים $latex p_{1},\dots,p_{k}$ מתאימים. כעת נבצע בעזרתם אינטרפולציה לשני פולינומים: אחד שמחזיר 1 על הכל, ושני שאם הוא מקבל $latex x$ הוא מחזיר $latex x$. מנוסחת האינטרפולציה שלנו נקבל:

$latex 1=\sum p_{i}$

$latex x=\sum\lambda_{i}p_{i}$

(אני מניח כאן באופן סמוי ש-$latex k>1$ אבל זה בסדר כי $latex k=1$ אומר ש-$latex T-\lambda I=0$ (פשוט הצבתי את $latex T$ בפולינום המינימלי) ולכן $latex T$ בבירור לכסינה).

עכשיו הטוויסט הסופי מגיע: נגדיר את $latex E_{i}=p_{i}\left(T\right)$. הצבנו את $latex T$ בפולינומי האינטרפולציה, וקיבלנו מייד שמתקיים:

$latex I=\sum E_{i}$

$latex T=\sum\lambda_{i}E_{i}$

טוב ויפה, אבל למה $latex E_{i}E_{j}=0$? או, טוב ששאלתם: כי $latex p$ בהכרח מחלק את $latex p_{i}p_{j}$, וזאת מכיוון ש-$latex p_{i}p_{j}$ הוא פולינום שמתאפס על כל $latex \lambda_{1},\dots,\lambda_{j}$ ולכן בהכרח מכיל בתוכו רכיב מהצורה $latex \prod\left(x-\lambda_{i}\right)$ - הפולינום המינימלי בכבודו ובעצמו (כאן השתמשתי בהנחה שאין לפולינום המינימלי שורש מרובה).

הדבר האחרון שעוד צריך להשתכנע בו הוא שכל ה-$latex E_{i}$-ים שונים מאפס (זה תנאי הכרחי של המשפט שאותו לא הוכחתי). גם זה פשוט - אם $latex E_{i}=0$ זה אומר ש-$latex p_{i}\left(T\right)=0$ והנה מצאנו פולינום שמאפס את $latex T$ אבל דרגתו היא רק $latex k-1$, כלומר קטנה מדרגת הפולינום המינימלי. זה מסיים את הכל.

בפוסט הבא נגיע כבר למשפט כבד באמת - משפט הפירוק הפרימרי - אבל שימו לב שגם בפוסט הזה כבר כיסינו כברת דרך לא קטנה והצגנו רעיונות שהם חשובים למדי בהקשרים רבים, וכנראה שנפגוש עוד בהמשך הדרך בצורה רצינית כשנדבר על מרחבי מכפלה פנימית. בנוסף, גם ההוכחות כבר הפסיקו להיות טריוויאליות כמו שהיו ברוב העניינים עד כה - אבל לדעתי הן עדיין אלגנטיות ויפות ביותר, במיטב מסורת האלגברה הלינארית.


נהניתם? התעניינתם? אם תרצו, אתם מוזמנים לתת טיפ:

Buy Me a Coffee at ko-fi.com