משפט הפירוק הפרימרי

בפעם האחרונה שבה דיברתי על אלגברה לינארית המושג הדומיננטי היה זה של תת-מרחב שמור. כזכור, \( W\subseteq V \) הוא תת-מרחב שמור של טרנספורמציה לינארית \( T:V\to V \) אם \( T\left(W\right)\subseteq W \), והחשיבות של תתי-מרחבים כאלו נובעת מהעובדה שאפשר לצמצם את \( T \) אליהם - להגדיר טרנספורמציה \( T_{W}:W\to W \) כך ש-\( T_{W}\left(w\right)=T\left(w\right) \) על \( w\in W \). אם הצלחנו לפרק את \( V \) לסכום ישר של תתי-מרחבים שכולם תתי-מרחבים שמורים של \( T \), נובע מכך פירוק של \( T \) לסכום של טרנספורמציות פשוטות יותר, ומכאן נובעת הבנה יותר טובה של מה \( T \) עושה. המקרה הפשוט ביותר היה כאשר \( T \) הייתה לכסינה - במקרה זה אפשר היה לפרק את \( V \) לתתי-מרחבים שמורים שבכל אחד מהם \( T \) פועלת פשוט על ידי כפל בסקלר (ולכן מיוצגת על ידי מטריצה סקלרית - מטריצה אלכסונית שבאלכסון שלה יש תמיד אותו מספר). כפי שראינו, התכונה הזו הייתה שקולה לכך שהפולינום המינימלי שמאפס את \( T \) מתפרק לגורמים לינאריים שונים. בפוסט הזה נראה את ההכללה של התוצאה הזו עבור המקרה הכללי ביותר; ההכללה הזו נקראת משפט הפירוק הפרימרי. שמו של המשפט נובע כנראה מכך שהוא אינו סוף הסיפור אלא רק ההתחלה - גם אחרי הפירוק עדיין צריך להבין איך נראית \( T \) כשהיא מצומצמת לתתי-המרחבים שמשפט הפירוק נותן - אבל הוא הצעד הראשון (וההכרחי?) שיש לנקוט בו.

נתחיל מלצטט את המשפט, ואז נוכיח. כרגיל, נתחיל עם טרנספורמציה לינארית \( T:V\to V \), כאשר \( V \) הוא מרחב סוף-ממדי (בכל הדיון הנוכחי אנחנו לא מדברים על מרחבים אינסוף ממדיים; יש להם תורה דומה לזו שאני מציג כאן אבל היא מורכבת יותר ודורשת להכניס לתמונה עוד הרבה מושגים יפים שיוצגו בפעם אחרת). אם \( p \) הוא הפולינום המינימלי של \( T \) אז אפשר לכתוב אותו בתור מכפלה של חזקות של פולינומים אי פריקים (מתוקנים, כלומר עם מקדם מוביל 1) \( p=p_{1}^{r_{1}}\cdots p_{k}^{r_{k}} \). נגדיר את המרחבים \( W_{i} \) בתור \( W_{i}=\ker\left(p_{i}^{r_{i}}\left(T\right)\right) \) (כלומר, \( W_{i} \) הוא אוסף כל הוקטורים שמתאפסים על ידי הטרנספורמציה שמתקבלת כשמציבים את \( T \) ב-\( p_{i}^{r_{i}} \)), אז ה-\( W_{i} \)-ים הללו הם פירוק של \( V \) לתת-מרחבים שמורים של \( T \); והפולינום המינימלי של \( T_{W_{i}} \) הוא בדיוק \( p_{i}^{r_{i}} \).

למי שרוצה לוודא שהוא לא מאבד אותי, עכשיו זה זמן טוב לעצור ולהבין למה המשפט הזה הוא הכללה של לכסינות. מה הפולינום המינימלי אם \( T \) לכסינה? מהם \( W_{i} \) במקרה הזה?

נעבור להוכחה. הכלי שבו נשתמש כדי לפרק את \( V \) לתת-מרחבים הוא הטלות. כזכור, הטלה \( E \) היא טרנספורמציה לינארית שמקיימת \( E^{2}=E \). אם יש לנו קבוצה של טרנספורמציות \( E_{i} \) כך ש-\( \sum E_{i}=I \) ו-\( E_{i}E_{j}=0 \) לכל \( i\ne j \), אז הטרנספורמציות הן הטלות (נסו להוכיח שזה אכן נובע, זה קל) והתמונות של ההטלות הללו הן פירוק של \( V \) לסכום ישר של תתי-מרחבים. מכאן שהאתגר במשפט הפירוק הפרימרי הוא למצוא את ההטלות הנכונות. כאן תצטרכו לסמוך עלי לרגע - אני אציג את ההטלות, במה שייראה כמו קסם שבא משום מקום (אבל זה לא “משום מקום”; הרעיון מאחורי ההוכחה דומה להפליא לזה של הוכחת משפט השאריות הסיני), ואז נראה שהן עובדות.

לב העניין הוא הפולינום המינימלי \( p=p_{1}^{r_{1}}\cdots p_{k}^{r_{k}} \). לכל גורם \( i \) שלו, נגדיר פולינום \( q_{i}=\frac{p}{p_{i}^{r_{i}}} \), או במילים אחרות \( q_{i}=\prod_{j\ne i}p_{j}^{r_{j}} \) - “סיננו” את הגורם \( p_{i} \) על כל חזקותיו מתוך \( p \). כעת די ברור שהמחלק המשותף המקסימלי של כל הפולינומים \( q_{1},\dots,q_{k} \) הוא 1, ושפן אלגברי שאני שולף מהכובע ולא מוכיח כרגע הוא שבשל כך, קיימים פולינומים \( h_{1},\dots,h_{k} \) כך ש-\( \sum h_{i}q_{i}=1 \). זה מוביל אותנו להגדרה \( E_{i}=\left(h_{i}q_{i}\right)\left(T\right) \) ומהנוסחה \( \sum h_{i}q_{i}=1 \) אנחנו מקבלים מיידית ש-\( \sum E_{i}=I \).

אוקיי, אבל… מה? למה, למשל, \( E_{i}E_{j}=0 \)? ובכן, כי \( E_{i}E_{j}=\left(h_{i}q_{i}h_{j}q_{j}\right)\left(T\right) \), אבל \( h_{i} \) ו-\( h_{j} \) יחדיו כוללים את כל הרכיבים של \( p \), ולכן \( p|h_{i}h_{j} \), ולכן \( h_{i}q_{i}h_{j}q_{j} \) הוא פולינום שמתחלק על ידי הפולינום המינימלי של \( T \) ולכן כשמציבים בו את \( T \) מקבלים 0. פשוט למדי.

אם כן, ה-\( E_{i} \)-ים הללו הן אכן הטלות ולכן מפרקות את \( V \), אבל האם זה כמו שרצינו? לשם כך צריך להראות ש-\( E_{i}\left(V\right)=W_{i} \). נתחיל מהכיוון הקל. נניח ש-\( w\in E_{i}\left(V\right) \), אז זה אומר ש-\( E_{i}\left(w\right)=w \) (בשל התכונה \( E_{i}=E_{i}^{2} \)). מכאן שמתקיים:

\( p_{i}^{r_{i}}\left(T\right)\left(w\right)=p_{i}^{r_{i}}\left(T\right)E_{i}\left(w\right)=\left(p_{i}^{r_{i}}h_{i}q_{i}\right)\left(T\right)\left(w\right)=0 \)

כשהשוויון האחרון נובע שוב מכך ש-\( p_{i}^{r_{i}}h_{i}q_{i} \) מתחלק על ידי הפולינום המינימלי של \( T \).

בכיוון השני, נניח ש-\( w\in\ker\left(p_{i}^{r_{i}}\left(T\right)\right) \). היינו רוצים להראות ש-\( w\in E_{i}\left(V\right) \), אבל יהיה לנו יותר קל להראות תכונה משלימה: ש-\( E_{j}\left(w\right)=0 \) לכל \( j\ne i \), מה שיסיים מייד את ההוכחה כי אז \( w=I\left(w\right)=\sum E_{j}\left(w\right)=E_{i}\left(w\right)\in E_{i}\left(V\right) \). כעת, \( p_{i}^{r_{i}} \) מחלק את \( h_{j} \) לכל \( j\ne i \) ולכן \( E_{j}\left(w\right)=\left(h_{j}q_{j}\left(T\right)\right)\left(w\right)=0 \) כי אפשר להציג את \( h_{j}q_{j}\left(T\right) \) כמכפלה של \( p_{i}^{r_{i}}\left(T\right) \) (שמאפס את \( w \) ולכן המכפלה תצא 0) בעוד איזה פולינום לא מעניין.

יפה. קיבלנו ש-\( W_{i}=E_{i}\left(V\right) \) ולכן \( V=W_{1}\oplus\dots\oplus W_{k} \). קיבלנו פירוק של \( V \) למרחבים שהצהרנו עליהם מראש, אבל למה הם תת-מרחבים שמורים של \( T \)? ובכן, אם \( p_{i}^{r_{i}}\left(T\right)\left(w\right)=0 \) אז \( p_{i}^{r_{i}}\left(T\right)\left(T\left(w\right)\right)=T\left(p_{i}^{r_{i}}\left(T\right)\left(w\right)\right)=T\left(0\right)=0 \) - כאן השתמשנו בכך שטרנספורמציה מתחלפת בכפל עם כל פולינום בה. נותר רק להראות ש-\( p_{i}^{r_{i}} \) הוא הפולינום המינימלי של \( T_{W_{i}} \). את זה שהוא מאפס את \( T_{W_{i}} \) קל לראות ישירות מההגדרה של \( W_{i} \) (הרי \( W_{i} \) הוגדר בתור אוסף האיברים שמאופסים על ידי \( p_{i}^{r_{i}}\left(T\right) \), כלומר באופן שמבטיח ש-\( p_{i}^{r_{i}}\left(T\right) \) יהיה אפס בכל \( W_{i} \), ולכן \( p_{i}^{r_{i}}\left(T_{W_{i}}\right) \) הוא אפס בכל מקום שבו הוא מוגדר). למה הוא מינימלי? נניח ש-\( q \) הוא פולינום כלשהו שמאפס את \( T_{W_{i}} \). אז \( q\cdot q_{i} \) יאפס את כל \( T \) (כי \( q\left(T\right) \) מתאפס על כל \( W_{i} \), ואילו \( q_{i}\left(T\right) \) יתאפס על כל \( W_{j} \) עבור \( j\ne i \)), ומכאן ש-\( p \) מחלק את \( q\cdot q_{i} \). אבל ב-\( q_{i} \) בכלל לא מופיע הגורם \( p_{i}^{r_{i}} \) של \( p \) ולכן הוא חייב להופיע בשלמותו ב-\( q \), כלומר \( q \) מתחלק על ידי \( p_{i}^{r_{i}} \), ומכאן שזהו אכן הפולינום המינימלי. סוף ההוכחה.

למרות שאני זוכר בבעתה את הבעתה שלי כשנתקלתי במשפט לראשונה, בסיכומו של דבר המשפט הוא אינו קשה במיוחד, אם כי הוא דורש היכרות כלשהי עם פולינומים שבדרך כלל אין לסטודנטים שרק מתחילים ללמוד אלגברה לינארית (התעסקות שכזו עם פולינומים נפוצה יותר בקורסים באלגברה מופשטת). הפסגה הזו, שהיא בעצם יותר רמה מפסגה, נראית לי כמו מקום טוב לעצור בינתיים את הריצה שלנו אחרי צורות קנוניות של מטריצות (שסופה הוא בצורת ז’ורדן, שהיא דרך כללית למדי להבין מה קורה בתוך ה-\( W_{i} \)-ים הללו), אם כי אחזור אליה בהמשך; לעת עתה נעבור לדבר החל מהפוסט הבא על מושג שעליו באמת אפשר לדבר מכאן ועד אינסוף - מכפלה פנימית.


נהניתם? התעניינתם? אם תרצו, אתם מוזמנים לתת טיפ:

Buy Me a Coffee at ko-fi.com