משפט הפירוק הפרימרי

בפעם האחרונה שבה דיברתי על אלגברה לינארית המושג הדומיננטי היה זה של תת-מרחב שמור. כזכור, $latex W\subseteq V$ הוא תת-מרחב שמור של טרנספורמציה לינארית $latex T:V\to V$ אם $latex T\left(W\right)\subseteq W$, והחשיבות של תתי-מרחבים כאלו נובעת מהעובדה שאפשר לצמצם את $latex T$ אליהם - להגדיר טרנספורמציה $latex T_{W}:W\to W$ כך ש-$latex T_{W}\left(w\right)=T\left(w\right)$ על $latex w\in W$. אם הצלחנו לפרק את $latex V$ לסכום ישר של תתי-מרחבים שכולם תתי-מרחבים שמורים של $latex T$, נובע מכך פירוק של $latex T$ לסכום של טרנספורמציות פשוטות יותר, ומכאן נובעת הבנה יותר טובה של מה $latex T$ עושה. המקרה הפשוט ביותר היה כאשר $latex T$ הייתה לכסינה - במקרה זה אפשר היה לפרק את $latex V$ לתתי-מרחבים שמורים שבכל אחד מהם $latex T$ פועלת פשוט על ידי כפל בסקלר (ולכן מיוצגת על ידי מטריצה סקלרית - מטריצה אלכסונית שבאלכסון שלה יש תמיד אותו מספר). כפי שראינו, התכונה הזו הייתה שקולה לכך שהפולינום המינימלי שמאפס את $latex T$ מתפרק לגורמים לינאריים שונים. בפוסט הזה נראה את ההכללה של התוצאה הזו עבור המקרה הכללי ביותר; ההכללה הזו נקראת משפט הפירוק הפרימרי. שמו של המשפט נובע כנראה מכך שהוא אינו סוף הסיפור אלא רק ההתחלה - גם אחרי הפירוק עדיין צריך להבין איך נראית $latex T$ כשהיא מצומצמת לתתי-המרחבים שמשפט הפירוק נותן - אבל הוא הצעד הראשון (וההכרחי?) שיש לנקוט בו.

נתחיל מלצטט את המשפט, ואז נוכיח. כרגיל, נתחיל עם טרנספורמציה לינארית $latex T:V\to V$, כאשר $latex V$ הוא מרחב סוף-ממדי (בכל הדיון הנוכחי אנחנו לא מדברים על מרחבים אינסוף ממדיים; יש להם תורה דומה לזו שאני מציג כאן אבל היא מורכבת יותר ודורשת הכנסה לתמונה של עוד הרבה מושגים יפים שיוצגו בפעם אחרת). אם $latex p$ הוא הפולינום המינימלי של $latex T$ אז אפשר לכתוב אותו בתור מכפלה של חזקות של פולינומים אי פריקים (מתוקנים, כלומר עם מקדם מוביל 1) $latex p=p_{1}^{r_{1}}\cdots p_{k}^{r_{k}}$. נגדיר את המרחבים $latex W_{i}$ בתור $latex W_{i}=\ker\left(p_{i}^{r_{i}}\left(T\right)\right)$ (כלומר, $latex W_{i}$ הוא אוסף כל הוקטורים שמתאפסים על ידי הטרנספורמציה שמתקבלת כשמציבים את $latex T$ ב-$latex p_{i}^{r_{i}}$), אז ה-$latex W_{i}$-ים הללו הם פירוק של $latex V$ לתת-מרחבים שמורים של $latex T$; והפולינום המינימלי של $latex T_{W_{i}}$ הוא בדיוק $latex p_{i}^{r_{i}}$.

למי שרוצה לוודא שהוא לא מאבד אותי, עכשיו זה זמן טוב לעצור ולהבין למה המשפט הזה הוא הכללה של לכסינות. מה הפולינום המינימלי אם $latex T$ לכסינה? מהם $latex W_{i}$ במקרה הזה?

נעבור להוכחה. הכלי שבו נשתמש כדי לפרק את $latex V$ לתת-מרחבים הוא הטלות. כזכור, הטלה $latex E$ היא טרנספורמציה לינארית שמקיימת $latex E^{2}=E$. אם יש לנו קבוצה של טרנספורמציות $latex E_{i}$ כך ש-$latex \sum E_{i}=I$ ו-$latex E_{i}E_{j}=0$ לכל $latex i\ne j$, אז הטרנספורמציות הן הטלות (נסו להוכיח שזה אכן נובע, זה קל) והתמונות של ההטלות הללו הן פירוק של $latex V$ לסכום ישר של תתי-מרחבים. מכאן שהאתגר במשפט הפירוק הפרימרי הוא למצוא את ההטלות הנכונות. כאן תצטרכו לסמוך עלי לרגע - אני אציג את ההטלות, במה שייראה כמו קסם שבא משום מקום (אבל זה לא “משום מקום”; הרעיון מאחורי ההוכחה דומה להפליא לזה של הוכחת משפט השאריות הסיני), ואז נראה שהן עובדות.

לב העניין הוא הפולינום המינימלי $latex p=p_{1}^{r_{1}}\cdots p_{k}^{r_{k}}$. לכל גורם $latex i$ שלו, נגדיר פולינום $latex q_{i}=\frac{p}{p_{i}^{r_{i}}}$, או במילים אחרות $latex q_{i}=\prod_{j\ne i}p_{j}^{r_{j}}$ - “סיננו” את הגורם $latex p_{i}$ על כל חזקותיו מתוך $latex p$. כעת די ברור שהמחלק המשותף המקסימלי של כל הפולינומים $latex q_{1},\dots,q_{k}$ הוא 1, ושפן אלגברי שאני שולף מהכובע ולא מוכיח כרגע הוא שבשל כך, קיימים פולינומים $latex h_{1},\dots,h_{k}$ כך ש-$latex \sum h_{i}q_{i}=1$. זה מוביל אותנו להגדרה $latex E_{i}=\left(h_{i}q_{i}\right)\left(T\right)$ ומהנוסחה $latex \sum h_{i}q_{i}=1$ אנחנו מקבלים מיידית ש-$latex \sum E_{i}=I$.

אוקיי, אבל… מה? למה, למשל, $latex E_{i}E_{j}=0$? ובכן, כי $latex E_{i}E_{j}=\left(h_{i}q_{i}h_{j}q_{j}\right)\left(T\right)$, אבל $latex h_{i}$ ו-$latex h_{j}$ יחדיו כוללים את כל הרכיבים של $latex p$, ולכן $latex p|h_{i}h_{j}$, ולכן $latex h_{i}q_{i}h_{j}q_{j}$ הוא פולינום שמתחלק על ידי הפולינום המינימלי של $latex T$ ולכן כשמציבים בו את $latex T$ מקבלים 0. פשוט למדי.

אם כן, ה-$latex E_{i}$-ים הללו הן אכן הטלות ולכן מפרקות את $latex V$, אבל האם זה כמו שרצינו? לשם כך צריך להראות ש-$latex E_{i}\left(V\right)=W_{i}$. נתחיל מהכיוון הקל. נניח ש-$latex w\in E_{i}\left(V\right)$, אז זה אומר ש-$latex E_{i}\left(w\right)=w$ (בשל התכונה $latex E_{i}=E_{i}^{2}$). מכאן שמתקיים:

$latex p_{i}^{r_{i}}\left(T\right)\left(w\right)=p_{i}^{r_{i}}\left(T\right)E_{i}\left(w\right)=\left(p_{i}^{r_{i}}h_{i}q_{i}\right)\left(T\right)\left(w\right)=0$

כשהשוויון האחרון נובע שוב מכך ש-$latex p_{i}^{r_{i}}h_{i}q_{i}$ מתחלק על ידי הפולינום המינימלי של $latex T$.

בכיוון השני, נניח ש-$latex w\in\ker\left(p_{i}^{r_{i}}\left(T\right)\right)$. היינו רוצים להראות ש-$latex w\in E_{i}\left(V\right)$, אבל יהיה לנו יותר קל להראות תכונה משלימה: ש-$latex E_{j}\left(w\right)=0$ לכל $latex j\ne i$, מה שיסיים מייד את ההוכחה כי אז $latex w=I\left(w\right)=\sum E_{j}\left(w\right)=E_{i}\left(w\right)\in E_{i}\left(V\right)$. כעת, $latex p_{i}^{r_{i}}$ מחלק את $latex h_{j}$ לכל $latex j\ne i$ ולכן $latex E_{j}\left(w\right)=\left(h_{j}q_{j}\left(T\right)\right)\left(w\right)=0$ כי אפשר להציג את $latex h_{j}q_{j}\left(T\right)$ כמכפלה של $latex p_{i}^{r_{i}}\left(T\right)$ (שמאפס את $latex w$ ולכן המכפלה תצא 0) בעוד איזה פולינום לא מעניין.

יפה. קיבלנו ש-$latex W_{i}=E_{i}\left(V\right)$ ולכן $latex V=W_{1}\oplus\dots\oplus W_{k}$. קיבלנו פירוק של $latex V$ למרחבים שהצהרנו עליהם מראש, אבל למה הם תת-מרחבים שמורים של $latex T$? ובכן, אם $latex p_{i}^{r_{i}}\left(T\right)\left(w\right)=0$ אז $latex p_{i}^{r_{i}}\left(T\right)\left(T\left(w\right)\right)=T\left(p_{i}^{r_{i}}\left(T\right)\left(w\right)\right)=T\left(0\right)=0$ - כאן השתמשנו בכך שטרנספורמציה מתחלפת בכפל עם כל פולינום בה. נותר רק להראות ש-$latex p_{i}^{r_{i}}$ הוא הפולינום המינימלי של $latex T_{W_{i}}$. את זה שהוא מאפס את $latex T_{W_{i}}$ קל לראות ישירות מההגדרה של $latex W_{i}$ (הרי $latex W_{i}$ הוגדר בתור אוסף האיברים שמאופסים על ידי $latex p_{i}^{r_{i}}\left(T\right)$, כלומר באופן שמבטיח ש-$latex p_{i}^{r_{i}}\left(T\right)$ יהיה אפס בכל $latex W_{i}$, ולכן $latex p_{i}^{r_{i}}\left(T_{W_{i}}\right)$ הוא אפס בכל מקום שבו הוא מוגדר). למה הוא מינימלי? נניח ש-$latex q$ הוא פולינום כלשהו שמאפס את $latex T_{W_{i}}$. אז $latex q\cdot q_{i}$ יאפס את כל $latex T$ (כי $latex q\left(T\right)$ מתאפס על כל $latex W_{i}$, ואילו $latex q_{i}\left(T\right)$ יתאפס על כל $latex W_{j}$ עבור $latex j\ne i$), ומכאן ש-$latex p$ מחלק את $latex q\cdot q_{i}$. אבל ב-$latex q_{i}$ בכלל לא מופיע הגורם $latex p_{i}^{r_{i}}$ של $latex p$ ולכן הוא חייב להופיע בשלמותו ב-$latex q$, כלומר $latex q$ מתחלק על ידי $latex p_{i}^{r_{i}}$, ומכאן שזהו אכן הפולינום המינימלי. סוף ההוכחה.

למרות שאני זוכר בבעתה את הבעתה שלי כשנתקלתי במשפט לראשונה, בסיכומו של דבר המשפט הוא אינו קשה במיוחד, אם כי הוא דורש היכרות כלשהי עם פולינומים שבדרך כלל אין לסטודנטים שרק מתחילים ללמוד אלגברה לינארית (התעסקות שכזו עם פולינומים נפוצה יותר בקורסים באלגברה מופשטת). הפסגה הזו, שהיא בעצם יותר רמה מפסגה, נראית לי כמו מקום טוב לעצור בינתיים את הריצה שלנו אחרי צורות קנוניות של מטריצות (שסופה הוא בצורת ז’ורדן, שהיא דרך כללית למדי להבין מה קורה בתוך ה-$latex W_{i}$-ים הללו), אם כי אחזור אליה בהמשך; לעת עתה נעבור לדבר החל מהפוסט הבא על מושג שעליו באמת אפשר לדבר מכאן ועד אינסוף - מכפלה פנימית.


נהניתם? התעניינתם? אם תרצו, אתם מוזמנים לתת טיפ:

Buy Me a Coffee at ko-fi.com