בפוסט הקודם הצגתי מודולים בתור “זה כמו מרחב וקטורי רק מעל חוג אבל בעצם זה ממש לא כמו מרחב וקטורי כי תשכחו מכל מה שידעתם על מושגים כמו בסיס ופרישה”. המקבילה שלנו למרחב שנפרש על ידי וקטורים הייתה תת-מודול שנוצר על ידי איברים; וכאן היו לנו תופעות מוזרות כמו מודול שנוצר על ידי מספר סופי של איברים אבל יש לו תת-מודולים שאין להם קבוצה יוצרת סופית.
בפוסט הזה ננסה, בזהירות, להרים את השברים ולקחת מהם את מה שנזדקק לו בשביל משפט המבנה של מודולים נוצרים סופית מעל תחום ראשי.
הדבר הראשון שנעשה יהיה לנסות ולהציל את מושג הבסיס. באלגברה לינארית, קבוצה \( B \) היא בסיס למרחב וקטורי \( V \) מעל שדה \( F \) אם לכל \( v\in V \) קיים צירוף לינארי יחיד של אברי הבסיס שנותן אותו. כלומר, קיימים \( b_{1},\dots,b_{n}\in B \) ו-\( \lambda_{1},\dots,\lambda_{n}\in F \) כך ש-\( v=\sum\lambda_{i}b_{i} \), ודרך הייצוג הזו היא יחידה עד כדי פרמוטציה של האינדקסים של ה-\( \lambda_{i}b_{i} \). בנוסף, סימנו בתור \( \dim V \) את העוצמה של \( B \) וקראנו לזה המימד של \( V \).
במודולים דבר כזה לא בהכרח קיים, אבל אפשר לדבר על המקרה שבו הוא קיים. אנחנו אומרים ש-\( R \) מודול \( M \) הוא חופשי מעל הקבוצה \( A\subseteq M \) אם כל \( m\in M \) ניתן לכתיבה באופן יחיד בתור \( m=\sum_{i=1}^{n}r_{i}a_{i} \) עבור \( r_{1},\dots,r_{n}\in R \) ו-\( a_{1},\dots,a_{n}\in A \). לא כל מודול הוא חופשי, אבל לא קשה להראות שבהינתן חוג \( R \) וקבוצה \( A \) אז קיים \( R \)-מודול חופשי מעל \( A \): מגדירים את \( M \) הזה להיות הקבוצה של כל הביטויים מהצורה \( \sum_{i=1}^{n}r_{i}a_{i} \) (פורמלית: כל הפונקציות \( f:A\to R \) כך ש-\( f\left(a\right)=0 \) לכל \( a\in A \) למעט מספר סופי). לא קשה להראות שזה \( R \)-מודול חופשי, ושהוא יחיד עד כדי איזומורפיזם. יותר מכך, הוא מקיים את מה שנקרא תכונה אוניברסלית (מושג שטרם הבהרתי עד הסוף, גם בסדרת הפוסטים הזו), שאפשר לתאר בדיאגרמה הקומוטטיבית הבאה:
הדיאגרמה אומרת את הדבר הבא: לכל קבוצה \( A \) קיים \( R \)-מודול \( F\left(A\right) \) (זהו המודול החופשי מעל \( A \)) כך שאם \( M \) הוא \( R \)-מודול כלשהו וקיימת פונקציה \( \varphi:A\to M \) שמתאימה לכל איבר של \( A \) איבר ב-\( M \), אז קיים הומומורפיזם של מודולים \( \Phi:F\left(A\right)\to M \) כך ש-\( \varphi\left(a\right)=\Phi\left(a\right) \) (כאן אנחנו חושבים על \( a \) גם בתור איבר של \( A \) אבל גם בתור איבר של \( F\left(A\right) \); זו המשמעות של החץ מ-\( A \) אל \( F\left(A\right) \) שמסמל את העתקת הזהות). כלומר, אנחנו יכולים לחשוב על כל מודול ש”מערב” את \( A \) בתור תמונה של \( F\left(A\right) \); זה המודול ה”כללי ביותר” שמייצג את \( A \) כמודול.
עכשיו אני רוצה לחבר את הדבר הזה לשתי בניות אחרות שאנחנו מכירים מאלגברה לינארית (ומאלגברה בכלל): מכפלות ישרות וסכומים ישרים.
מכפלה ישרה של \( R \)-מודולים \( N_{1},N_{2},\dots,N_{k} \) היא הדרך הטבעית להפוך את המכפלה הקרטזית \( N_{1}\times N_{2}\times\dots\times N_{k} \) ל-\( R \)-מודול; מגדירים חיבור וכפל “רכיב רכיב”, כלומר \( \left(a_{1},\dots,a_{k}\right)+\left(b_{1},\dots,b_{k}\right)\triangleq\left(a_{1}+b_{1},\dots,a_{k}+b_{k}\right) \) ו-\( r\left(a_{1},\dots,a_{k}\right)\triangleq\left(ra_{1},\dots,ra_{k}\right) \). זה אותו רעיון כמו הבניות הדומות שראינו עבור חבורות וחוגים. סכום ישר זה אותו דבר בדיוק כמו מכפלה ישרה כל עוד אנחנו מדברים על מכפלה של מספר סופי של מודולים, שזה מה שתיארתי למעלה; אם אנחנו לוקחים אינסוף מודולים אז המכפלה הישרה שלהם היא עדיין המכפלה הקרטזית עם חיבור וכפל נקודתיים, אבל סכום ישר לוקח מהמכפלה הקרטזית רק את האיברים שבהם כל הכניסות הן 0 למעט מספר סופי - קצת מזכיר את מה שראינו קודם עם הבניה של המודול החופשי. אני לא הולך לדבר על מכפלות אינסופיות הפעם כי אני לא צריך את זה, ולכן ההבדל בין מכפלה ישרה וסכום ישר יהיה שקוף עבורנו.
מה שכן לא אמרתי עד עכשיו הוא שאני מדבר על מה שנקרא מכפלה ישרה חיצונית וסכום ישר חיצוני. במשהו “חיצוני” שכזה אנחנו לוקחים מודולים שלאו דווקא קשורים אחד לשני ו”מדביקים” אותם אחד לשני באופן מלאכותי משהו. אפשר לעשות דבר אחר: מתחילים עם מודול \( M \), לוקחים תת-מודולים שלו, ומסתכלים על מה שקורה כשמחברים אותם. אם התוצאה איזומורפית לסכום הישר החיצוני, הסיטואציה הזו נקראת גם סכום ישר (“פנימי”, לפעמים). זה מה שלרוב נתקלים בו קודם כשלומדים אלגברה לינארית.
בואו ניזכר איך זה הולך באלגברה לינארית: נניח ש-\( V \) הוא מרחב וקטורי ו-\( W,U \) הם שני תת-מרחבים. אפשר תמיד להסתכל על תת-המרחב \( W+U\triangleq\left\{ w+u\ |\ w\in W,u\in U\right\} \). אם מתקיימת גם התכונה הנחמדה \( W\cap U=\left\{ 0\right\} \), אז נותנים לסכום הזה את הסימון המיוחד \( W\oplus U \) וקוראים לו סכום ישר. כלומר: “סכום ישר” הוא לא בניה אלא הוא הצהרה שהבניה של “סכום רגיל של תתי-מרחבים” בנוסף לכך מקיים משהו. כמו ש”איחוד זר” זו הצהרה שאיחוד רגיל כלשהו הוא איחוד של שתי קבוצות שהן זרות.
הסיבה שסכום ישר שכזה הוא מעניין היא בגלל תכונת יחידות דומה לזו של בסיס. נניח ש-\( V=W\oplus U \), אז לכל \( v\in V \) קיימים איברים יחידים \( w\in W,u\in U \) כך ש-\( v=w+u \). איך יודעים שהוא יחיד? כי נניח ש-\( w_{1}+u_{1}=v=w_{2}+u_{2} \) אז \( w_{1}-w_{2}=u_{2}-u_{1} \). אגף שמאל הוא ב-\( W \) ואגף ימין הוא ב-\( U \), ולכן \( W\cap U=\left\{ 0\right\} \) מסיים את הטיעון. אפשר בקלות גם להוכיח ש-\( W\times U\cong W\oplus U \) כאשר \( W\times U \) הוא המכפלה החיצונית של המרחבים; פשוט מגדירים \( T\left(\left(w,u\right)\right)=w+u \) ומקבלים העתקה לינארית שהגרעין שלה הוא ה-\( \left(w,u\right) \) שעבורם \( w=-u \) ושוב יש לנו איברים ששייכים ל-\( W\cap U \) ולכן \( \left(w,u\right)=\left(0,0\right) \) וההעתקה היא חח”ע (וכמובן שהיא על).
את הרעיון הזה אפשר להכליל לסכום ישר של יותר משני תת-מרחבים; אני אעשה את זה כבר ישירות עבור מודולים, אבל מה שאעשה לא שונה ממה שעושים עבור מרחבים וקטוריים. הסיטואציה שלנו, כאמור, היא של \( R \)-מודול \( M \) עם תתי-מודולים \( N_{1},\dots,N_{k} \). נניח ש-\( M=N_{1}+\dots+N_{k} \) (לא חייבים להניח את זה; אפשר לתת סימון אחר ל-\( N_{1}+\dots+N_{k} \) במקרה שהוא לא שווה ל-\( M \) ולהמשיך עם הסימון הזה). אני תוהה מה התנאי הנדרש על מנת שיתקיים שכל איבר ב-\( M \) יהיה ניתן לכתיבה באופן יחיד בתור \( n_{1}+\dots+n_{k} \) כך ש-\( n_{i}\in N_{i} \). אבל לפני שנגיע לתנאי הזה, הנה שאלה מכשילה: נניח שזה אכן מה שקורה וכל איבר ב-\( M \) ניתן לכתיבה יחידה שכזו; האם זה אומר ש-\( M \) הוא חופשי מעל \( N_{1}\cup N_{2}\cup\dots\cup N_{k} \)? התשובה היא ממש לא. וזה שונה ממה שקורה במרחבים וקטוריים.
מה ההבדל? לפני שאתן דוגמא, דווקא עם ההגדרה הכללית קל לראות אותה לדעתי: <ul>
\( M \) הוא חופשי מעל \( N_{1},\dots,N_{k} \) אם לכל \( m\in M \) קיימים ויחידים \( n_{1},\dots,n_{k} \) וגם \( r_{1},\dots,r_{k}\in R \) כך ש-\( m=\sum r_{i}n_{i} \).
\( M \) הוא סכום ישר של \( N_{1},\dots,N_{k} \) אם לכל \( m\in M \) קיימים ויחידים \( n_{1},\dots,n_{k} \) כך ש-\( m=\sum n_{i} \). </ul> כלומר, מודול חופשי הוא אפילו יותר מאשר סכום ישר - הוא דורש יחידות גם מהמקדמים. הנה דוגמא פשוטה לסיטואציה שבה זה לא קורה: \( R=\mathbb{Z} \) ו-\( M=\mathbb{Z}_{2}\times\mathbb{Z}_{2} \). במקרה הזה \( M \) הוא בוודאי סכום ישר של שני עותקים של \( \mathbb{Z}_{2} \), אבל \( \left(1,1\right)=\left(1,0\right)+\left(0,1\right)=3\left(1,0\right)+5\left(0,1\right) \) מראה שיש יותר מייצוג אחד ל-\( \left(1,1\right) \) אם מסתכלים גם על המקדמים. זה מתרחש במקרה הנוכחי פשוט כי \( 3\left(1,0\right)=\left(1,0\right) \). בשדה משהו כזה לא יכול לקרות: בגלל שכל איבר שונה מ-0 הוא הפיך, כפל בסקלר הוא העתקה חח"ע - אין שני סקלרים שכפל בהם יחזיר את אותו איבר, ולכן ה"יחידות" באה מעצמה.
נעבור עכשיו לסיכום ביניים של הטענה שאני כן רוצה להוכיח. ראינו עד עכשיו שלוש דרכים להסתכל על עניין ה"סכום ישר פנימי" הזה, בואו נכתוב את כולן.
יש לנו \( R \)-מודול \( M \) עם תת-מודולים \( N_{1},\dots,N_{k} \) כך ש-\( M=N_{1}+\dots+N_{k} \). אז שלושת התנאים הבאים שקולים: </li>
- \( N_{1}\times\dots\times N_{k}\cong M \) עם האיזומורפיזם \( \varphi\left(n_{1},\dots,n_{k}\right)=n_{1}+\dots+n_{k} \)
- לכל \( 1\le i\le k \) מתקיים ש-\( N_{i}\cap\left(N_{1}+\dots+N_{i-1}+N_{i+1}+\dots+N_{k}\right)=\left\{ 0\right\} \)
- לכל \( m\in M \) קיימים ויחידים \( n_{1},\dots,n_{k} \) כך ש-\( n_{i}\in N_{i} \) ו-\( m=n_{1}+\dots+n_{k} \)
שימו לב במיוחד לתנאי האמצעי: שגיאה נפוצה (שגם אני עשיתי) היא להניח שההכללה של ה-\( W\cap U=\left\{ 0\right\} \) מהמקרה של סכום ישר של שני מרחבים היא פשוט להגיד שצריך להתקיים \( N_{i}\cap N_{j}=\left\{ 0\right\} \) לכל \( i\ne j \). אבל הדרישה הזו חלשה מדי ולא מספיקה (תרגיל נחמד: למצוא דוגמא נגדית) ולכן אני משתמש בדרישה הכללית יותר, שלכל תת-מודול \( N_{i} \), לא יהיה לו שום דבר לא טריוויאלי משותף עם מה שמתקבל מכל המרחבים האחרים ביחד.
הדרך האהובה ביותר להוכיח שכמה טענות הן שקולות היא "שרשרת גרירות" - נוכיח שהטענה הראשונה גוררת את השניה, השניה את השלישית, השלישית את הראשונה - וזהו, זה מוכיח שהכל גורר את הכל.
בשביל להוכיח את הטענה השניה בעזרת הראשונה, ניקח \( a\in N_{i}\cap\left(N_{1}+\dots+N_{i-1}+N_{i+1}+\dots+N_{k}\right) \) ונוכיח ש-\( a=0 \). אנחנו יודעים שמצד אחד \( a\in N_{i} \) ומצד שני \( a=\sum_{j\ne i}a_{j} \) עבור \( a_{j}\in N_{j} \). מכאן ש-\( \varphi\left(a_{1},a_{2},\dots,a_{i-1},-a,a_{i+1},\dots,a_{k}\right)=\sum_{j\ne i}a_{j}-a=0 \) ולכן \( \left(a_{1},\dots,a,\dots,a_{k}\right)\in\ker\varphi \). מכיוון ש-\( \varphi \) איזומורפיזם ובפרט חח"ע, נקבל \( \left(a_{1},\dots,a,\dots,a_{k}\right)=\left(0,0,\dots,0\right) \) ובפרט \( a=0 \).
בשביל להוכיח את הטענה השלישית בעזרת השניה, נשים לב ראשית כל לכך שהנחנו מראש ש-\( M=N_{1}+\dots+N_{k} \) וזה מראה מייד את ה"קיימים", האתגר הוא רק להראות את ה"יחידים". זו בעצם אותה הוכחה שכבר הראיתי קודם: נניח ש-\( m=a_{1}+\dots+a_{k}=b_{1}+\dots+b_{k} \) כך ש-\( a_{i},b_{i}\in N_{i} \), אז \( \left(a_{1}-b_{1}\right)+\dots+\left(a_{k}-b_{k}\right)=0 \) ולכן, לכל \( i \), נקבל \( -\left(a_{i}-b_{i}\right)=\sum_{j\ne i}\left(a_{j}-b_{j}\right) \). אגף שמאל שייך ל-\( N_{i} \) ואגף ימין ל-\( \sum_{j\ne i}N_{j} \) ולכן המסקנה מהטענה השניה היא ש-\( a_{i}-b_{i}=0 \), כלומר \( a_{i}=b_{i} \).
בשביל להוכיח את הטענה הראשונה בעזרת השלישית משתמשים בעוד טיעון שכבר פחות או יותר הראיתי. זה ש-\( \varphi \) הוא הומומורפיזם זה קל לבדיקה; זה שהוא על \( M \) נובע מ-\( M=N_{1}+\dots+N_{k} \); נשאר רק לראות ש-\( \varphi \) חח"ע, כלומר ש-\( \ker\varphi=\left\{ \left(0,0,\dots,0\right)\right\} \). מכיוון ש-\( 0\in M \) ו-\( 0=0+0+\dots+0 \) כאשר \( 0\in N_{i} \) לכל \( 1\le i\le k \), זו ההצגה היחידה של 0 בתור \( n_{1}+\dots+n_{k} \), ולכן האיבר היחיד בגרעין של \( \varphi \) הוא \( \left(0,0,\dots,0\right) \). זה מסיים את ההוכחה.
יש עוד דבר אחד שאני רוצה "להציל" מאלגברה לינארית, והוא ידרוש ממני להתחיל להתכנס אל היעד שלנו. כזכור, אני רוצה בסופו של דבר להוכיח משפט עבור מודולים נוצרים סופית מעל תחום ראשי. "תחום ראשי" הוא תחום שלמות (חוג קומוטטיבי ללא מחלקי אפס) שבנוסף לכך כל אידאל בו נוצר על ידי איבר בודד; אז במסגרת ההתכנסות, אני אניח כרגע ש-\( R \) הוא תחום שלמות, ואני אדבר על מודול חופשי שהוא נוצר סופית. כלומר, \( M \) יהיה \( R \)-מודול חופשי מעל קבוצת יוצרים סופית \( A \). ניתן לזה שם: \( \text{rank}M=\left|A\right| \) - הדרגה של המודול החופשי \( M \). זו המקבילה למימד עבור מרחבים וקטוריים. מה שאני רוצה להציל כרגע הוא משפט שימושי מאלגברה לינארית: אם \( V \) מרחב וקטורי מעל \( F \) ו-\( \dim V=n \), אז הקבוצה \( \left\{ v_{1},\dots,v_{n+1}\right\} \) של \( n+1 \) וקטורים שונים מעל \( V \) היא תלויה לינארית, כלומר קיימים \( \lambda_{1},\dots,\lambda_{n+1}\in F \) שלא כולם אפס כך ש-\( \sum\lambda_{i}v_{i}=0 \). עכשיו תחליפו את \( V \) ב-\( M \) ואת \( \dim V \) ב-\( \text{rank}M \) וקחו את הסקלרים מתוך \( R \) וקיבלתם את הטענה שאני רוצה להוכיח.
האם אתם זוכרים איך מוכיחים את הטענה הזו באלגברה לינארית? כמו רוב הדברים באלגברה לינארית בסיסית היא ניתנת לרדוקציה זריזה אל משהו שמדבר על מטריצות, ואותו משהו הוא זוועת עולם טכנית. מה שעושים הוא להסתכל על בסיס \( B=\left\{ e_{1},\dots,e_{n}\right\} \) של \( V \) ולכתוב את ה-\( v_{i} \)-ים באמצעותו: \( v_{i}=\sum_{j=1}^{n}a_{j,i}e_{j} \). זה מגדיר לנו מטריצה \( A=\left(a_{j,i}\right) \) עם \( n \) שורות ו-\( n+1 \) עמודות, כך שהעמודה ה-\( i \) הוא וקטור הקואורדינטות של \( v_{i} \) על פי הבסיס \( B \).
כעת, נסתכל על צירוף לינארי של ה-\( v_{i} \)-ים שאיבריו הם משתנים ואנחנו רוצים שיהיה שווה ל-0: \( \sum_{i=1}^{n+1}x_{i}v_{i}=0 \). אם נפתח את ההגדרה של כל \( v_{i} \), נקבל את המשוואה:
\( \sum_{i=1}^{n+1}x_{i}\sum_{j=1}^{n}a_{j,i}e_{j}=0 \)
אפשר לשנות את סדר הסכימה ולקבץ איברים לפי ה-\( e_{j} \)-ים:
\( \sum_{j=1}^{n}\left(\sum_{i=1}^{n+1}a_{j,i}x_{i}\right)e_{j}=0 \)
מכיוון ש-\( B \) הוא קבוצה בלתי תלויה לינארית, נסיק שהמקדמים של כל \( e_{j} \) הם 0:
\( \sum_{i=1}^{n+1}a_{j,i}x_{i}=0 \) לכל \( 1\le j\le n \)
אם נסמן \( \overline{x}=\left[\begin{array}{c} x_{1}\\ \vdots\\ x_{n+1} \end{array}\right] \) אז נקבל את המשוואה
\( A\overline{x}=\overline{0} \)
זו מערכת משוואות עם יותר נעלמים (\( n+1 \)) מאשר משוואות (\( n \)) ולכן קיים לה פתרון לא טריוויאלי. דרך אחרת לחשוב על זה: נרחיב את \( A \) למטריצה מסדר \( \left(n+1\right)\times\left(n+1\right) \) על ידי הוספת שורת אפסים. גם \( A \) המורחבת תקיים את המשוואה \( A\overline{x}=\overline{0} \), ומכיוון שיש לה שורת אפסים אז \( \det A=0 \) ולכן \( A \) לא הפיכה ולכן הגרעין של ההעתקה \( A\overline{x} \) אינו טריוויאלי. איך שאני לא רוצה לנסח את זה, אתם רואים שאני נעצר מתישהו בהוכחה הזו בדיוק לפני השלב הטכני המזוויע שאני מדבר עליו.
ולמה טרחתי להזכיר מה קורה באלגברה לינארית, הרי אנחנו לא באלגברה לינארית יותר? ובכן, להוכיח את המשפט עבור מודולים במקרה שלנו הוא בסך הכל רדוקציה למקרה של מרחבים וקטוריים. זה היתרון הגדול שבעבודה עם תחום שלמות \( R \); כבר ראינו בסדרת הפוסטים הזו שכל תחום שלמות \( R \) ניתן לשיכון בשדה \( F \) ("שדה השברים" של \( R \)). כעת, מכיוון ש-\( M \) הוא \( R \)-מודול חופשי מדרגה \( n \) אז \( M\cong R^{n} \), ולכן \( M\subseteq F^{n} \) (ההכלה הזו היא דרך מקוצרת לומר "\( M \) איזומורפי לתת-מרחב של \( F^{n} \)"). מכיוון ש-\( F \) הוא שדה אז \( F^{n} \) הוא מרחב וקטורי, כך שאם \( \left\{ a_{1},\dots,a_{n+1}\right\} \) הם \( n+1 \) איברים שונים של \( M \), אנחנו יודעים שקיימים \( \lambda_{1},\dots,\lambda_{n+1}\in F \) כך ש-\( \sum\lambda_{i}a_{i}=0 \). האם סיימנו?
עדיין לא לגמרי סיימנו, כי אותם \( \lambda_{i}\in F \) הם לא בהכרח איברים של \( R \). כאן נכנסת לתמונה באופן חזק העובדה ש-\( F \) הוא שדה השברים של \( R \); מתקיים \( \lambda_{i}=\frac{r_{i}}{s_{i}} \) עבור \( r_{i},s_{i}\in R \). אם נגדיר \( s=\prod s_{i} \), אז \( s\lambda_{i}\in R \) לכל \( \lambda_{i} \), כך שנקבל \( \sum\left(s\lambda_{i}\right)a_{i}=0 \) ב-\( M \) כאשר כאן המקדמים הם איברים של \( R \) - וזה מה שרצינו.
זהו, הצלחנו להציל את כל האלגברה הלינארית שנזדקק לה בהמשך; השלב הבא הוא לדבר קצת על מה זה אומר שמודול הוא נוצר סופית ואחר כך נגיע הישר אל המשפט המרכזי שאנחנו רוצים להוכיח.