אז מה זה בעצם מודולים ואלגבראות?

אני מגיע עכשיו אל החלק האחרון בסדרת הפוסטים שלי על אלגברה מופשטת. עד עכשיו ראינו בה שלושה תחומים עיקריים: את תורת החבורות, את תורת החוגים ואת תורת השדות (שכללה את תורת גלואה). תורת השדות הייתה סוג של נקודת שיא - ההכנה המקדימה הארוכה של חבורות וחוגים השתלמה בה וראינו הרבה תוצאות מעניינות ויפות. אני רוצה לעבור עכשיו לדבר על תורת המודולים, שהיא סוג של מקבילה לתורת השדות; לא נשתמש בה בנושאים מתורת השדות, אבל כן נתבסס על דברים מחוגים וחבורות על מנת להגיע אל נקודת שיא אחרת.

למרות שמודולים זה מושג מעניין ובסיסי וחשוב, אני מייעד את סדרת הפוסטים הנוכחית רק לנקודת שיא אחת, אבל כזו רצינית במיוחד: משפט המבנה של מודולים נוצרים סופית מעל תחומים ראשיים. השם המסורבל הזה מחביא מאחוריו משפט שהוא הכללה של שני משפטים כבדים למדי - בתורת החבורות: משפט המבנה של חבורות אבליות נוצרות סופית; ובאלגברה לינארית: משפט הפירוק הפרימרי ומשפט הפירוק הציקלי, שבתורם מובילים לצורת ז'ורדן ולצורה הרציונלית של טרנספורמציות לינאריות. שני המשפטים הללו היו קיימים עוד לפני שהיו מודולים, כמובן; המושג המופשט של מודול שאציג פה הוצג לראשונה על ידי אמי נתר במאמר מ-1921 (ויבוא יום ואכתוב פוסטים מסודרים על ההיסטוריה הארוכה והמעניינת של התחום).

הגדרה

מהו מודול? כפי שאפשר לנחש, זה מושג שמצליח להכליל איכשהו גם חבורות אבליות וגם מרחבים וקטוריים וגם עוד כל מני דברים. אני אניח שאתם כבר מכירים מרחבים וקטוריים ולכן אדבר עליהם בחופשיות; די סביר בעיני להכיר אלגברה לינארית לפני שנכנסים לעובי הקורה של האלגברה המופשטת. אז אתם מכירים כבר מרחבים וקטוריים, הנה הגדרת מחץ בשורה אחת למודול: מודול זה כמו מרחב וקטורי, רק מעל חוג שלא חייב להיות שדה.

ההבדל הקטן הזה - חוג ולאו דווקא שדה - הוא עצום. אתם זוכרים אלגברה לינארית? יופי, אז תשכחו ממנה. המון משפטים באלגברה לינארית הסתמכו על כך שמרחבים וקטוריים מוגדרים מעל שדה, ובלי זה הכל מתחיל להישבר. למשל, זוכרים את הקטע הזה שכל הבסיסים של מרחב וקטורים הם מאותו גודל? תשכחו מזה כשמדובר על מודולים. נכון שבמרחבים וקטוריים קבוצה בת איבר אחד לא יכולה להיות תלויה לינארית? במודולים היא כן. וזו רק ההתחלה. בקיצור, “מרחב וקטורי מעל חוג” זה אולי משפט מחץ נחמד, אבל בתור כלי עבודה שנותן לנו אינטואיציה עדיף לוותר עליו ולהיות מאוד זהירים ביחס לטענות שאנחנו טוענים.

אז הנה הגדרה יבשה, שהיא אכן בדיוק ההגדרה של מרחב וקטורי רק עם “חוג” במקום “שדה”:

חבורה אבלית \( M \) (עם פעולה בינארית שאסמן ב-\( + \)) היא \( R \)-מודול שמאלי עבור חוג \( R \) (לאו דווקא קומוטטיבי, אבל אניח שיש לו יחידה) אם קיימת פונקציה \( R\times M\to M \) שאסמן \( \left(r,m\right)\mapsto r\cdot m \), המקיימת:

\( \left(r+s\right)m=rm+sm \) לכל \( r,s\in R \) ו-\( m\in M \).
\( r\left(m+n\right)=rm+rn \) לכל \( r\in R \) ו-\( m,n\in M \).
\( \left(rs\right)m=r\left(sm\right) \) לכל \( r,s\in R \) ו-\( m\in M \)
\( 1\cdot m=m \) לכל \( m\in M \) (כאן \( 1 \) הוא איבר היחידה של \( R \)).

כלומר, מודול הוא חבורה אבלית עם פעולה של “כפל בסקלר” כשהסקלר הוא איבר שנלקח מהחוג \( R \), עם אקסיומות שאומרות שהפעולה הזו מתנהגת יפה. הראשונה אומרת שחיבור בחוג \( R \) מומר לחיבור במודול \( M \); השניה אומרת שכפל בסקלר הוא הומומורפיזם של \( M \); השלישית אומרת שכפל איברים ב-\( R \) שקול להרכבה של ההומומורפיזמים שהמוכפלים מגדירים; והרביעית אומרת שהזהות של \( R \) היא תמיד הומומורפיזם הזהות. שתי התכונות האחרונות מזכירות את מה שקורה בפעולה של חבורה על קבוצה; רק שכאן ה”פעולה” היא של חוג, והקבוצה היא בעלת מבנה נוסף, של חבורה, שלא מתבטא בשתי האקסיומות האחרונות.

שימו לב שכתבתי “\( R \)-מודול שמאלי”, כי כאן יש חשיבות לכיוונים. אפשר היה לדבר גם על \( R \)-מודול ימני כאשר הפעולה מוגדרת כך: \( \left(m,r\right)\mapsto m\cdot r \). על פניו זה נראה ריק מתוכן - מה בדיוק משתנה אם מגדירים את זה ככה? \( r\cdot m \) ו-\( m\cdot r \) הם סתם סימונים. אבל באקסיומה 3 יש לעניין הכיוון חשיבות. מילולית, אקסיומה 3 אומרת “הפעולה של האיבר \( rs \) על \( m \) היא כמו הפעלה של \( s \) ואחר כך הפעלה של \( r \)”. אם היינו משתמשים בסימון ה”ימני”, האקסיומה הייתה נכתבת כך:

\( m\left(rs\right)=\left(ms\right)r \)

שימו לב מה קרה - הסדר הפנימי בין \( r,s \) חייב להתהפך כדי שהאקסיומה תשמור את הסמנטיקה שלה. אנחנו לא רוצים לעשות את זה, ולכן כשמגדירים \( R \)-מודול ימני, האקסיומה השלישית שונה, ונראית כך:

\( m\left(sr\right)=\left(ms\right)r \)

אם אני אקח \( R,M \) כלשהם ופונקציה שלוקחת זוגות של איבר מ-\( M \) ואיבר מ-\( R \) ומחזירה איבר ב-\( M \), אז אותה פונקציה בדיוק לאו דווקא תקיים גם את אקסיומה 3 וגם את האקסיומה החדשה בו זמנית. רק אם \( R \) קומוטטיבי (ולכן \( rs=sr \)) מובטח לי שזה יקרה. מבלבל? הו, בוודאי, זו המחשה פשוטה לבלבולים שמתלווים לעובדה שמודול מוגדר מעל חוג ולא שדה; הרי באלגברה לינארית הכל מוגדר מעל שדה \( F \) שהוא תמיד קומוטטיבי ולכן הדיון הזה נחסך מאיתנו.

שימו לב שבעוד \( R \) לא חייב להיות חוג קומוטטיבי, \( M \) חייבת להיות חבורה אבלית. זה מזכיר את האופן שבו חוג \( R \) הוא תמיד חבורה אבלית ביחס לפעולת החיבור. בלי זה הכל היה פשוט מסובך מדי; בהמשך (למשל, כשנדבר על מודולי מנה) נראה שדרישת האבליות הזו ממודולים הופכת אותם ליחסית פשוטים ונחמדים, בהתחשב בנסיבות.

הדוגמאות המרכזיות שלנו

אני רוצה להתחיל את הדוגמאות למודולים דווקא משתי הדוגמאות ה”כבדות” יותר - אלו שנשתמש בהן אחר כך כדי להסיק ממשפט הפירוק של מודולים על משפט הפירוק של חבורות אבליות, ואת צורת ז’ורדן.

הדוגמא הראשונה היא פשוט חבורות אבליות. אמרנו שכל מודול \( M \) הוא מראש חבורה אבלית, אבל בנוסף לכך היינו רוצים שהפעולה של כפל בסקלר מ-\( R \) תשקף איכשהו את המבנה של החבורה האבלית, ואת זה אפשר לעשות בצורה טבעית מאוד. בואו ניזכר שיש לנו שתי דרכי סימון מקובלות לחבורות. בדרך כלל, אנחנו מתארים את הפעולה בתוך חבורה באמצעות סימונים דמויי כפל: \( ab \) היא המכפלה של \( a \) ב-\( b \), ו-\( a^{n} \) היא המכפלה של \( a \) בעצמו \( n \) פעמים וכדומה. אבל כאשר החבורה שלנו אבלית, מקובלת גם שיטת סימון אלטרנטיבית, שבה הפעולה של החבורה מתוארת עם חיבור. כך ש-\( a+b \) היא ה”מכפלה” של \( a \) ב-\( b \) (כלומר, \( a+b \) זה פשוט סימון שונה ל-\( ab \)), ה”הופכי” של \( a \), מה שבדרך כלל מסומן בתור \( a^{-1} \), נקרא כעת “הנגדי” של \( a \) ומסומן \( -a \); ואיבר היחידה של החבורה מסומן בתור \( 0 \) (ולא בתור \( e \) או 1 כמו שנהוג בחבורות שמתוארות בצורה כפלית). איך בשיטת הסימון הזו יתואר \( a^{n} \)? זה הרי קיצור ל-\( a+a+\dots+a \) בדיוק \( n \) פעמים; הכתיב המקובל הוא פשוט \( na \), כלומר “כפל” של המספר הטבעי \( n \) באיבר החבורה \( a \). אפשר להרחיב את הסימון הזה לכל המספרים השלמים (בדומה לאיך שעושים את זה עבור חזקות): \( 0\cdot a=0 \) ו-\( -n\cdot a=n\left(-a\right) \).

כלומר, שיטת הסימון של חבורות אבליות כבר מחביאה בתוכה את החשיבה על החבורה האבלית בתור מודול מעל השלמים - מה שנקרא \( \mathbb{Z} \)-מודול. במילים אחרות, כל חבורה אבלית היא אוטומטית \( \mathbb{Z} \)-מודול (חבורות לא אבליות אינן \( \mathbb{Z} \)-מודול כי הדרישה הבסיסית שלנו מהקבוצה \( M \) שמגדירה מודול הוא שהיא תהיה חבורה אבלית).

זה עובד גם בכיוון ההפוך: אם \( M \) הוא \( \mathbb{Z} \)-מודול כלשהו, לא קשה להראות שפעולת הכפל בסקלר של \( M \) חייבת להתאים למושג ה”חיבור שוב ושוב” של חבורה. כי תראו מה קורה משילוב אקסיומות 1 ו-2 ו-4 של מודול:

\( m+m=1\cdot m+1\cdot m=\left(1+1\right)\cdot m=2\cdot m \)

וכך זה יעבוד למספר סופי כלשהו של מחוברים. השוויון הזה לא טריוויאלי: בקצה השמאלי שלו אין זכר לחוג \( R \), ובקצה הימני שלו יש לנו כפל בסקלר מתוך \( R \).

באופן דומה: \( 0\cdot m=\left(0+0\right)\cdot m=0\cdot m+0\cdot m \) ולכן נקבל \( 0\cdot m=0 \) (לא ממש שונה מאיך שזה קורה בחוגים)

ובאופן דומה: \( -1\cdot m+1\cdot m=\left(-1+1\right)\cdot m=0\cdot m=0 \) ולכן \( -1\cdot m=-m \) (שוב, בצד שמאל יש לנו כפל בסקלר, בצד ימין אין כפל בסקלר, כך שזה לא שוויון טריוויאלי).

המסקנה היא ש-\( \mathbb{Z} \) מודול וחבורה אבלית שמתוארת בצורה חיבורית הם בדיוק אותו דבר.

כעת, \( \mathbb{Z} \) הוא חוג נחמד מאוד: הוא קומוטטיבי, והוא אפילו חוג אוקלידי, מה שגרר את זה שהוא תחום ראשי. משפט המבנה של מודולים שנוכיח בהמשך מדבר על מודולים נוצרים סופית מעל תחום ראשי, כך שהוא יחול בקלות על \( \mathbb{Z} \)-מודולים נוצרים סופית, כלומר על חבורות אבליות נוצרות סופית.

כעת, אם תזכרו, ל-\( \mathbb{Z} \) היה מעין בן דוד, גם הוא חוג אוקלידי, שהיה מאוד דומה ל-\( \mathbb{Z} \) ומאוד נחמד בפני עצמו - חוג הפולינומים במשתנה יחיד מעל שדה, מה שאסמן כאן \( F\left[x\right] \). גם \( F\left[x\right] \)-מודול נכנס תחת מה שמשפט המבנה של מודולים מדבר עליו - אבל מה זה \( F\left[x\right] \)-מודול? ובכן, זה מתאים בול ל”מרחב וקטורי עם טרנספורמציה לינארית שאנחנו רוצים לז’רדן”.

מה זה \( F \)-מודול, כאשר \( F \) הוא שדה? כאמור, זה בדיוק מרחב וקטורי. כל מרחב וקטורי \( V \) הוא \( F \)-מודול עבור \( F \) מתאים. לפעולה של \( F \) על \( V \) אנחנו קוראים “כפל בסקלר” ולרוב מסמנים את זה כך: \( \lambda v \) כאשר \( \lambda\in F \) ו-\( v\in V \). חוץ מהאותיות ה”לא סטנדרטיות” זה אותו הדבר.

עכשיו בואו ניקח טרנספורמציה לינארית \( T:V\to V \) ונגדיר “כפל בפולינום” בצורה שתלויה ב-\( T \) הזה:

\( \left(a_{n}x^{n}+\dots+a_{1}x+a_{0}\right)v\triangleq a_{n}T^{n}\left(v\right)+\dots+a_{1}T\left(v\right)+a_{0}v \)

מה הולך כאן? אינטואיטיבית, אנחנו מציבים את \( T \) בפולינום, מקבלים טרנספורמציה לינארית חדשה, מפעילים אותה על \( v \) ומחזירים את התוצאה. דרך אחרת לחשוב על זה: אנחנו מגדירים שהפעולה של \( x \) על \( v \) היא פשוט הפעלת \( T \): \( x\cdot v=T\left(v\right) \); כעת אנחנו מרחיבים בצורה לינארית את הפעולה הזו. כל אלו הן אינטואיציות; בסופו של דבר המשוואה שכתבתי לעיל היא ההגדרה המפורשת ומה שקורה בפועל.

ההגדרה תלויה מאוד ב-\( T \); עבור כל \( T \) שונה מעל \( V \) אנחנו נקבל \( F\left[x\right] \)-מודול שונה. כמו כן, אם ניקח \( F\left[x\right] \)-מודול כלשהו, נשתמש בהגדרה של הכפל עם הפולינומים הקבועים כדי להגדיר “כפל בסקלר” מתוך \( F \) נקבל שהמודול הוא מרחב וקטורי מעל \( F \); עכשיו נוכל להגדיר טרנספורמציה לינארית \( T:V\to V \) על ידי \( T\left(v\right)=x\cdot v \); תכונות המודול מראות שהיא אכן טרנספורמציה לינארית. זה מראה שעל כל \( F\left[x\right] \)-מודול אפשר לחשוב בתור מרחב וקטורי עם טרנספורמציה לינארית \( T \) שכפל בפולינום הוא כמו הפעלת הפולינום הזה על \( T \) והפעלת התוצאה על איבר מ-\( V \).

אני מקווה שהדוגמא הזו היא בעלת אפקט עליכם שדומה לזה שהיה עלי. כשראיתי אותה הייתי בהלם של “אוקיי, ממש לא ראיתי את זה בא” והעולם פתאום הפך לפשוט והגיוני קצת יותר. אבל אולי זה רק אני.

כמובן, צריך לבדוק שהפעולה הזו אכן מגדירה מודול; אני אשאיר לכם את התענוג הזה.

אני רוצה לדבר עכשיו על עוד כמה מקרים של מודולים שהם יותר כלליים ופחות ישר ולעניין כמו הדוגמאות שכבר הצגתי. נתחיל מהדוגמא הפשוטה ביותר: אם \( R \) הוא חוג כלשהו אז \( M=R \) הוא \( R \)-מודול שמאלי, כשפעולת ה”כפל בסקלר” היא פשוט פעולת הכפל הרגילה ב-\( R \). זה מזכיר את האופן שבו שדה הוא מרחב וקטורי מעל עצמו והאופן שבו חבורה יודעת לפעול על עצמה. זה אולי נראה טריוויאלי, אבל זה אומר שכל מני דברים שאנחנו מוכיחים על מודולים יכולים לעבור לחוגים “כמעט כמות שהם”, ועוד נראה דוגמאות לכך.

עוד בניה בסיסית של מודול מתוך כל חוג \( R \) מזכירה באופיה את מה שקורה באלגברה לינארית. שם מוכיחים בסופו של דבר שכל מרחב ממימד \( n \) איזומורפי למרחב הוקטורי \( F^{n} \). במודולים אין תוצאה כזו, אבל עדיין אפשר לדבר על המרחב \( R^{n}\triangleq\left\{ \left(r_{1},\dots,r_{n}\right)\ |\ r_{1},\dots,r_{n}\in R\right\} \). המרחב הזה הוא חבורה אבלית עם חיבור “רכיב-רכיב” (\( \left(r_{1},\dots,r_{n}\right)+\left(s_{1},\dots,s_{n}\right)\triangleq\left(r_{1}+s_{1},\dots,r_{n}+s_{n}\right) \)) ואפשר להפוך אותו ל-\( R \)-מודול על ידי הכפל הטבעי בסקלר: \( \alpha\left(r_{1},\dots,r_{n}\right)\triangleq\left(\alpha r_{1},\dots,\alpha r_{n}\right) \).

עוד דוגמא חשובה היא לאופן שבו אפשר לצמצם את חוג הסקלרים של מודול - וזה משהו שפשוט לא יכול לקרות במרחבים וקטוריים. נניח ש-\( M \) הוא \( R \)-מודול, וש-\( I \) הוא אידאל דו-צדדי ב-\( R \). אז חוג המנה \( R/I \) מוגדר היטב, אבל האם אפשר להגדיר כפל בסקלר מתוך \( R/I \)? איבר כללי של \( R/I \) הוא מהצורה \( r+I \). אי אפשר סתם לומר ש-\( \left(r+I\right)m\triangleq rm+Im \) כי הסימון \( Im \) לא מוגדר בכלל, ואין סיבה להניח שהוא יהיה איבר בודד. אבל אפשר להניח שהוא יהיה איבר בודד. במקרה הזה, מכיוון ש-\( 0\in I \), בהכרח צריך להתקיים \( Im=0 \), וזאת לכל \( M \). לסיטואציה הזו יש שם: אומרים שהאידאל \( I \) ב-\( R \) מאפס את \( M \). במקרה הזה, ההגדרה \( \left(r+I\right)m\triangleq rm \) אכן מגדירה לנו \( R/I \)-מודול מתוך \( M \).

למה שלא נדבר על אלגבראות אם כבר אנחנו פה

עד כה ראינו כמה מבנים אלגבריים מהותיים - חבורות, חוגים, שדות ועכשיו גם מודולים. אני רוצה לנצל את ההזדמנות כדי להציג מבנה נוסף שקשור אליהם, למרות שאני לא בטוח עד כמה אזדקק לו בהמשך - אלגברה (כן, למבנה האלגברי עצמו קוראים “אלגברה”. פשוט נגמרו להם הרעיונות לשמות, מה?). אפשר לחשוב על אלגברה בתור שילוב של מודול (או מרחב וקטורי) עם חוג - בנוסף לפעולות החיבור והכפל בסקלר, יש לנו גם פעולה של כפל בין האיברים של האלגברה, והכפל הזה “משחק יפה” עם החיבור והכפל בסקלר של המודול, מה שבאחת ההגדרות של אלגברה נדרש במפורש. אני הולך להציג את הגדרה טיפה שונה, שבמבט ראשון היא אולי מבלבלת יותר אבל עם המוטיבציה הנכונה אני מקווה שהיא תהיה ברורה יותר דווקא.

המוטיבציה שאנסה לתת היא מטריצות. מטריצות הן דבר נפלא כי הן המוטיבציה לכל דבר בערך. חבורות? מטריצות הפיכות הן חבורה ביחס לכפל מטריצות! וחבורה מעניינת כי היא יכולה להיות לא אבלית! חוגים? מטריצות הן חוג ביחס לחיבור וכפל מטריצות! וחוג מעניין כי יש בו מחלקי אפס! מודולים? מטריצות הן מודול ביחס לחיבור מטריצות וכפל בסקלר! ומודול מעניין כי… כי… כי… ובכן, כי כפל מטריצות הוא משהו שאנחנו מכירים ממש טוב וממש תוהים איך הוא יכול להיכנס לכל הסיפור הזה של מודול.

הנה דרך שבה הוא יכול להיכנס פנימה. מטריצות פשוטות במיוחד הן המטריצות הסקלריות. אלו מטריצות שהן 0 בכל מקום למעט האלכסון הראשי, שכל הכניסות בו הן \( \lambda \) עבור סקלר כלשהו מהחוג שמעליו המטריצות מוגדרות. למשל \( \left(\begin{array}{ccc} 7 & 0 & 0\\ 0 & 7 & 0\\ 0 & 0 & 7 \end{array}\right) \) היא המטריצה הסקלרית מסדר \( 3\times3 \) עבור הערך “7”. אנחנו יודעים שכפל של מטריצה \( A \) כלשהי במטריצה סקלרית שמתאימה לסקלר \( \lambda \) זה אותו הדבר בדיוק כמו לכפול את \( A \) בסקלר \( \lambda \). ההבדל? כפל מטריצות הוא כפל של איברים בתוך המודול בעוד שלכפול את \( A \) בסקלר זה כפל איבר במודול באיבר מתוך החוג.

מה שאנחנו עושים באלגברה לינארית לפעמים הוא לחשוב על סקלרים בתור משהו שמשוכן בתוך חוג המטריצות - סקלר משוכן בתוך המטריצה הסקלרית המתאימה לו. בגישה הזו, אפשר לשכוח מהחוג שמעליו אנחנו מוגדרים ולהתעסק רק עם פעולת כפל המטריצות; כפל באיבר מהחוג מתורגם לכפל מטריצות. כפל שתי מטריצות שמתאימות לאיברים מהחוג זה כמו כפל האיברים מהחוג עצמם. בניסוחים הרגילים שלנו, יש לנו הומומורפיזם מחוג הסקלרים אל חוג המטריצות.

עוד נקודה שצריך לקחת מדוגמת המטריצות - מטריצות סקלריות מפורסמות בכך שהן מתחלפות בכפל עם כל מטריצה. כלומר, אם \( A \) מטריצה כלשהי ו-\( B \) מטריצה סקלרית, אז \( AB=BA \). אומרים על זה ש-\( B \) שייכת למרכז של חוג המטריצות (מרכז של חוג, כמו מרכז של חבורה, הוא אוסף האיברים שמתחלפים עם כל אברי המבנה האלגברי בכפל). זה מנחה את ההגדרה הבאה של אלגברה:

חוג \( M \) הוא \( R \)-אלגברה עבור חוג קומוטטיבי \( R \) אם קיים הומומורפיזם \( \varphi:R\to M \) כך ש-\( \varphi\left(R\right) \) מוכל במרכז של \( M \) ו-\( \varphi\left(1_{R}\right)=1_{M} \).

תחשבו על \( M \) בתור “חוג מטריצות”, על \( R \) בתור “חוג סקלרים” ועל \( \varphi \) בתור ההעתקה שלוקחת סקלר ומחזירה את המטריצה הסקלרית המתאימה; זה האבטיפוס של מה שהולך פה.

שימו לב שההגדרה שלי לא הניחה ש-\( M \) הוא מודול. היא לוקחת את \( M \) להיות חוג, ומייצרת קשר בינו ובין חוג \( R \) על ידי שיכון. הנקודה היא שעכשיו אפשר לנצל את פעולת הכפל שקיימת על \( M \) כדי להגדיר פעולת כפל בסקלר של \( R \) על \( M \): פשוט מגדירים \( r\cdot m\triangleq\varphi\left(r\right)\cdot m \). באגף ימין יש פעולת כפל מבוססת היטב - הכפל בתוך \( M \) עצמו. תכונות הכפל בחוג והעובדה ש-\( \varphi \) הוא הומומורפיזם גוררות חיש קל את זה שפעולת הכפל החדשה הזו הופכת את \( M \) להיות \( R \)-מודול.

החשודים המיידיים - תתי-מודולים, מודולי מנה והומומורפיזמים

בשלב הזה של ההיכרות שלנו עם מבנים אלגבריים, הנוהל כבר הפך להיות סטנדרטי - הגדרנו מבנה אלגברי חדש? יאללה, להגדיר לו תת-מבנים, ומבני מנה, והומומורפיזמים והיי תראו כתבתי מחדש את כל מה שכתבתי בכותרת. זה לא מפתיע; אם אדבר יום אחד על תורת הקטגוריות גם יהיה ברור שזה מה ש”נכון” לעשות, אבל זה שהנוהל כבר שחוק אומר שאני לא אפרט על המוטיבציות אליו כפי שעשיתי עבור חבורות אלא אגש אל הישר ולעניין.

תת-מודול של \( R \)-מודול \( M \) הוא תת-קבוצה של \( M \) שהיא בעצמה \( R \)-מודול (בפרט, היא סגורה ביחס לכפל באיבר של \( R \)). איך בודקים את זה? כמו שעושים עם תתי-מרחבים וקטוריים: אם \( N\subseteq M \) אז בודקים שמתקיים \( rm+sn\in N \) עבור \( m,n\in M \) ו-\( r,s\in R \).

עבור \( \mathbb{Z} \)-מודולים (חבורות אבליות - זוכרים?) תתי-המודולים הם פשוט תתי-חבורות (וקריטריון השייכות מצטמצם לצורך לבדוק ש-\( m-n\in N \), שזה מה שהצגנו בשעתו כשדיברנו על תת-חבורות). עבור חוג \( R \) שהוא מודול מעל עצמו, תתי-המודולים הם פשוט האידאלים של \( R \). עבור \( F\left[x\right] \)-מודולים הסיפור יותר מעניין. תתי-המודולים הם לא “סתם” תתי-מרחבים; הרי צריך איכשהו שהמבנה של הכפל בסקלר יבוא לידי ביטוי. בפרט, אם \( v\in U \) עבור תת-מודול פוטנציאלי \( U \) אז צריך לבדוק שגם \( x\cdot v\in U \), כלומר ש-\( T\left(v\right)\in U \). במילים אחרות, צריך לבדוק שיתקיים \( T\left(U\right)\subseteq U \). תתי-מרחבים שמקיימים את התכונה הזו נקראים \( T \)-אינוריאנטיים; כשדיברתי בבלוג על אלגברה לינארית וצורות קנוניות תתי-מרחבים כאלו מילאו תפקיד חשוב ביותר, וכך יהיה גם כאן.

ההגדרה של הומומורפיזם גם היא סטנדרטית, ומזכירה כמובן את ההגדרה של טרנספורמציה לינארית: אם \( M,N \) הם שני \( R \)-מודולים, אז \( \varphi:M\to N \) הוא הומומורפיזם של \( R \)-מודולים אם

\( \varphi\left(x+y\right)=\varphi\left(x\right)+\varphi\left(y\right) \) לכל \( x,y\in M \)
\( \varphi\left(rx\right)=r\varphi\left(x\right) \) לכל \( x\in M \) ו-\( r\in R \)

הומומורפיזם חח”ע ועל הוא איזומורפיזם ומסמנים \( M\cong N \) אם קיים ביניהם איזומורפיזם. מגדירים את הגרעין והתמונה של \( \varphi \) בדרך הרגילה:

\( \ker\varphi\triangleq\left\{ m\in M\ |\ \varphi\left(m\right)=0\right\} \)
\( \varphi\left(M\right)\triangleq\left\{ \varphi\left(m\right)\ |\ m\in M\right\} \)

קל לבדוק ש-\( \ker\varphi \) הוא תת-מודול של \( M \) ו-\( \varphi\left(M\right) \) הוא תת-מודול של \( N \).

סימון סטנדרטי שמופיע באלגברה לינארית אבל לא ראינו עד כה בהקשר של אלגברה מופשטת הוא הסימון למרחב כל ההומומורפיזמים מ-\( M \) ל-\( N \), שמסומן \( \text{Hom}_{R}\left(M,N\right) \). באלגברה לינארית, המרחב הזה הוא בעצמו תמיד מרחב וקטורי. אצלנו… אצלנו המצב קצת יותר מסובך, ונדבר על זה בהמשך.

עכשיו בואו נדבר על מודולי מנה. עד כה, מנה של מבנה אלגברי התקבלה מכך שלקחנו תת-מבנה שלו ובדקנו אילו תכונות נוספות הוא צריך לקיים כדי שמרחב המנה יירש את המבנה האלגברי מהמרחב המקורי. במקרה של חבורות ראינו שתת-החבורה צריכה להיות נורמלית ובמקרה של חוג ראינו שתת-החוג צריך להיות אידאל. במקרה של מודולים אין שום דרישה נוספת. אפשר לחלק בכל תת-מודול ולקבל קבוצת מנה שהיא מודול ביחס לפעולה שנורשת מהמודול המקורי. מה הקסם פה? אין שום קסם: כזכור, מודול \( M \) הוא בראש ובראשונה חבורה אבלית. זה מראש מטפל באספקט הבעייתי של החלוקה - הצורך שהפעולה בין איברים בתוך מרחב המנה תתנהג יפה. שנית, ראינו כבר שתתי-מודולים זו דרישה שמקפלת בתוכה את תכונת ה”בליעה” שדרשנו במפורש עבור תת-חוגים; תת-מודול פירושו מראש שאם \( m \) שייך לתת-המודול ו-\( r\in R \) אז גם \( rm \) יהיה שייך לתת- המודול - זו בדיוק המהות של “בליעה”.

בקיצור, הסיבה שאפשר לחלק בכל תת-מודול מצביעה בעיקר על כך שמודולים הם מבנים קצת יותר “מגבילים” מאשר חוגים או חבורות. אבל היי, עדיין מגניב.

בואו נזכיר קונקרטית מה זה אומר “לחלק”: אם \( M \) הוא \( R \)-מודול ו-\( N \) הוא תת-מודול של \( M \), אז אפשר להסתכל על הקבוצה \( M/N\triangleq\left\{ m+N\ |\ m\in M\right\} \) של כל הקוסטים של \( N \) בתוך \( M \) (קוסט הוא קבוצה \( m+N\triangleq\left\{ m+n\ |\ n\in N\right\} \) שאפשר לחשוב עליה בתור “הזזה” של כל \( N \)). על הקבוצה \( M/N \) הזו מגדירים פעולות של חיבור וכפל בסקלר מתוך \( R \), ובכך הופכים אותה ל-\( R \)-מודול בעצמה:

\( \left(x+N\right)+\left(y+N\right)\triangleq\left(x+y\right)+N \)
\( r\left(x+N\right)\triangleq xr+N \)

כלומר, הפעולות של החיבור והכפל ב-\( M/N \) לא באו משום מקום; הן מתבססות על הפעולות בתוך \( M \) (זה מה שקורה באגף ימין של המשוואות). מכיוון שיש דרכים שונות לכתוב את אותו קוסט (אם \( x-y\in N \) אז \( x+N=y+N \)) צריך להוכיח שההגדרות לעיל מוגדרות היטב; שבחירה שונה של נציגים לאותו קוסט לא מניבה תוצאות שונות. עבור חיבור זה נובע מכך ש-\( M \) היא חבורה אבלית; בואו נרגיע את עצמנו שזה עובד גם עבור כפל.

נניח אם כן ש-\( x+N=y+N \) - לקחנו שני נציגים שונים לאותו קוסט. זה אומר, כאמור, ש-\( x-y\in N \). כעת, \( N \) הוא תת-מודול ולכן סגור לפעולה של כפל בסקלר מ-\( R \), כלומר \( r\left(x-y\right)\in N \). על פי אקסיומה 2 של מודולים נקבל \( rx-ry\in N \), כלומר \( rx+N=ry+N \), מה שמסיים את ההוכחה. פשוט! בשלב הזה כל מה שאנחנו עושים הוא פשוט.

בחבורות וחוגים היה עניין כזה שבו תת-החבורות הנורמליות והאידאלים (תתי-המבנים שבהם “מותר” לחלק) היו בדיוק הגרעינים של הומומורפיזמים מהמבנה המקורי. על פי אותו הגיון, אצלנו כל תת-מודול אמור להיות גרעין שכזה, אז מה ההומומורפיזם? כמו שהיה אז, קוראים לו “ההטלה הטבעית”, מסמנים אותו ב-\( \pi \) והוא מוגדר כך:

\( \pi:M\to M/N \)

\( \pi\left(x\right)\triangleq x+N \)

העובדה שזה הומומורפיזם נובעת מיידית מכך ש-\( M/N \) הוא אכן מודול, וברור ש-\( \ker\pi=N \).

עוד דבר שעשינו בחבורות וחוגים היה משפטי האיזומורפיזם - משפטים שהם כלי עבודה בסיסי עבורנו כשמתחילים להשתגע עם בניות והומומורפיזמים מסובכים. הם עוברים ככתבם וכלשונם גם למודולים, אז אני אסתפק בלצטט אותם. הניסוח שלהם פשוט יותר מאשר במקרה של חבורות, למשל, כי לא צריך לדבר על מתי משהו נורמלי ומתי לא.

(משפט האיזומורפיזם הראשון): אם \( M,N \) הם \( R \)-מודולים ו-\( \varphi:M\to N \)ֳ הומומורפיזם, אז \( M/\ker\varphi\cong\varphi\left(M\right) \).
(משפט האיזומורפיזם השני): אם \( M \) הוא \( R \)-מודול ו-\( A,B \) תת-מודולים שלו אז \( \left(A+B\right)/B\cong A/\left(A\cap B\right) \).
(משפט האיזומורפיזם השלישי): אם \( M \) הוא \( R \)-מודול ו-\( A\subseteq B \) שני תת-מודולים שלו, אז \( \left(M/A\right)/\left(B/A\right)\cong M/B \).
(משפט האיזומורפיזם הרביעי): אם \( M \) הוא \( R \)-מודול עם תת-מודול \( N \) אז יש התאמה חח"ע ועל בין תתי-המודולים של \( M \) שמכילים את \( N \) ובין תתי-המודולים של \( M/N \). ההתאמה נתונה על ידי \( A\leftrightarrow A/N \).

השתמשתי במשפט השני בסימון \( A+B \) שהמשמעות שלו סטנדרטית אבל אולי כדאי להזכיר אותה: \( A+B\triangleq\left\{ a+b\ |\ a\in A,b\in B\right\} \). זו בעצם דרך אחת לבנות תת-מודול חדש מתוך תת-מודולים קיימים. בואו נראה את ההכללות המתבקשות שלה.

יוצרים של מודולים

אחד מהמושגים החשובים ביותר באלגברה לינארית הוא זה של בסיס למרחב וקטורי - קבוצה של איברים שצירופים לינאריים שלה (כלומר, סכומים סופיים של איברים מתוכה עם מקדמים שנלקחים מתוך השדה) יוצרים את כל האיברים במרחב, וכל איבר נוצר בדרך ייחודית. במודולים המושג הנחמד הזה כבר לא בדיוק קיים ותכף נראה למה, אבל עדיין אפשר לדבר על קבוצה שיוצרת מודול מסויים באמצעות צירופים לינאריים (באלגברה לינארית דבר כזה נקרא \( \text{span} \)).

בואו ניקח מודול \( M \). ראשית, אם \( N_{1},\dots,N_{k} \) הם תת-מודולים שלו, אז אפשר להגדיר את הסכום שלהם: \( N_{1}+N_{2}+\dots+N_{k}\triangleq\left\{ n_{1}+\dots+n_{k}\ |\ n_{i}\in N_{i}\right\} \).

שנית, אם \( A\subseteq M \) היא קבוצה כלשהי (לאו דווקא תת-מודול) אז אפשר לדבר על תת-המודול שהיא יוצרת: \( RA\triangleq\left\{ r_{1}a_{1}+\dots+r_{n}a_{n}\ |\ r_{i}\in R,a_{i}\in A,n\ge1\right\} \). צריך להבין מה בדיוק \( RA \) מסמל פה: זה אוסף כל הצירופים הלינאריים של איברים מתוך \( A \) עם מקדמים מתוך \( R \) מאורך סופי כלשהו. כלומר, \( RA \) כולל את כל הצירופים מאורך 1, ואת כל הצירופים מאורך 2 וכן הלאה. במקרה שבו \( A \) סופית קל יותר לכתוב את זה: אם \( A=\left\{ a_{1},\dots,a_{n}\right\} \) אז פשוט מתקיים \( RA=\left\{ r_{1}a_{1}+\dots+r_{n}a_{n}\ |\ r_{i}\in R\right\} \) ואפשר אפילו לכתוב \( RA=Ra_{1}+Ra_{2}+\dots+Ra_{n} \) תוך התבססות על הגדרת החיבור של תת-מודולים שנתתי קודם.

לא קשה לראות ש-\( RA \) הוא תת-מודול, ושזה תת-המודול הקטן ביותר של \( M \) שמכיל את \( A \). כאן מתחבאת עוד הדגמה לכמה מודולים עלולים להיות מבלבלים: אם לא הייתי מניח ש-\( R \) הוא חוג עם יחידה (ובהחלט מדברים לפעמים על מודולים מעל חוגים ללא יחידה) אז הקטע הזה של “מכיל את \( A \)” בכלל לא היה נכון בהכרח.

על \( A \) אומרים שהיא יוצרת את תת-המודול \( RA \). לאותו תת-מודול יכולות להיות קבוצות רבות ושונות של יוצרים. אם לפחות אחת מקבוצות היוצרים של תת-המודול היא סופית, אז אומרים שהוא נוצר סופית. מודולים נוצרים סופית הולכים לשחק תפקיד מכריע במה שנעשה בהמשך.

עכשיו, בואו נראה כמה דוגמאות כדי לראות כמה העסק הזה דומה וגם לא דומה לאלגברה לינארית. נתחיל עם המודול \( M=\mathbb{Z} \) מעל החוג \( \mathbb{Z} \). מהי הקבוצה \( \mathbb{Z}n \) בחוג הזה? ובכן, היא מה שבדרך כלל היינו מסמנים בתור \( n\mathbb{Z}=\left\{ nk\ |\ k\in\mathbb{Z}\right\} \); כמובן ששני הסימונים מתארים בדיוק את אותו דבר כי \( \mathbb{Z} \) קומוטטיבי. כעת, המסקנה היא ש-\( \mathbb{Z}1=M \), כלומר יש לנו קבוצה בת איבר בודד שיוצרת את החוג. הקבוצה הזו היא בבירור בלתי תלויה לינארית במובן הרגיל של אלגברה לינארית (אם צירוף לינארי של אבריה שווה לאפס אז כל המקדמים הם אפס). לכן באלגברה לינארית היינו אומרים שהמימד של \( \mathbb{Z} \) הוא 1.

בינתיים נראה דומה לאלגברה לינארית, אבל מה קורה אם \( M=n\mathbb{Z} \)? גם זו חבורה אבלית לגיטימית ו-\( 1 \) יוצר את המודול המתאים מעל \( \mathbb{Z} \). אבל \( n\cdot1=0 \), כך שקיבלנו צירוף לינארי של אברי הקבוצה \( \left\{ 1\right\} \) כך שלא כל מקדמי הצירוף הם 0 (כי \( n\in\mathbb{Z} \) אינו אפס בחוג \( \mathbb{Z} \) שמעליו המודול הוגדר). האם \( \left\{ 1\right\} \) היא “תלויה לינארית”? בהגדרות הרגילות של אלגברה לינארית, כן; אבל באלגברה לינארית מעולם לא נתקלנו בקבוצה מגודל 1 שהיא תלויה לינארית.

מה קורה אם \( M=\mathbb{Z}_{2}\times\mathbb{Z}_{2} \)? גם זו חבורה אבלית לגיטימית. מי יוצר אותה? איבר בודד לא יצליח: \( \left(1,0\right) \) למשל מקיים \( 2\cdot\left(1,0\right)=\left(0,0\right) \). לכן קבוצת יוצרים צריכה להיות מגודל 2 לפחות, למשל \( \left\{ \left(1,0\right),\left(0,1\right)\right\} \). מצד שני, כל קבוצה של איברים מ-\( M \) היא “תלויה לינארית” כי כפל ב-2 של כל איבר מחזיר 0. אם כן, כאן הקבוצה הפורשת המינימלית היא גדולה יותר מקבוצות תלויות לינארית. זה הבדל מהותי ממה שקרה באלגברה לינארית, שם הבסיס היה בו זמנית הקבוצה הפורשת המינימלית, והקבוצה הבלתי תלויה המקסימלית. כל התכונה היפה הזו פשוט לא קיימת במודולים.

עוד אסון לאינטואיציה שלנו הוא מה שקורה עם פרישה של תת-מודולים. באלגברה לינארית, הכלל פשוט: אם \( W \) הוא תת-מרחב של \( V \), אז \( \dim W\le\dim V \). במודולים זה ממש לא קורה: אפשר אפילו לתת דוגמא למודול \( M \) שהוא נוצר סופית, אבל יש לו תת-מודול \( N\subseteq M \) שאיננו נוצר סופית.

הנה דוגמא שכזו: ניקח את החוג \( R=\mathbb{R}\left[x_{1},x_{2},\dots\right] \) - חוג הפולינומים באינסוף (בן מניה) של משתנים \( x_{1},x_{2},\dots \) מעל השדה \( \mathbb{R} \) של הממשיים. נגדיר \( M=R \), כלומר המודול הוא החוג מעל עצמו. כמובן שהמודול הזה נוצר סופית על ידי הקבוצה \( \left\{ 1\right\} \), אבל בואו נתבונן כעת בתת-הקבוצה של \( M \) שכוללת את כל הפולינומים עם מקדם חופשי 0; הקבוצה הזו מן הסתם סגורה לחיבור וכפל בסקלר, ולכן היא תת-מודול, והיא בוודאי נוצרת על ידי \( \left\{ x_{1},x_{2},\dots\right\} \) ולכן היא “נוצרת אינסופית”. אבל האם ייתכן שיש לה קבוצת יוצרים סופית? נניח לרגע שיש לה. מכיוון שקבוצת היוצרים שלה סופית, וכל איבר בקבוצה הוא פולינום ולכן הוא סופי, אז רק מספר סופי של משתנים משתתפים בקבוצה הזו - יהא \( x_{n} \) משתנה שאינו שייך לקבוצת היוצרים. אז איך נוצר האיבר \( x_{n}\in M \) על ידי קבוצת היוצרים? קל להשתכנע שזה בלתי אפשרי.

ההבדלים הללו בין מודולים ומרחבים וקטוריים נותנים לנו סיבה טובה לשמוח על הטרמינולוגיה השונה שיש בין שני היקומים הללו, למרות שהם מדברים לכאורה על אותו דבר. כך למשל באלגברה לינארית אומרים שוקטורים פורשים תת-מרחב, ואילו במודולים אומרים שאיברים יוצרים תת-מודול. בשני המקרים הרעיון הוא אותו רעיון, אבל טוב שבמודולים אנחנו לא משתמשים באותה טרמינולוגיה, ולו כדי לזכור שדברים שעובדים מאליהם באלגברה לינארית לא עובדים כאן. בפוסט הבא אני אדבר על מה כן עובד, ועד איזו רמה.

נהניתם? התעניינתם? אם תרצו, אתם מוזמנים לתת טיפ: