הומומורפיזמים של חבורות

בסדרת הפוסטים שלי על תורת החבורות פיזרתי עד כה על ימין ועל שמאל הבטחות מסוג “שתי החבורות הללו הן בעצם אותו הדבר במובן מסויים כלשהו שאני לא אומר עליו כלום כרגע אבל בבקשה בבקשה תאמינו לי”. הגיע הזמן להציג את המובן הזה, וגם לראות איך הוא מתקשר כמעט מאליו למושגים של תת-חבורה וחבורת מנה שהצגתי עד כה. המושג שאני צריך הוא הומומורפיזם של חבורות.

ככה זה לעתים קרובות במתמטיקה: קודם כל מציגים סוג חדש של עולם מתמטי (במקרה שלנו, חבורות) ואז מתחילים לתהות לגבי הקשרים בין האובייקטים השונים בעולם הזה. מתי שתי חבורות הן אותו דבר. מתי חבורה אחת כוללת עותק של חבורה אחרת בתור תת-חבורה שלה. מה הדרכים השונות שבהן ניתן להמיר חבורה אחת לחבורה אחרת, וכן הלאה. כשזה קורה, מתחילים לדבר על פונקציות בין האובייקטים השונים בעולם שלנו, אבל לא סתם כל פונקציה, אלא פונקציות שמשמרות את המבנה שמייחד את האובייקטים. במקרה שלנו, את המבנה של “חבורה”.

בואו נחזור לרגע לבסיס. פונקציה \( f:A\to B \) היא משהו שלוקח איברים מ-\( A \) ומחזיר איברים מ-\( B \). הרעיון הוא שלכל קלט מתוך \( A \) יהיה קיים פלט ב-\( B \), והפלט הזה יהיה יחיד, כלומר אפשר יהיה אינטואיטיבית לחשוב על \( f \) כאילו היא מבצעת איזה שהוא תהליך המרה דטרמיניסטי שתמיד מצליח. בפועל פונקציה לא מוגדרת בתור “תהליך” או בתור “כלל” אלא פשוט בתור אוסף של זוגות הקלט/פלט שלה, מה שמאפשר לטפל בפונקציות גם כשאין כלל ברור שמגדיר אותן, אבל גישת ה”תהליך/כלל” היא נוחה מאוד עבור האינטואיציה.

פונקציה היא חד-חד-ערכית (חח”ע) אם עבור קלטים שונים מתקבלים פלטים שונים; היא על אם כל איבר מ-\( B \) מתקבל כפלט של קלט כלשהו מ-\( A \). אנחנו אוהבים מאוד פונקציות שהן בו זמנית חח”ע ועל כי אפשר להפוך אותן - בהינתן איבר כלשהו מ-\( b \), הכלל שמתאים לו איבר מ-\( a \) כך ש-\( f\left(a\right)=b \) הוא גם כן פונקציה חח”ע ועל, שמסמנים \( f^{-1} \) (דהיינו \( f^{-1}\left(b\right)=a \) אם ורק אם \( f\left(a\right)=b \)). אם יש פונקציה \( f:A\to B \) שהיא חח”ע ועל אז אפשר לחשוב על \( A \) ועל \( B \) בתור “אותה קבוצה עד כדי שינוי שמות האיברים”, כש-\( f \) מתארת את האופן שבו משנים את שמות האיברים. גם אם \( f \) לא על \( B \), תמיד אפשר לדבר על תת-הקבוצה של \( B \) שמורכבת בדיוק מהפלטים האפשריים של \( A \), מה שנקרא התמונה של \( f \) על \( A \) ומסומן כך: \( f\left(A\right)=\left\{ f\left(a\right)\ |\ a\in A\right\} \). כל פונקציה היא אוטומטית על התמונה שלה, ולכן אם \( f \) חח”ע אז אפשר לחשוב על \( A \) ועל \( f\left(A\right) \) בתור “אותה קבוצה עד כדי שינוי שמות האיברים”.

בואו נראה עכשיו שתי דוגמאות לפונקציות. שתיהן יוגדרו על \( \mathbb{Z}_{4}=\left\{ 0,1,2,3\right\} \) עם חיבור מודולו 4 - החבורה הציקלית היחידה עם 4 איברים. הטווח יהיה \( \mathbb{C} \), המספרים המרוכבים. ואני אכתוב אותן במפורש:

\( f\left(n\right)=\begin{cases}1 & n=0\\i & n=1\\-1 & n=2\\-i & n=3\end{cases} \)

\( g\left(n\right)=\begin{cases}i & n=0\\1 & n=1\\-i & n=2\\-1 & n=3\end{cases} \)

בשני המקרים התמונה של הפונקציות היא הקבוצה \( \left\{ 1,i,-1,-i\right\} \) שמן הסתם לא נבחרה במקרה. הקבוצה הזו היא בעצמה חבורה, עם פעולת הכפל הרגילה. יותר מכך: \( i \) הוא יוצר שלה (כי \( i^{2}=-1 \) ו-\( i^{3}=-i \) ו-\( i^{4}=1 \)). אז הקבוצה הזו היא חבורה ציקלית, דרך אחרת לכתוב את \( \mathbb{Z}_{4} \). יש לה אפילו שם: חבורת שורשי היחידה מסדר 4, דהיינו החבורה של כל הפתרונות המרוכבים למשוואה \( x^{4}=1 \). באופן כללי חבורת שורשי היחידה מסדר \( n \), אוסף כל הפתרונות המרוכבים ל-\( x^{n}=1 \) גם היא מהווה חבורה ציקלית מסדר \( n \), וחבורת כל שורשי היחידה היא עסק מגניב לגמרי כי היא חבורה שבנויה “מכל החבורות הציקליות הסופיות ביחד”, אבל אני כל כך מתלהב שסטיתי לגמרי מהנושא. נחזור לזה בהמשך.

אז ראינו ש-\( \mathbb{Z}_{4} \) ו-\( \left\{ 1,i,-1,-i\right\} \) הן אותה קבוצה עד כדי שינוי שמות של איברים. התחושה היא שאותו דבר הולך להתקיים גם למבנה ה”חבורה” שיש על שתי הקבוצות הללו. עבור \( \mathbb{Z}_{4} \) הפעולה היא חיבור מודולו 4 ועל שורשי היחידה הפעולה היא כפל, אבל התחושה היא שזו אותה פעולה ב”תחפושת”. למשל, אם אני לוקח את \( 1\in\mathbb{Z}_{4} \) ומחבר אותו לעצמו, אני אקבל את 2. ואם אני אקח את \( i \) מחבורת שורשי היחידה ואכפול אותו בעצמו אני אקבל \( -1 \). בבירור עשיתי פה את אותו הדבר על אותה חבורה עם שתי שיטות סימון שונות: \( i \) הוא בסך הכל סימון שונה ל-\( 1 \) (כי \( f\left(1\right)=i \)) ואילו \( -1 \) הוא בסך הכל סימון שונה ל-\( 2 \) (כי \( f\left(2\right)=-1 \)). אפשר אפילו לכתוב זאת כך: \( f\left(1+1\right)=f\left(1\right)\cdot f\left(1\right) \) (החיבור באגף שמאל הוא החיבור מודולו 4 והכפל באגף ימין הוא כפל מרוכבים).

זה עבד כל כך יפה לשיטת הסימון של \( f \) שאנחנו רצים לעשות את אותו דבר עבור \( g \) ואז אנחנו נופלים על האף, כי זה פשוט לא עובד. למשל, \( g\left(1+1\right)=g\left(2\right)=-i \) אבל \( g\left(1\right)\cdot g\left(1\right)=1\cdot1=1 \). זה אומר שאי אפשר סתם לקחת את האיברים של חבורה אחת, לשנות את השמות שלהם לאיברים של חבורה שניה ולהגיד היי תראו זה אותו דבר; צריך לבצע את ההתאמה הזו מאוד בזהירות. אם לנסח במפורש מה אנחנו רוצים: אם \( G,H \) הן שתי חבורות, אנחנו רוצים למצוא פונקציה \( f:G\to H \) כך שבהינתן שני איברים \( a,b\in G \) אין חשיבות לשאלה אם אני קודם כל כופל אותם עם הפעולה של \( G \) ורק אז מפעיל את \( f \) על התוצאה, או שקודם אני מפעיל את \( f \) על האיברים ורק אחר כך מבצע את פעולת הכפל של \( H \) על תמונות האיברים. בשתי הדרכים הללו אני אגיע לאותה התוצאה. אפשר לנסח את זה במשוואה פשוטה מאוד. באופן חריג, אסמן את פעולת הכפל של \( G \) בעזרת נקודה, \( \cdot \), ואילו את פעולת הכפל של \( H \) בעזרת \( * \), כדי שיהיה לנו קל להבין את ההבדלים. כעת, הדרישה שלנו מ-\( f \) היא שתקיים:

\( f\left(a\cdot b\right)=f\left(a\right)*f\left(b\right) \)

וזאת לכל \( a,b\in G \). פונקציה שמקיימת את התכונה הזו נקראת הומומורפיזם מ-\( G \) אל \( H \) (“הומומורפיזם” ביוונית פירושו, בערך, “אותה צורה”). אם \( f:G\to H \) היא הומומורפיזם חח”ע ועל אז קוראים לה איזומורפיזם, ואז אומרים ש-\( G,H \) הן “איזומורפיות” ומסמנים זאת \( G\cong H \) שזו הדרך שלנו להגיד את ה”אותו דבר עד כדי שינוי הסימונים” מתחילת הפוסט.

את רעיון ה”יש לי שתי דרכים שבהן אני מגיע לאותה תוצאה” אוהבים לתאר באלגברה גם באופן ציורי, בעזרת משהו שנקרא דיאגרמה קומוטטיבית. אין בה צורך של ממש כאן, אבל למה לא לנצל את ההזדמנות כדי להראות לכם את הדבר הזה. הנה הדיאגרמה הקומוטטיבית שמתאימה לסיטואציה שלנו:

\xymatrix{G\times G\ar[r]^{\cdot}\ar[d]^{f\times f} && G\ar[d]^{f}\\H\times H\ar[r]^{*} && H}

מה יש לנו פה? הדיאגרמה מורכבת משני מרכיבים: אובייקטים וחצים. האובייקטים אצלנו הם \( G\times G \) (כל הזוגות של איברים מ-\( G \)), \( G \), \( H\times H \) (כל הזוגות של איברים מ-\( H \)) ו-\( H \). כלומר, האובייקטים הם קבוצות. על כל חץ יש סימון של פונקציה כלשהי שמוגדרת מקבוצה אחת אל הקבוצה השניה. למשל, החץ \( G\times G\overset{\cdot}{\to}G \) אומר שיש לנו פונקציה שמסומנת ב-\( \cdot \) ומעבירה זוג מ-\( G\times G \) אל איבר ב-\( G \) - זה הרי מה שכפל באמת עושה. אותו דבר גם עם \( H\times H\overset{*}{\to}H \) למטה. גם החץ \( G\overset{f}{\to}H \) ברור - הוא בא לתאר את ההומומורפיזם מ-\( G \) ל-\( H \) שלכבודו נתכנסנו. אבל מה זה \( G\times G\overset{f\times f}{\to}H\times H \)? שום דבר מחוכם - פשוט דרך להגיד “יש לך זוג איברים מ-\( G \)? תפעיל את \( f \) על כל אחד מהם”. כלומר, זה בא לתאר את האופן שבו \( \left(a,b\right) \) הופך ל-\( \left(f\left(a\right),f\left(b\right)\right) \).

עכשיו, בדיאגרמה הזו יש נקודת התחלה ברורה - \( G\times G \), שאף חץ לא נכנס אליה. יש גם נקודת סיום ברורה - \( H \), שאף חץ לא יוצא ממנה. יש לנו שתי דרכים שונות ללכת מ-\( G\times G \) אל \( H \): או שקודם כל נפנה ימינה ואז נרד למטה, מה שאומר ש-\( \left(a,b\right) \) קודם כל יועבר אל \( a\cdot b \) ואז יופעל עליו \( f \) לקבלת התוצאה \( f\left(ab\right) \), או שקודם כל נרד למטה ואז נלך ימינה, מה שאומר ש-\( \left(a,b\right) \) קודם כל יועבר אל \( \left(f\left(a\right),f\left(b\right)\right) \) ואז יופעל \( * \) לקבלת התוצאה \( f\left(a\right)*f\left(b\right) \). בכך שאנחנו אומרים שהדיאגרמה קומוטטיבית, אנחנו אומרים שאין חשיבות לשאלה באיזו דרך נלך, ולכן שמתקיים \( f\left(ab\right)=f\left(a\right)*f\left(b\right) \). בניסוח אחר, אומרים שהומומורפיזם מוגדר בתור כל \( f \) שתגרום לדיאגרמה לעיל להיות קומוטטיבית. תגידו, ובצדק, שזו דרך מאוד מסורבלת לכתוב משוואה כל כך פשוטה ואני אסכים איתכם; בפועל משתמשים בדיאגרמות קומוטטיביות לדברים מסובכים יותר, ונראה דוגמה עוד בפוסט הזה.

בואו נראה מה יוצא לנו מייד מההגדרה של הומומורפיזם \( f:G\to H \). ראשית כל יוצא שהאיבר האדיש של \( G \) חייב לעבור לאדיש של \( H \), ושההופכי ב-\( H \) של האיבר \( f\left(a\right) \) שווה ל-\( f\left(a^{-1}\right) \). בואו נראה למה. ראשית, אם \( e\in G \) הוא האדיש של \( G \) אז \( f\left(e\right)=f\left(e\cdot e\right)=f\left(e\right)f\left(e\right) \) ועל ידי כפל בהופכי של \( f\left(e\right) \) מקבלים ש-\( f\left(e\right) \) הוא האדיש של \( H \). שנית, \( f\left(e\right)=f\left(a\cdot a^{-1}\right)=f\left(a\right)f\left(a^{-1}\right) \) וקיבלנו ש-\( f\left(a^{-1}\right) \), כשמכפילים אותו ב-\( f\left(a\right) \), מחזיר את ההופכי של \( H \).

משני אלו נובעת תכונה מרכזית עבורנו: אם \( f:G\to H \) הוא הומומורפיזם אז התמונה \( f\left(G\right) \), שהיא תת-קבוצה של \( H \), היא למעשה תת-חבורה. כדי לראות את זה ניקח \( x,y\in f\left(G\right) \) ונוכיח ש-\( xy^{-1}\in f\left(G\right) \). מכיוון ש-\( x,y \) בתמונה של \( G \) קיימים \( a,b \) כך ש-\( x=f\left(a\right) \) ו-\( y=f\left(b\right) \). על כן:

\( xy^{-1}=f\left(a\right)f\left(b\right)^{-1}=f\left(a\right)f\left(b^{-1}\right)=f\left(ab^{-1}\right)\in f\left(G\right) \)

למעשה, השוויון הזה מראה יותר: הוא מראה שהתמונה של כל תת-חבורה של \( G \) תהיה תת-חבורה של \( H \). עכשיו, אם \( f \) חח”ע, ברור מהי תת-החבורה הזו: זה עותק של \( G \) עצמה ש”משוכן” בתוך \( H \). לדוגמה, בואו נסתכל על \( G=\mathbb{R} \) ועל \( H=\mathbb{R}^{2} \), שתיהן עם פעולת החיבור, ועל ההומומורפיזם \( f\left(a\right)=\left(a,2a\right) \). התמונה שלו היא הישר \( y=2x \) שהוא תת-חבורה של \( \mathbb{R}^{2} \) שנראית כמו “עותק של \( \mathbb{R} \)”. הרי בתכל’ס \( \mathbb{R} \) הוא קו ישר אופקי, אז סובבנו אותו קצת. אנחנו גם רואים כאן שלפעמים יש המון דרכים שונות לשכן את \( G \) בתוך \( H \) (בדוגמה שלנו, כל זווית סיבוב בין 0 ל-180 מעלות תוביל לתת-חבורה שונה).

כעת נשאלת השאלה, מה אם \( f \) איננה חח”ע? מה המשמעות של התמונה שלה אז? התשובה לזה נקראת משפט האיזומורפיזם הראשון והיא לטעמי אחד מהדברים החשובים ביותר בכל סדרת הפוסטים שאני הולך לכתוב, אם לא החשוב שבהם. הרעיון הבסיסי הוא שהתמונה של \( f \) היא תמיד איזומורפית לחבורת מנה של \( G \). כדי לראות את זה, בואו נכניס מושג חדש לתמונה - גרעין של הומומורפיזם. אם \( f:G\to H \) הוא הומומורפיזם ו-\( e_{H}\in H \) הוא האיבר האדיש ב-\( H \) אז \( \ker f\triangleq\left\{ a\in G\ |\ f\left(g\right)=e_{H}\right\} \) (כאן \( \ker \) הוא קיצור של kernel, גרעין). קל מאוד להוכיח שהגרעין הוא תת-חבורה של \( G \): אם \( x,y\in\ker f \) אז \( f\left(xy^{-1}\right)=f\left(x\right)f\left(y\right)^{-1}=e_{H}e_{H}^{-1}=e_{H} \).

הגרעין הוא מעין מדד “עד כמה \( f \) לא חד-חד-ערכית”. אם \( f\left(a\right)=f\left(b\right) \) אז \( f\left(a\right)f\left(b\right)^{-1}=e_{H} \), כלומר \( f\left(ab^{-1}\right)=e_{H} \), ומכאן ש-\( ab^{-1}\in\ker f \). זה אומר בפרט שאם \( \ker f=\left\{ e\right\} \) (“הגרעין טריוויאלי”) אז \( f\left(a\right)=f\left(b\right) \) יגרור \( ab^{-1}=e \) כלומר \( a=b \); דהיינו, הגרעין של \( f \) טריוויאלי אם ורק אם \( f \) חד-חד-ערכית. אבל אנחנו בעצם רואים כאן הרבה יותר. האם הסימון \( ab^{-1}\in\ker f \) נראה מוכר? זה בדיוק יחס השקילות שראינו בפוסט על חבורות מנה. במילים אחרות, כל קוסט של \( \ker f \) הוא בעצם “קבוצת איברים ש-\( f \) מעבירה את כולם לאותו איבר בתמונה”. מכאן קצרה הדרך לטענה שאפשר לזהות את התמונה של \( f \) עם הקוסטים של \( \ker f \), וזה מה שנקרא משפט האיזומורפיזם הראשון:

אם \( f:G\to H \) הוא הומומורפיזם כלשהו של חבורות שהוא על \( H \), אז \( G/\ker f\cong H \).

(אפשר כמובן לנסח את המשפט גם בלי ש-\( f \) יהיה על, ואז מקבלים \( G/\ker f\cong f\left(G\right) \)).

לפני שאני אוכיח את המשפט, בואו בכלל נשתכנע ש-\( G/\ker f \) היא אכן חבורה. בפוסט על חבורות מנה ראינו שלא בכל פעם שבה לוקחים את אוסף הקוסטים של תת-חבורה כלשהי מקבלים שמושרית על האוסף הזה פעולת החבורה של \( G \); צריך שתת-החבורה תהיה מה שקראנו לו נורמלית. בניסוח אחד, נורמליות הייתה סגירות להצמדה. אנחנו צריכים לקחת \( a\in G \) כלשהו ולהוכיח ש-\( a\left(\ker f\right)a^{-1}\subseteq\ker f \), אבל זה קל. נניח ש-\( b\in\ker f \), כלומר \( f\left(b\right)=e_{H} \). אז

\( f\left(aba^{-1}\right)=f\left(a\right)f\left(b\right)f\left(a\right)^{-1}=f\left(a\right)e_{H}f\left(a\right)^{-1}=e_{H} \)

ולכן \( aba^{-1}\in\ker f \). קיבלנו שהגרעין של \( f \) הוא תמיד תת-חבורה נורמלית. תכף נראה גם את ההפך - שכל תת-חבורה נורמלית של \( G \) היא גרעין של הומומורפיזם כלשהו שתחומו \( G \). לפני כן, בואו נוכיח את משפט האיזומורפיזם הראשון. אנחנו רוצים להראות \( G/\ker f\cong H \), אז בואו נראה הומומורפיזם שהוא חח”ע ועל \( \Phi:G/\ker f\to H \). אני משתמש באות \( \Phi \) שהיא אות יוונית גדולה כדי שלא נתבלבל עם אותיות לטיניות כמו \( f \) שאינטואיטיבית מתארות הומומורפיזמים שהתחום שלהם הוא החבורה \( G \) ולא חבורת מנה של \( G \). כדי לפשט את הסימונים אני גם אכתוב את הקוסט של \( a \) בתור \( \left[a\right] \) במקום לכתוב \( a\cdot\ker f \) כמו בדרך כלל.

את \( \Phi \) צריך להגדיר על הקוסטים של \( G/\ker f \). איך נעשה את זה? הדרך המקובלת לעבוד עם קוסטים היא לבחור נציג. מה אני יכול לעשות עם נציג בהקשר הזה? להפעיל עליו את \( f \). אז בואו נגדיר: \( \Phi\left(\left[a\right]\right)=f\left(a\right) \). אני צריך להראות את הדברים הבאים: ש-\( \Phi \) מוגדרת היטב. שהיא הומומורפיזם. שהיא על. שהיא חח”ע.

המשמעות של “מוגדרת היטב” כאן היא שהערך שהיא מחזירה על קוסט לא תלוי בבחירה של הנציג לאותו קוסט. זה נובע בדיוק מכך שכאן כל האיברים בקוסט נשלחים לאותו פלט של \( f \). בואו נראה את זה פורמלית: אם \( \left[a\right]=\left[b\right] \) זה אומר ש-\( ab^{-1}\in\ker f \), כלומר ש-\( f\left(ab^{-1}\right)=e_{H} \), כלומר ש-\( f\left(a\right)=f\left(b\right) \), כפי שרצינו (בעצם כבר ראינו את זה קודם - מפה התחלנו). אם כן, ההגדרה שלנו עובדת במקרה הנוכחי כי אני יודע מראש שהקוסטים הם ספציפית של הגרעין של ההומומורפיזם \( f \); סתם לקחת הומומורפיזם כלשהו שתחומו \( G \) ולהגדיר אותו כך על הקוסטים לאו דווקא היה עובד.

העובדה ש-\( \Phi \) הומומורפיזם נובעת מכך ש-\( G/\ker f \) הוא לא סתם אוסף קוסטים אלא חבורה שבה אפשר לבצע כפל קוסטים באמצעות כפל נציגים:

\( \Phi\left(\left[a\right]\cdot\left[b\right]\right)=\Phi\left(\left[a\cdot b\right]\right)=f\left(a\cdot b\right)=f\left(a\right)f\left(b\right)=\Phi\left(\left[a\right]\right)\Phi\left(\left[b\right]\right) \)

העובדה ש-\( \Phi \) על נובעת מכך ש-\( f \) היא על. אם \( y\in H \) הוא איבר כלשהו אז קיים \( x\in G \) כך ש-\( f\left(x\right)=y \) ולכן \( \Phi\left(\left[x\right]\right)=y \).

נשארה רק החד-חד-ערכיות שהיא בעצם הסיבה שבגללה אנחנו כאן. אינטואיטיבית, כל הרעיון במשפט האיזומורפיזם הראשון הוא “למזג” את האיברים שמקלקלים את החד-חד-ערכיות לאיבר בודד, כך שהחד-חד-ערכיות תחזור לעצמה. אם כן, נניח ש-\( \Phi\left(\left[a\right]\right)=\Phi\left(\left[b\right]\right) \), כלומר \( f\left(a\right)=f\left(b\right) \), כלומר \( f\left(ab^{-1}\right)=e_{H} \), כלומר \( ab^{-1}\in\ker f \), כלומר \( \left[a\right]=\left[b\right] \), כפי שרצינו. זה מסיים את הוכחת המשפט.

למה המשפט הזה בעצם מועיל? במתמטיקה מאוד אוהבים את הקטע הזה של להראות ששני דברים הם איזומורפיים, כי אז אנחנו יכולים להשתמש באחד מהם כדי להבין את השני. במקרה הנוכחי, אם אנחנו מבינים טוב את חבורות המנה של חבורה מסויימת אז אפשר להבין טוב את כל מה שיכול להתקבל בתור תמונה של החבורה הזו; ובכיוון השני, אם אנחנו מבינים טוב תמונות של חבורה כלשהי אז אנחנו מבינים טוב את חבורות המנה שלה. בואו נראה דוגמה לסיטואציה הראשונה - איך הבנה טובה של חבורות המנה של חבורה מסויימת עוזרת לנו להבין חבורות אחרות. הדוגמה הזו היא סגירת חוב שיש לי מפוסטים קודמים: טענתי שהחבורות הציקליות היחידות הן \( \mathbb{Z} \) ו-\( \mathbb{Z}_{n} \) לכל \( n \) טבעי. עכשיו אפשר לנסח את זה פורמלית: כל חבורה ציקלית איזומורפית ל-\( \mathbb{Z} \) או ל-\( \mathbb{Z}_{n} \) עבור \( n \) טבעי כלשהו.

בואו נוכיח את זה. תהא \( G=\left\langle g\right\rangle \) חבורה ציקלית כלשהי עם יוצר \( g \). כלומר, אנחנו יודעים שכל איבר ב-\( G \) הוא מהצורה \( g^{k} \) עבור \( k\in\mathbb{Z} \) כלשהו. רואים לאן זה הולך? החבורה \( \mathbb{Z} \) צצה כאן כמעט מאליה. בואו נגדיר את ההומומורפיזם המתבקש כאן: \( f:\mathbb{Z}\to G \) על ידי \( f\left(k\right)=g^{k} \). משפט האיזומורפים נותן לנו מייד ש-\( \mathbb{Z}/\ker f\cong G \). מיהן בכלל המנות של \( \mathbb{Z} \)? כל תת-חבורה של \( \mathbb{Z} \) היא מהצורה \( n\mathbb{Z} \) עבור \( n \) טבעי או שהיא תת-החבורה הטריוויאלית \( \left\{ 0\right\} \). המנה \( \mathbb{Z}/n\mathbb{Z} \) איזומורפית ל-\( \mathbb{Z}_{n} \) ואילו \( \mathbb{Z}/\left\{ 0\right\} \) איזומורפית ל-\( \mathbb{Z} \). זה מסיים את ההוכחה. ייתכן שאתם תוהים למה \( \mathbb{Z}/n\mathbb{Z}\cong\mathbb{Z}_{n} \); האיזומורפיזם הוא פשוט \( f\left(\left[a\right]\right)=a\text{ mod }n \).

ההוכחה לעיל היא די נפלאה לטעמי. זה לא שאי אפשר בלי משפט האיזומורפיזם הראשון. אפשר! פשוט אומרים משהו בסגנון “אם הסדר של \( g \) הוא \( n \) אז כך וכך ואם הסדר הוא אינסופי אז כך וכך”, כלומר יש טיפה חלוקה למקרים וטיפה צריך לנמק יותר. אבל ההוכחה בעזרת משפט האיזומורפיזם הראשון קולעת בול ולעניין. מה שנחמד פה הוא שאפשר לחשוב על כך שיש רק חבורה ציקלית “בסיסית” אחת, \( \mathbb{Z} \), וכל יתר החבורות הציקליות נגזרות ממנה איכשהו.

בואו נחדד טיפה את העניין הזה. ניקח חבורה \( G \) עם תת-חבורה נורמלית \( N \) ונסתכל על חבורת המנה \( G/N \). כמעט מאליה צצה לנו לעיניים הפונקציה \( \pi:a\to aN \) ששולחת את \( a\in G \) לקוסט שלו ב-\( G/N \). הפונקציה הזו היא הומומורפיזם כי \( \pi\left(a\right)\pi\left(b\right)=aNbN=abN=\pi\left(ab\right) \) - זו הייתה המהות של כך שחבורת המנה היא חבורה שפעולת הכפל שלה ניתנת לביצוע “ברמת האיברים” (וכבר השתמשנו בזה קודם בפוסט). מה הגרעין של ההומומורפיזם? איבר היחידה של \( G/N \) הוא \( eN=N \). כלומר, \( \ker\pi=N \). הנה קיבלנו שכל תת-חבורה נורמלית של \( G \) היא גרעין של איזה שהוא הומומורפיזם על \( G \) - ולא היינו צריכים הומומורפיזם שהולך אי שם מעבר לקשת אלא פשוט אחד שהולך לחבורת המנה עצמה. להומומורפיזם ה”טבעי” הזה אני קורא הטלה של \( G \) על \( G/N \), או אפילו בשם הפלצני ההטלה הטבעית של \( G \) על \( G/N \), אם כי כדי להסביר מה “טבעי” כאן בצורה מדויקת אני אצטרך לגלוש לענייני תורת הקטגוריות שאני לא רוצה להיכנס אליהם כאן.

עדיין, אני כן רוצה לומר משהו שיתן את הרוח של תורת הקטגוריות כאן. לחבורות מנה יש תכונה שנקראת תכונה אוניברסלית, שההגדרה המדויקת שלה (שלא אביא כאן) תופסת את התחושה הזו של “הדרך הקנונית להבין תמונות של חבורה \( G \) היא על ידי הסתכלות על חבורות המנה של \( G \)”.

אז תהא \( G \) חבורה עם תת-חבורה נורמלית \( N \) וההטלה \( \pi:G\to G/N \). כעת, יהא \( f:G\to H \) הומומורפיזם כלשהו מ-\( G \) לחבורה כלשהי \( H \) שאנחנו דורשים ממנו רק דבר אחד: \( N\subseteq\ker f \). זו דרך אחרת לומר “איברים שנמצאים באותו קוסט של \( N \) מועתקים על ידי \( f \) לאותו פלט” (כי אם \( x,y \) באותו קוסט אז \( xy^{-1}\in N \) ולכן \( xy^{-1}\in\ker f \) ולכן \( f\left(x\right)=f\left(y\right) \)). עכשיו מתקיים הקסם הבא: קיים הומומורפיזם יחיד \( h:G/N\to H \) כך שמתקיים \( f=h\circ\pi \). כלומר, אפשר לפרק את \( f \) להרכבה של שני הומומורפיזמים: קודם הולכים אל המנה עם \( \pi \) ואחר כך הולכים מהמנה אל \( H \) עם ה-\( h \) החדש הזה. בניסוח אחר, \( G/N \) היא בעלת התכונה שלכל \( f:G\to H \) עם \( N\subseteq\ker f \) קיים ויחיד \( h:G/N\to H \) שגורם לדיאגרמה הבאה להיות קומוטטיבית:

\xymatrix{G\ar[d]_{\pi}\ar[dr]^{f}\\G/N\ar[r]_{h} & H}

זה אומר שעל כל ההומומורפיזמים מ-\( G \) שהגרעין שלהם מכיל את \( N \) אפשר לחשוב כאילו הם בנויים מאיזה “מקטע התחלתי” שהוא תמיד אותו דבר - \( \pi \) - ואחרי המקטע ההתחלתי הזה מגיע “התוכן האמיתי” של ההומומורפיזם, כשאותו “תוכן אמיתי” מוגדר כבר על אברי \( G/N \). דהיינו, האובייקט שאנחנו באמת רוצים להבין כשאנחנו מדברים על הומומורפיזמים כאלו הוא \( G/N \).

ה”אוניברסליות” של התכונה הזו מתבטאת בכך ש-\( G/N \) הוא יחיד עד כדי איזומורפיזם. אפשר היה אולי לחשוב שקיימת חבורה כלשהי \( E \) והומומורפיזם \( \tau:G\to E \) כך שאפשר לפרק כל הומומורפיזם מ-\( G \) שמכיל כך-וכך למקטע התחלתי של \( \tau \) ואז משהו שנקבע ביחידות; אבל אפשר להוכיח שאם יש \( E \) כזו אז היא איזומורפית ל-\( G/N \), כך שבמובן מסויים \( G/N \) הוא האובייקט היחיד מסוגו.

כאמור, את נפנופי הידיים הללו אפשר לפרמל במסגרת תורת הקטגוריות, למקרה שמישהו התחיל להתעניין. אנחנו נמשיך לראות עוד דוגמאות לתכונות אוניברסליות שכאלו בהמשך.

השם “משפט האיזומורפיזם הראשון” מרמז שיש יותר מאחד. למעשה, יש בסך הכל ארבעה ונראה אותם בפוסט הבא, החל כמובן ממשפט האיזומורפיזם הרביעי. למה להתחיל מהרביעי? אשאיר אתכם במתח!

 


נהניתם? התעניינתם? אם תרצו, אתם מוזמנים לתת טיפ:

Buy Me a Coffee at ko-fi.com