קומוטטורים וחבורות פתירות

סדרת הפוסטים שלי על תורת החבורות התחילה ברובה עם חבורות אבליות, כאלו שבהן \( ab=ba \). חבורות כאלו, הזהרתי מראש, הן פשוטות יחסית. בפוסטים האחרונים אנחנו לאט לאט נוגעים בכל מני חבורות לא אבליות מעניינות כמו חבורת התמורות והחבורה הדיהדרלית, ומדברים על מושגים שיש להם משמעות רק בהקשר של חבורות לא אבליות כמו מכפלה חצי ישרה. גם בפוסט הזה אני רוצה לדבר על מושג כזה - קומוטטורים. זה מושג מעניין במיוחד בהקשר של הדיון על חבורות אבליות מול לא אבליות, כי הוא עוסק ישירות במדידה עד כמה חבורה לא אבלית היא “רחוקה מלהיות אבלית”. ההתעסקות בקומוטטורים גם תוביל אותנו להגדרה חשובה למדי של תכונה שחבורה יכולה לקיים או לא, שנקראת חבורה פתירה. התכונה הזו צצה לראשונה בהקשר המקורי שבו צצה תורת החבורות של גלואה - הנסיון להבין מתי ניתן לפתור משוואות פולינומיות באמצעות “נוסחת שורשים”. לא נאמר על זה שום דבר בפוסט הזה כי הצגה נכונה של הנושא דורשת היכרות עם תורת השדות, שאני לא מניח כאן - אבל אם נגיע לזה מתישהו בבלוג, נזדקק למושג הפתירות שאני מראה כאן.

אם \( a,b\in G \) הם איברים כלשהם בחבורה כלשהי, אז הקומוטטור שלהם הוא איבר ב-\( G \) שמסומן ב-\( \left[a,b\right] \) ומוגדר להיות \( a^{-1}b^{-1}ab \). למה ההגדרה המפחידה הזו? כי אנחנו רוצים שיתקיים \( ab=ba\left[a.b\right] \). במילים אחרות, הקומוטטור הוא ה”תיקון” שבו צריך לכפול את \( ba \) כדי שיהיה שווה ל-\( ab \). בפרט, אם \( a,b \) מתחלפים בכפל אז \( \left[a,b\right]=e \), ובחבורה אבלית כל זוג איברים מתחלף בכפל ולכן הקומוטטור של כל שני איברים הוא \( e \) ולכן כל המושג הזה לא מעניין.

בחבורה לא אבלית המושג הזה מעניין. ולא רק המושג הזה אלא גם האוסף של כל הקומוטטורים. האוסף הזה לאו דווקא יהיה תת-חבורה בעצמו, אבל תמיד אפשר לדבר על תת-החבורה שהוא יוצר, והיא כל כך חשובה שיש לה סימון ושם משלה: \( G^{\prime}\triangleq\left\langle \left[a,b\right]\ |\ a,b\in G\right\rangle \) - החבורה הזו נקראת “תת-חבורת הקומוטטורים” של \( G \) (שם קצת מטעה, כאמור, כי אוסף הקומוטטורים הוא לאו דווקא תת-חבורה בעצמו) או, השם שאשתמש בו יותר, תת-החבורה הנגזרת של \( G \). הסימן שבו אנחנו משתמשים - תג - הוא אותו הסימן שבו משתמשים לרוב כדי לתאר נגזרת בחדו”א. האם זה אומר שיש קשר בין שני המושגים הללו? לא שידוע לי. משתמשים ב”נגזרת” כדי לתאר כל מני דברים במתמטיקה שלא קשורים ישירות לנגזרת המוכרת לנו מחדו”א.

הנה סיבה שבגללה תת-החבורה הנגזרת חשובה כל כך: תכף אראה שהיא תמיד נורמלית ב-\( G \), כלומר תמיד אפשר ליצור את חבורת המנה \( G/G^{\prime} \). עכשיו, מה זו חבורת מנה? דרך אחת לחשוב על \( G/A \) היא בתור החבורה שמתקבלת מ-\( G \) כאשר “מכווצים” את כל האיברים ב-\( A \) לאיבר אחד - היחידה. אם תרצו, היא מה שמתקבל כשמוסיפים להגדרה של \( G \) יחסים חדשים בין איברים, שקובעים שכל איבר ב-\( A \) יהיה שווה ל-\( e \). על כן, \( G/G^{\prime} \) היא חבורה שמתקבלת מ-\( G \) כאשר מוסיפים בין היתר את הדרישה ש-\( a^{-1}b^{-1}ab=e \) לכל \( a,b\in G \), כלומר את הדרישה ש- \( ab=ba \) לכל \( a,b\in G \). זה אומר ש-\( G/G^{\prime} \) בהכרח תהיה חבורה אבלית, וש-\( G^{\prime} \) היא המינימום הנדרש כדי לקבל חבורת מנה אבלית. ותכף תיכנס גם תכונה אוניברסלית פנימה. התהליך הזה שבו לוקחים חבורה ו”מכריחים אותה להיות אבלית” - דהיינו מחלקים בתת-חבורת הקומוטטור - נקרא אבליזציה של החבורה. לי נראה שקריטי להתחיל בכלל את הדיון על קומוטטורים כשיש לנו את התמונה המנטלית הזו של “מה עושים עם קומוטטורים” בראש, לפני שניגשים לפורמליזם.

פורמליזם, רשימת קניות:

  1. למה \( G^{\prime} \) נורמלית ב-\( G \)?
  2. למה \( G/G^{\prime} \) אבלית?
  3. באיזה מובן \( G^{\prime} \) מינימלית?
  4. מה הקטע עם הדיאגרמה הקומוטטיבית?

בשביל 1 בואו נראה הגדרה נוספת: נניח ש-\( A,B \) הן שתי תת-קבוצות של \( G \), אז נסמן \( \left[A,B\right]=\left\langle \left[a,b\right]\ |\ a\in A,b\in B\right\rangle \) - כלומר, \( \left[A,B\right] \) היא תת-החבורה הנוצרת על ידי קומוטטורים של איברים מ-\( A \) ומ-\( B \) (ועל כן \( G^{\prime}=\left[G,G\right] \)). הסימון הזה מאפשר לנו לתת אפיון אלטרנטיבי חדש ל”מהי תת-חבורה נורמלית”: \( A \) נורמלית ב-\( G \) אם ורק אם \( \left[A,G\right] \) היא תת-חבורה של \( A \). כדי לראות למה זה נכון, בואו ניזכר מה זו תת-חבורה נורמלית: זה אומר שלכל \( g\in G \), \( g^{-1}Ag\subseteq A \), כלומר שלכל \( a\in A \) קיים \( a^{\prime}\in A \) כך ש-\( g^{-1}ag=a^{\prime} \). אם נכפול משמאל ב-\( a^{-1} \) נקבל ש-\( \left[a,g\right]=a^{-1}g^{-1}ag=a^{-1}a^{\prime}\in A \), מה שנותן לנו את הכיוון שבו \( \left[A,G\right] \) היא תת-חבורה של \( A \) (הראינו שהיא תת-קבוצה; היא תת-חבורה על פי הגדרתה, בתור החבורה שנוצרת על ידי הקומוטטורים). הכיוון השני דומה. כעת, כל איבר ב-\( \left[G^{\prime},G\right] \) הוא קומוטטור של איברים ב-\( G \) ולכן הוא איבר של \( G^{\prime} \) בעצמו - הנורמליות של \( G^{\prime} \) כמעט מובנת מאליה.

באופן דומה גם העובדה ש-\( G/G^{\prime} \) אבלית כמעט מובנת מאליה. פשוט נעשה את החשבון:

\( \left(aG^{\prime}\right)\left(bG^{\prime}\right)=\left(abG^{\prime}\right)=\left(ba\left[a,b\right]G^{\prime}\right)= \)

\( =\left(bG^{\prime}\right)\left(aG^{\prime}\right)\left(\left[a,b\right]G^{\prime}\right)=\left(bG^{\prime}\right)\left(aG^{\prime}\right) \)

המעבר האחרון נובע מכך ש-\( \left[a,b\right]\in G^{\prime} \).

כעת, באיזה מובן \( G^{\prime} \) מינימלית? במובן הבא: אם \( A \) היא תת-חבורה נורמלית כלשהי כך ש-\( G/A \) היא אבלית, אז \( G^{\prime}\subseteq A \). למה? האינטואיציה שלי היא שלילית באופיה: אם לא כל \( G^{\prime} \) היה בתוך \( A \), אז בתוך המנה \( G/A \) “חסר” אחד מהקומוטטורים, ולכן משהו ייפגם באבליות של \( G/A \). הדרך לפרמל את האינטואיציה הזו היא חיובית: ניקח קומוטטור, ונראה שבגלל ש-\( G/A \) היא אבלית אז בהכרח בתוך \( G/A \) הקומוטטור הזה הוא האדיש. מכיוון שהאדיש של \( G/A \) הוא \( A \) עצמה, נובע מכך שהקומוטטור בחבורה המקורית הוא איבר של \( G \). יהיו אם כן \( a,b\in G \), אז מתקיים בחבורת המנה \( G/A \) השוויון

\( \left[a,b\right]A=\left(a^{-1}b^{-1}ab\right)A=\left(a^{-1}A\right)\left(b^{-1}A\right)\left(aA\right)\left(bA\right) \)

\( =\left(a^{-1}A\right)\left(aA\right)\left(b^{-1}A\right)\left(ba\right)=\left(a^{-1}aA\right)\left(b^{-1}bA\right)=A \)

כאשר המעבר בין השורות, היחיד המעניין כאן, נובע מכך ש-\( G/A \) אבלית.

ומה הקטע עם הדיאגרמה הקומוטטיבית, אתם שואלים? זו פשוט דרך לנסח את מה שראינו עד כה בשפה של דיאגרמות קומוטטיביות - שפה שבמבט ראשון נראית יותר מסובכת שלא לצורך, אבל הכוח שלה הוא מן הסתם בכך שהיא מאפשרת לדבר על דברים מסובכים יותר בצורה פשוטה יותר, ולכן כדאי להתחיל להכיר אותה כבר מהדברים הפשוטים. במקרה הנוכחי, הדיאגרמה היא

\xymatrix{G\ar[r]^{\pi}\ar[dr]_{f} & G/G^{\prime}\ar[d]_{g}\\ & A }

כאשר \( A \) היא חבורה אבלית כלשהי. הקומוטטיביות, נזכיר, אומרת את הדבר הבא: כל חץ הוא הומומורפיזם (במקרה הנוכחי של חבורות כי זה ההקשר), והרעיון הוא שההומומורפיזם \( f \) “מתפרק” לשני חלקים: חלק אחד קנוני, שלא תלוי ב-\( f \), של ההטלה הטבעית מ-\( G \) אל \( G/G^{\prime} \) (כלומר, \( a\mapsto aG^{\prime} \)) ואילו החלק השני, \( g \), נקבע באופן יחיד על פי \( f \). כרגיל, אני נכנס מלהיכנס לעומק הפרטים של תורת הקטגוריות ולהסביר את ההקשר הכללי יותר של הדיאגרמות הללו; אם נגיע לפוסטים בתורת הקטגוריות יהיה נחמד שכבר יהיה לנו את הידע המוקדם הזה וכמה דוגמאות.

מכיוון שכבר הצגתי קומוטטורים אני רוצה להציג את המושג שעכשיו מתאפשר לי להגדיר באמצעותם, למרות שלבינתיים זו תהיה הגדרה כמעט ריקה - לא נבין בשביל מה היא טובה או מה ההקשרים הרחבים יותר שבהם היא נכנסת. עדיין, אפילו במה שאביא כאן יש תועלת כלשהי. הרעיון הוא פשוט: אנחנו למדנו מעין אופרטור חדש שאפשר להפעיל על חבורה כדי לקבל תת-חבורה מעניינת שלה: אופרטור ה”גזירה”. מה קורה אם גוזרים את החבורה שוב? הרי בחדו”א אנחנו מאוד אוהבים להסתכל גם על הנגזרת השניה, השלישית וכדומה של פונקציה, ואפילו אפשר להפיק מהן מידע לא טריוויאלי - ידיעת כל הנגזרות של פונקציה בנקודה מסויימת מאפשרת לנו לבנות טור טיילור של הפונקציה סביב הנקודה הזו, שנותן לנו קירוב פשוט של הפונקציה בעזרת פולינומים סביב הנקודה. מה קורה אם גוזרים חבורה שוב ושוב?

אינטואיציה אחת עשויה להיות שהנגזרת השניה תהיה שווה לראשונה וזהו. אבל אין סיבה עקרונית שזה יקרה: הקומוטטורים הם המינימום שאנחנו צריכים לחלק בו כדי לקבל מנה אבלית. אם אנחנו עכשיו מתחילים עם חבורה קטנה יותר, לא מופרך שנצטרך פחות איברים בשביל המינימום הזה. לכן יש טעם בהגדרה הבאה:

\( G^{\left(0\right)}\triangleq G \)

\( G^{\left(n+1\right)}\triangleq\left(G^{\left(n\right)}\right)^{\prime}=\left[G^{\left(n\right)},G^{\left(n\right)}\right] \)

בדיוק כפי שמגדירים נגזרות באופן אינדוקטיבי. כעת קל להגדיר את המושג של חבורה פתירה: זו חבורה שבה סדרת הנגזרות הזו מגיעה בסוף ל”אפס”, כלומר קיים \( n \) כך ש-\( G^{\left(n\right)}=\left\{ e\right\} \) - תת החבורה שכוללת רק את האדיש. אם \( G \) אבלית זה קורה מייד על הנגזרת הראשונה, כי הקומוטטור של זוג איברים מתחלפים הוא האדיש. המושג של חבורה פתירה מכליל, אם כן, את המושג של חבורה אבלית במובן מסויים: זו חבורה שהיא עצמה לאו דווקא אבלית אבל יש בה איזו סדירות כמו-אבלית שאפשר להגיע אליה בסופו של דבר.

לפתירות של חבורות יש הגדרה אחרת, שקולה, ונפוצה קצת יותר אבל כזו שתיראה לנו מוזרה עוד יותר במבט ראשון. הסיבה לכך היא שצריך להציג אותה בהקשר רחב יותר, של סדרות הרכב, וזה מושג שאני דוחה בכוונה לפוסט האחרון בסדרת הפוסטים הנוכחית על תורת החבורות (פוסט שהולך ומתקרב!) לכן, על מנת לעשות טיזר נטו ולא על מנת להסביר מה הולך פה לעזאזל, הנה ההגדרה השקולה: חבורה \( G \) היא פתירה אם קיימת בה סדרה של תת-חבורות \( \left\{ e\right\} =N_{0}\subseteq N_{1}\subseteq\dots\subseteq N_{k}=G \) כך שלכל זוג חבורות סמוכות \( N_{t-1},N_{t} \) מתקיים ש-\( N_{t-1} \) נורמלית ב-\( N_{t} \) והמנה שלהן \( N_{t}/N_{t-1} \) היא חבורה אבלית. כאמור, יש הסבר יפה מאחורי ההגדרה המוזרה לכאורה הזו, ונגיע אליו מאוחר יותר.

אני לא יכול לסיים את הפוסט הזה בלי להזכיר את אחד מהשימושים האהובים ביותר עלי של מה שתואר בו - משפט ברינגטון. יש לי פוסט על הנושא ולכן אתן גם כאן טיזר בלבד. מדובר על משפט שבכלל מגיע ממדעי המחשב - מתורת הסיבוכיות. הוא מספיק מעניין כדי להיחשב לאחת מהתוצאות המפתיעות בסיבוכיות בעשורים האחרונים, אבל לא אכנס להסבר מדויק של מה הוא אומר - הוא בעיקר אומר שמודל חישובי מסויים שנראה חלש הוא בעצם חזק בהרבה משנדמה לנו (תוצאה חיובית! בתורת הסיבוכיות! זה נדיר!). האופן שבו מוכיחים את המשפט כולל שימוש נרחב בתמורות בתמור נשא האינפורמציה בחישוב, דהיינו, במקום חישוב שמתבסס על 0 ו-1 נטו, שהוא מה שאנחנו מנסים לסמלץ, משתמשים בתמורה בתור יחידת מידע בסיסית. בשלב מסויים צריך לבצע מעין מקבילה לפעולת “וגם” שעושים על ביטים בודדים, והמקבילה שלה במודל-החישוב-בעזרת-תמורות היא קומוטטור של שתי התמורות שרוצים לעשות להן את ה”כמו-וגם”. מכיוון שאנחנו רוצים לבצע חישובים מאורך גדול, אנחנו צריכים להבטיח שגם אחרי שנבצע שוב ושוב ושוב את פעולת הקומוטטור הזו אנחנו לא “נקרוס” אל \( e \). דהיינו, אנחנו צריכים לקחת תמורות מתוך חבורת תמורות שהיא כבר לא פתירה. זו עובדה ידועה שנראה בהמשך ש-\( S_{5} \) (התמורות על חמישה איברים) היא לא חבורה פתירה, בזמן ש-\( S_{4} \) והקטנות ממנה דווקא כן פתירות: למעשה, זו הסיבה לכך שקיימות נוסחאות לפתרון משוואות עד מעלה 4 אבל לא ממעלה 5 ומעלה; על כן משתמשים ב-\( S_{5} \) במשפט ברינגטון (והמילה 5 אכן מככבת בניסוח המדויק שלו). אני מקווה שלפחות התוצאה המגניבה הזו, שמצריכה כמעט אפס הבנה מעבר להגדרה של חבורה פתירה, נותנת איזו תחושה למה זו הגדרה יפה.


נהניתם? התעניינתם? אם תרצו, אתם מוזמנים לתת טיפ:

Buy Me a Coffee at ko-fi.com