חוגים – מבוא קצת יותר פורמלי

הגדרות בסיסיות

אחרי פוסט המבוא שלי על חוגים, אני רוצה לתת פוסט קצת יותר פורמלי וקונקרטי, ועם קצת פחות נפנופי ידיים ויותר דוגמאות קונקרטיות. נתחיל מההגדרה הבסיסית: חוג (Ring) מורכב מקבוצה \(R\) ושתי פעולות בינאריות מעליה שאני מסמן ב-\(+\) וב-\(\cdot\) (את הכפל אני לרוב לא מסמן בכלל, כלומר במקום \(a\cdot b\) אני כותב \(ab\)). אנחנו דורשים ש-\(\left(R,+\right)\) תהיה חבורה אבלית (כן, אני מניח שאנחנו מכירים חבורות) שנסמן את איבר היחידה שלה ב-0, ופרט לכך אנחנו דורשים:

  • \(a\left(bc\right)=\left(ab\right)c\) לכל \(a,b,c\in R\) (אסוציאטיביות הכפל)
  • \(a\left(b+c\right)=ab+ac\) ו-\(\left(b+c\right)a=ba+ca\) לכל \(a,b,c\in R\) (דיסטריביוטיביות הכפל מעל החיבור)
  • קיים איבר \(1\in R\) כך ש-\(a\cdot1=1\cdot a=a\) לכל \(a\in R\).

לפעמים אני אשמיט את הדרישה השלישית כדי לקבל חוג בלי יחידה. דוגמא: \(\mathbb{Z}\) הוא חוג עם פעולות החיבור והכפל הרגילות. \(2\mathbb{Z}=\left\{ 0,2,-2,\dots\right\} \) הוא חוג עם פעולות הכפל והחיבור הרגילות, למעט הדרישה על קיום \(1\). אז ל-\(2\mathbb{Z}\) אני לפעמים אקרא חוג בלי יחידה.

מה אפשר לעשות עם ההגדרה הזו? כבר אפשר לראות כל מני דברים. למשל, בואו נראה ש-\(a\cdot0=0\) לכל \(a\in R\). תמיד.

\(a\cdot0=a\cdot\left(0+0\right)=a\cdot0+a\cdot0\)

כאן השתמשנו בכך ש-0 הוא איבר יחידה חיבורי (\(0+0=0\)) ובדיסטריביוטיביות. עכשיו נשתמש בקיום נגדי חיבורי, נוסיף \(-a\cdot0\) לשני האגפים ונקבל \(a\cdot0=0\).

מסקנה: אם \(0\ne1\) (כפי שקורה בכל חוג עם יותר מאיבר אחד), אז למשוואה \(0\cdot x=a\) עם המשתנה \(x\) והפרמטר \(a\) אין פתרון אף פעם אם \(a\ne0\). בניסוח פופולרי, "אי אפשר לחלק באפס" (ומה עם השאלה אם משתלם להגדיר \(\frac{0}{0}=0\) ? נעזוב אותה לפעם אחרת; אני לא רואה סיבה שבגללה זה משתלם). שימו לב בכמה מעט השתמשנו פה – אפילו לא באסוציאטיביות הכפל ובוודאי שלא בקיום איבר יחידה חיבורי. הקטע הזה שאי אפשר לחלק באפס טבוע עמוק בתכונות הבסיסיות ביותר של חוגים, ואם נרצה לחלק באפס נצטרך לוותר על כל מה שיש לנו בתורת החוגים.

אם \(ab=ba\) לכל \(a,b\in R\) אומרים ש-\(R\) קומוטטיבי, ואם לכל \(a\ne0\) קיים \(b\in R\) כך ש-\(ab=1\) (ׂראינו שעבור 0 זה פשוט בלתי אפשרי) אז אומרים ש-\(R\) הוא חוג עם חילוק, ואם \(R\) הוא חוג קומוטטיבי עם חילוק אומרים שהוא שדה. זה כמעט מסכם את רשימת הסוגים השונים של חוגים שאני רוצה לתת להם שמות, אבל יש עוד אחד.

הנה עוד דוגמא לחוג: \(\mathbb{Z}_{6}=\left\{ 0,1,2,3,4,5\right\} \) עם פעולות כפל וחיבור מודולו 6. למעשה, \(\mathbb{Z}_{n}\) הוא חוג לכל \(n\) טבעי, אבל אני מתעניין ספציפית ב-\(\mathbb{Z}_{6}\) בגלל תופעה שלא תתרחש ב-\(\mathbb{Z}_{7}\) או ב-\(\mathbb{Z}\) סתם: \(2\cdot3=0\). כלומר, יש לנו שני איברים שונים מאפס שהמכפלה שלהם שווה לאפס. לאיברים כאלו קוראים מחלקי אפס. קיום של מחלקי אפס מקלקל לנו תכונה אחרת שאנחנו רגילים אליה מהמספרים השלמים ומבית הספר בכלל – צמצום. אנחנו רגילים שאם \(ax=ay\) אז \(x=y\), והתכונה הנחמדה הזו אכן התקיימה גם בחבורות. בחוגים עם מחלקי אפס זה פשוט לא חייב לקרות אם \(a\) הוא מחלק אפס. כדי לראות, בואו ניזכר איך מוכיחים צמצום בדרך כלל: אם \(ax=ay\) אז \(ax-ay=0\), כלומר \(a\left(x-y\right)=0\). אם \(a\) איננו מחלק אפס, והוא עצמו שונה מאפס, אז \(x-y\) חייב להיות אפס ולכן \(x=y\) (שימו לב – לא השתמשתי כאן בכך שקיים ל-\(a\) הופכי; זה לא חייב לקרות בכלל). אם לעומת זאת \(a\) הוא מחלק אפס אז מובטח שיהיו \(x,y\)-ים שעבורם המשוואה לא נכונה. למשל, ב-\(\mathbb{Z}_{6}\) ראינו ש-3 הוא מחלק אפס עם "בן הזוג" 2, אז כל \(x,y\) שמקיימים \(x-y=2\) יקלקלו לנו. למשל, \(3\cdot3=3\cdot5=3\). בפרט, אם \(a\) הוא מחלק אפס אז הוא בהכרח לא הפיך, כי אחרת היה אפשר לצמצם על ידי כפל בהופכי שלו (פורמלית, אם \(a\) מחלק אפס אז קיים \(b\ne0\) כך ש-\(ab=0\), אבל עם כפל בהופכי של \(a\) נקבל \(b=0\)).

מכיוון שתכונת הצמצום כל כך נחמדה, אנחנו נותנים שם מיוחד לחוגים שהם נחמדים: גם קומוטטיביים וגם עם יחידה \(1\ne0\), וגם ללא מחלקי אפס. חוג כזה נקרא תחום שלמות (Integral Domain). אינטואיטיבית \(\mathbb{Z}\) הוא האבטיפוס של כל החוגים הללו. והנה יש לי שוב הזדמנות להראות תוצאה נחמדה שמתבססת על כמעט שום דבר: תחום שלמות סופי הוא בהכרח שדה. מה בעצם חסר בהגדרה של תחום שלמות כדי שיהיה שדה ממילא? בתחום שלמות כמו \(\mathbb{Z}\) (האינסופי) לא כל איבר הוא הפיך – רק \(1,-1\) הם הפיכים. המשפט אומר שאם תחום השלמות \(R\) הוא סופי, אז בהכרח כולם הפיכים למעט \(0\).

התעלול שמוכיח את זה די דומה למה שקורה בחבורות, ונחזור אליו גם בעתיד. אנחנו לוקחים \(a\in R\) כך ש-\(a\ne0\) ואז כופלים אותו בכל אברי החוג: מסמנים זאת \(\left\langle a\right\rangle \) או \(aR=\left\{ ar\ |\ r\in R\right\} \). עכשיו, מה גודל הקבוצה הזו? לכל היותר הגודל של \(R\), כי לכל איבר של \(r\) קיבלנו איבר \(ar\) בקבוצה, אבל הגודל שלה הוא גם לפחות כגודלו של \(R\), כי \(ar_{1}=ar_{2}\) גורר בתחום שלמות \(r_{1}=r_{2}\) ("כפל ב-\(a\) הוא חח"ע"). כלומר, \(aR=R\) ובפרט, מכיוון ש-\(1\in R\), קיים \(b\in R\) כך ש-\(ab=1\).

עכשיו, מה באשר לחוגים לא קומוטטיביים? ההוכחה שראינו קודם עבור תחומי שלמות מראה באותה מידה שגם בחוג לא קומוטטיבי סופי ללא מחלקי אפס יש הופכי לכל איבר שונה מאפס, כך שהמשפט שראינו ניתן לניסוח בתור "כל חוג סופי ללא מחלקי אפס הוא חוג עם חילוק", וכאן נכנס לתמונה משפט קצת יותר כבד, המשפט הקטן של ודרברן, שאומר שכל חוג עם חילוק סופי הוא בהכרח קומוטטיבי, ולכן שדה. אולי אוכיח את המשפט הזה בעתיד אבל כרגע אין לנו את הכלים הרלוונטיים עבור ההוכחה שלו.

כאילו שזה לא מספיק, בעתיד נראה גם שאנחנו יודעים בדיוק איך השדות הסופיים נראים: הגודל של שדה סופי חייב להיות \(p^{n}\) כאשר \(p\) ראשוני, ויש בדיוק שדה אחד מכל גודל אפשרי שכזה. זה לא אומר ששדות סופיים הם לא מעניינים – הם מאוד מעניינים – אבל העיסוק בהם לא יהיה רלוונטי לנו בזמן הקרוב, מה שמסביר למה אנחנו הולכים לדבר מעט מאוד על חוגים סופיים באופן כללי. זה כבר מרחיק אותנו בצורה דרסטית מחבורות – בחבורות רוב מה שעשינו (למשל, משפט לגראנז') היה קשור לחבורות סופיות. כשאנחנו מדברים על חוגים אנחנו בדרך כלל נדבר על חוגים אינסופיים ואפשר לומר יפה שלום למשפטי המבנה הנחמדים שראינו בחבורות, למרות שלכאורה חוג הוא "חבורה עם עוד איזה משהו".

עוד הגדרה מתבקשת שאין סיבה להתעכב איתה היא תת-חוג. זה אותו הרעיון כמו בחבורות: תת-חוג של \(R\) הוא תת-קבוצה של \(R\) שהיא בעצמה חוג. על פי רוב, כש-\(R\) הוא חוג עם יחידה, אנחנו דורשים שגם תת-חוג יכיל את אותה היחידה. אני אתן דוגמא זריזה: המטריצות מסדר 2 על 2 מעל הממשיים הן חוג עם יחידה – היחידה היא \(\left[\begin{array}{cc} 1 & 0\\ 0 & 1 \end{array}\right]\). אפשר לדבר על תת-החוג של המטריצות מהצורה \(\left[\begin{array}{cc} a & 0\\ 0 & 0 \end{array}\right]\), כלומר כאלו שבהן כל הכניסות הן 0 למעט הכניסה השמאלית-עליונה, שיכולה להיות מספר ממשי כלשהו. לא קשה לראות שתת-החוג הזה הוא בעצם הממשיים עצמם בתחפושת. עכשיו, היחידה של החוג המקורי, \(\left[\begin{array}{cc} 1 & 0\\ 0 & 1 \end{array}\right]\), היא בכלל לא איבר בתת-החוג הזה, אבל עדיין יש לו איבר יחידה משל עצמו: \(\left[\begin{array}{cc} 1 & 0\\ 0 & 0 \end{array}\right]\). אם כן, האם תת-החוג הזה אכן ראוי להיקרא תת-חוג? כן? לא? זה הכל תלוי בהגדרות ובמטרה שההגדרות מנסות להשיג. יותר מאשר חשוב להכיר את ההגדרות הללו, לטעמי, חשוב לזכור את המורכבות האפשרית של הסיטואציות שהן מנסות לתפוס.

דוגמאות לחוגים

כמו שהדוגמא הזריזה שלי לפני רגע הראתה, אין כמעט טעם לדבר על חוגים בלי, ובכן, לדבר על חוגים. בלי שיהיה לנו אוסף גדול של חוגים בסיסיים שאנחנו יכולים לשלוף ממנו דוגמאות והקשרים כשמתחשק לנו.

חוגי שלמים

כבר אמרתי ש-\(\mathbb{Z}\) הוא אבטיפוס של חוג המון פעמים. מי החוגים הדומים לו? בואו נראה דוגמא לאופן שבו אפשר לבנות חוגים קצת יותר מתוחכמים מ-\(\mathbb{Z}\) אבל שמשמרים חלק מהדמיון ונקראים חוגי שלמים: ניקח \(D\in\mathbb{Z}\) כלשהו ונסתכל על הקבוצה \(\mathbb{Z}\left[\sqrt{D}\right]\triangleq\left\{ a+b\sqrt{D}\ |\ a,b\in\mathbb{Z}\right\} \). הקבוצה הזו היא בבירור תת-חוג של \(\mathbb{C}\): הדבר היחיד שאולי לא ברור מייד הוא הסגירות לכפל, והרי \(\left(a+b\sqrt{D}\right)\left(x+y\sqrt{D}\right)=\left(ax+Dby\right)+\left(ay+bx\right)\sqrt{D}\). למשל, עבור \(D=-1\) אנחנו מקבלים את מה שנקרא השלמים הגאוסיים, \(\mathbb{Z}\left[i\right]\triangleq\left\{ a+bi\ |\ a,b\in\mathbb{Z}\right\} \) והזכרתי בפוסט הקודם. השלמים הללו הם חוג מעניין – הוא תחום שלמות, ואפשר לסווג בו איברים ל"פריקים" (מתפרקים למכפלה שני של איברים לא הפיכים) ו"אי פריקים", ולכן להגדיר סוג חדש של ראשוניים. מגלים, למשל, ש-\(7\) הוא עדיין ראשוני גם בחוג הזה אבל \(5=\left(1+2i\right)\left(1-2i\right)\) כבר לא, וכן הלאה. עם הראשוניים החדשים הללו יש לנו סוג של "המשפט היסודי של האריתמטיקה" – כל איבר בחוג ניתן להצגה יחידה (עד כדי כפל באיבר הפיך) בתור מכפלה של אי-פריקים. חוג שבו התכונה הזו מתקיימת נקרא תחום פריקות יחידה.

הטרגדיה הגדולה של של חוגי שלמים היא שלא כולם הם תחומי פריקות יחידה. למשל, בואו נסתכל על \(\mathbb{Z}\left[\sqrt{-5}\right]\). בחוג הזה מתקיים ש-\(6=2\cdot3=\left(1+\sqrt{-5}\right)\left(1-\sqrt{-5}\right)\), ואפשר להוכיח שכל האיברים במכפלות הללו הם אי-פריקים. זה אומר ש-\(\mathbb{Z}\left[\sqrt{-5}\right]\) הוא בעצם עולם חדש מופלא מבחינתנו – כל מני תוצאות שהורגלנו אליהן ב-\(\mathbb{Z}\) בזכות המשפט היסודי של האריתמטיקה לא יעבדו. הדבר הזה גרם, למשל, להוכחה השגויה המפורסמת ביותר של המשפט האחרון של פרמה (זו של לאמה ב-1847) ולסוג-של-פתרון שלה על ידי קומר בערך באותו הזמן, שהוביל בין היתר להוכחה שלו של המשפט האחרון של פרמה למקרים פרטיים מסויימים ולהולדת של תורת המספרים האלגברית.

מה שהצגתי פה הוא רק מקרה פרטי אחד של חוגי שלמים – מה שנקרא "חוגי שלמים ריבועיים" (כי אנחנו מוסיפים שורש של פולינום ריבועי), ואפילו כאן קצת רימיתי (לפעמים לא מוסיפים את \(\sqrt{D}\) אלא את \(\frac{1+\sqrt{D}}{2}\) כי סיבות), אבל לפרט יותר מדי בנושא יגרור אותנו לכיוון של תורת השדות, שזה תחום שטרם דיברתי עליו (בהינתן הרחבת שדות של \(\mathbb{Q}\), חוג השלמים שלה היא כל אברי השדה הגדול שמאפסים פולינום מתוקן מעל \(\mathbb{Q}\)).

חוגי שאריות

כשדיברנו על חבורות, אחד מסוגי החבורות שצצו באופן טבעי היו החבורות הציקליות מסדר \(n\), שסימנו בתור \(\mathbb{Z}_{n}\) וכללו את המספרים בתחום \(\left\{ 0,1,\dots,n-1\right\} \) עם חיבור מודולו \(n\). בתור חבורות היצורים הללו היו מאוד פשוטים ונענו בדיוק לאותם הכללים, אבל אם מכניסים לתמונה גם את פעולת הכפל, אנחנו מקבלים חוגים שונים ומשונים ובעלי מבנה מאוד לא אחיד. אם \(n\) הוא ראשוני, אנחנו נקבל שדה; אם לעומת זאת \(n\) הוא פריק אנחנו נקבל תמיד חוג עם מחלקי אפס. יש דרך מעניינת לסווג את מיהם מחלקי האפס בחוגים הללו, ויש משפט מבנה יפה שמתאר בצורה מלאה את המבנה של כל חוג \(\mathbb{Z}_{n}\) אפשרי, אבל למה לגלות דברים עכשיו.

קווטרניונים וחברים

חוג הקווטרניונים הוא הקבוצה \(\mathbb{H}\triangleq\left\{ a+bi+cj+dk\ |\ a,b,c,d\in\mathbb{R}\right\} \) כאשר \(i,j,k\) מתנהגים כמו האיברים המתאימים בחבורת הקווטרניונים, כלומר \(i^{2}=j^{2}=k^{2}=-1\) וכללי הכפל הם \(ij=k,jk=i,ki=j\). בהינתן הכללים הללו אפשר להגדיר כפל על שני קווטרניונים פשוט על ידי החוקים הללו ודיסטריביוטיביות רגילה של מספרים ממשיים. הקווטרניונים מסומנים ב-H על שם הממציא שלהם, המילטון; השאלה למה הוא בכלל המציא אותם ומה השימוש שלהם היא מעניינת מאוד אבל לא אכנס אליה כרגע.

הקווטרניונים נראים כמו "המרוכבים כפול שתיים" כי אם המרוכבים "נוצרים" על ידי \(1,i\) אז פה הוספנו עוד שני יוצרים. אפשר היה אולי לקוות שהם יהיו שדה, כמו המרוכבים, אבל הם לא קומוטטיביים: \(ij=-ji\), למשל. לכן הם מסתפקים בלהיות רק "חוג עם חילוק". האם יש גם "הקווטרניונים כפול שתיים", עם שמונה יוצרים! כן, קוראים להם האוקטוניונים והם גם כן חוג עם חילוק. ומה עם 16 יוצרים? אפשר לעשות משהו כזה גם כן, אבל אז כבר מקבלים יצור שהכפל בו הוא לא אסוציאטיבי, מה שמוציא אותנו ממסגרת הדיון הזו.

חוגי פולינומים

הנה לכם שאלה פילוסופית: מהו פולינום? אנחנו מכירים את היצורים הללו עוד מבית הספר, אבל לא לגמרי ברור מה הם. פולינום הוא תערובת מוזרה של שני יצורים: מקדמים, שהם איברים שנלקחים מתוך איזו קבוצה שאנחנו מחבבים, ובהקשר שלנו תמיד תהיה שדה; ונעלם שאין לאף אחד מושג מה הוא בדיוק. אני אוהב לומר שהוא סימבול ותו לא, אבל מה זה אומר, שהוא סימבול?

הנה פולינום לדוגמא: \(3x^{3}-5x+7\). ההגיון הכללי פה הוא זה: אפשר לכפול את הנעלם במקדם, אבל התוצאה לא "מצטמצמת" מעבר לכך אלא אם המקדם הוא אפס, ואז פשוט לא כותבים את האיבר הזה במפורש. אפשר גם לכפול את הנעלם בעצמו ולקבל "חזקה" שלו. אנחנו גם יכולים להשתמש בנעלם בחזקת 0, ואז הוא לא נכתב במפורש בכלל אבל המקדם שלו כן, אם המקדם אינו אפס. על כל אלו אפשר לחשוב בתור קיצורי כתיבה. דרך יותר מפורטת לכתוב את \(3x^{3}-5x+7\) היא כך:

\(3\cdot x^{3}+0\cdot x^{2}+\left(-5\right)\cdot x^{1}+7\cdot x^{0}\)

אפשר גם לשאול בשביל מה בעצם צריך את הנעלם הזה. למה לא להגיד שפולינום הוא פשוט הסדרה \(\left(7,-5,0,3\right)\) וחסל? יש לכך כמה תשובות. הפשוטה ביותר היא שפעולת הכפל של פולינומים היא מסובכת: היא לא כפל "איבר-איבר" של הסדרות אלא משהו שנקרא קונבולוציה שלהן. הנה דוגמא פשוטה. נכפול את הפולינומים \(ax+b\) ו-\(cx+d\) אחד בשני. הכפל מתנהג על פי כללי הדיסטריביוטיביות הרגילים, כאילו \(x\) הוא איבר נחמד של שדה. מקבלים:

\(\left(ax+b\right)\left(cx+d\right)=acx^{2}+\left(ad+bc\right)x+bd\)

אם נתאר את זה על ידי "כפל סדרות", נקבל

\(\left(a,b\right)*\left(c,d\right)=\left(bd,ad+bc,ac\right)\)

לא נראה כמו פעולת כפל מתבקשת בלי ההקשר של המשתנה הנוסף, נכון? ויש גם את העניין הזה שלפעמים מתחשק לנו להציב בפולינום: להחליף את \(x\) באיבר של שדה כלשהו שמכיל גם את המקדמים, ואז לחשב "עד הסוף" את הערך של הפולינום. למשל, קחו את \(p\left(x\right)=2x^{2}+3\) ועכשיו תחליפו את \(x\) במספר המרוכב \(i\). תקבלו את הביטוי \(2i^{2}+3=-2+3=1\), ואת התוצאה הזו אפשר לתאר בתור \(p\left(i\right)=1\). באלגברה מופשטת, ובפרט בתורת השדות, יש משחק בלתי פוסק בין פולינומים כיצורים פורמליים, ש"לא מחשבים עד הסוף" ובין מה שקורה כשמציבים בהם דברים. אולי אחת ההגדרות המוכרות ביותר עבור פולינומים היא זו של שורש: אנחנו אומרים ש-\(a\) הוא שורש של פולינום \(p\) אם \(p\left(a\right)=0\). שימו לב שאין שום קשר בין המושג הזה ובין הפעולה של "הוצאת שורש" של מספר, למעט אולי הקשר הזה: אם \(t\) הוא שורש של הפולינום \(p\left(x\right)=x^{2}-a\) אז \(t\) הוא שורש ריבועי של \(a\) (וכנ"ל עבור הוצאת שורש שלישי וכו').

אם \(\mathbb{F}\) הוא שדה, אז אפשר תמיד לדבר על חוג הפולינומים מעל השדה הזה, שמסומן ב-\(\mathbb{F}\left[x\right]\). איבר כללי של החוג הזה נכתב בצורה \(a_{n}x^{n}+a_{n-1}x^{n-1}+\dots+a_{1}x+a_{0}\) כאשר \(a_{0},\dots,a_{n}\in\mathbb{F}\) ו-\(a_{n}\ne0\) (כלומר, המקדם של החזקה הגבוהה ביותר הוא לא "מיותר"). ל-\(a_{n}\) קוראים המקדם המוביל של הפולינום, ל-\(n\) קוראים המעלה (או הדרגה) של הפולינום ול-\(a_{0}\) (גם אם הוא 0 ולא נכתב במפורש) קוראים המקדם החופשי. אם \(a_{n}=1\) אומרים שהפולינום מתוקן; חלק מהרעיון הוא שאם המקדמים הוא מעל שדה, אז תמיד אפשר לחלק את כל המקדמים ב-\(a_{n}\) ולקבל פולינום מתוקן שיש לו קשר מסויים לפולינום המקורי. כלומר, ביצענו "תיקון" לפולינום המקורי (אבל בשביל מה התיקון הזה היה טוב? ימים יגידו). עכשיו קל לי לתאר חוגי שלמים, למשל: מספר ממשי נקרא אלגברי אם הוא שורש של פולינום במקדמים רציונליים והוא נקרא שלם אלגברי אם הוא שורש של פולינום במקדמים שלמים שהוא גם מתוקן. אם לא היינו דורשים מראש את ה"תיקון" הזה לא היינו מבדלים בין מספרים אלגבריים "סתם" ובין שלמים אלגבריים, כי תמיד אפשר לכפול במכנה המשותף של המקדמים.

הנה דוגמא: הפולינום \(p\left(x\right)=x^{2}-\frac{1}{4}\) מתאפס על ידי \(\frac{1}{2}\), כך ש-\(\frac{1}{2}\) הוא בבירור מספר אלגברי, אבל האם הוא שלם אלגברי? הוא לא מתאים לתפיסה שלנו של מהו מספר שלם, אז בואו נניח שלא. מצד שני, אם ניקח את \(p\left(x\right)=x^{2}-\frac{1}{4}\) ונכפול ב-4 נקבל את הפולינום הלא מתוקן \(4x^{2}-1\) שבהחלט מתאפס על ידי \(\frac{1}{2}\). כלומר, כל מספר אלגברי מאפס פולינום במקדמים שלמים; כדי שזה יהיה מעניין צריך לדרוש שזה יהיה פולינום מתוקן.

משהו נחמד מאוד עם פולינומים מעל שדה הוא שיש להם מבנה שמאוד מזכיר את זה של המספרים השלמים – גם אצלם יש מושג של חלוקה עם שארית, שגורר בתורו קיום של "המשפט היסודי של האריתמטיקה" עבור פולינומים (את המושג של "ראשוני" מחליף המושג של "פולינום אי-פריק") ועוד שלל דברים מגניבים שאספר עליהם אולי בעתיד. דבר אחר שפולינומים מעל שדה מקיימים הוא שיש להם מספר שורשים מאוד מצומצם: לפולינום ממעלה \(n\) מעל שדה יש לכל היותר \(n\) שורשים (מעל חוג כללי זה לאו דווקא המצב: קחו את החוג \(\mathbb{Z}_{8}\) ותסתכלו על הפולינום \(x^{2}-1\). תקבלו ש-\(1,3,5,7\) כולם שורשים שלו – אופס). יש לזה הרבה אספקטים חיוביים, אבל האספקט השלילי הוא שלא נראה שאפשר לתאר קבוצות מעניינות במיוחד בתור "קבוצת השורשים של פולינום מסויים".

ואז מגיעים לפולינומים במספר משתנים והכל משתנה דרסטית.

הנה דוגמא לפולינום פשוט בשני משתנים: \(p\left(x,y\right)=x^{2}+y^{2}-1\). לפולינום הזה יש אינסוף שורשים מעל \(\mathbb{R}\), כש"שורש" פירושו הצבה משותפת של ערכים לשני המשתנים שלו. למשל \(\left(1,0\right)\) הוא שורש, וגם \(\left(\frac{\sqrt{2}}{2},\frac{\sqrt{2}}{2}\right)\) הוא שורש. למעשה, את אוסף השורשים של הפולינום הזה אנחנו מכירים בתור מעגל היחידה. מייד אנחנו רואים את הקשר החזק שיש בין אובייקטים גיאומטריים ובין הפולינומים במספר משתנים שמתארים אותם, ואנחנו בעצם מכירים מהתיכון, אם למדנו שם גאומטריה אנליטית. הקשר הזה הוא הבסיס לתחום הגאומטריה האלגברית שלא ארחיב עליו כרגע.

חוגי מטריצות

מטריצות מוכרות היטב לכל מי שלמד קצת אלגברה לינארית. הן מהוות קודם כל מרחב וקטורי – כלומר, מוגדרת עליהן פעולת חיבור ופעולה של כפל בסקלר – אבל יש להן עוד משהו שרואים כבר באלגברה לינארית: מה שנקרא כפל מטריצות, והוא אחת מהפעולות המוזרות ביותר למראה והקשות ביותר לעיכול ממבט ראשון. אחרי חמש-שש פעמים שבהן נתקלים במושג הזה בהקשרים שונים הוא הופך להיות, לטעמי, אחד מהמושגים הטבעיים ביותר במתמטיקה; הנה הפוסט שבו אני מנסה להסביר אותו קצת. כדי לכפול שתי מטריצות צריך שתהיה התאמה כלשהי בין הממדים שלהן, וכדי שאפשר יהיה לכפול שתי מטריצות משני הכיוונים, כלומר שגם \(AB\) וגם \(BA\) יהיו מוגדרים, כפי שאמור לקרות בחוג, חייבים ששתי המטריצות יהיו ריבועיות ומאותו הסדר. לכן מראש הדיונים על חוגי מטריצות מצטצמם למקרים הללו. יש המון סימונים שונים לחוגי מטריצות, ואני אאמץ את הסימון \(M_{n}\left(\mathbb{F}\right)\) כדי לתאר את חוג המטריצות מסדר \(n\times n\) מעל השדה \(\mathbb{F}\).

הנה משהו נחמד שאפשר לעשות חיש קל עם מטריצות. אני יכול לייצג את הקווטרניונים בתור תת-חוג של \(M_{2}\left(\mathbb{C}\right)\). איזה? הנה ייצוג באמצעות מטריצה לארבעת ה"יוצרים" של \(\mathbb{H}\), \(1,i,j,k\):

\(1=\left[\begin{array}{cc} 1 & 0\\ 0 & 1 \end{array}\right]\)

\(i=\left[\begin{array}{cc} i & 0\\ 0 & -i \end{array}\right]\)

\(j=\left[\begin{array}{cc} 0 & 1\\ -1 & 0 \end{array}\right]\)

\(k=\left[\begin{array}{cc} 0 & i\\ i & 0 \end{array}\right]\)

שימו לב שה-\(1,i\) שכתובים בצד שמאל פה הם לא המספר הטבעי 1 והמספר המדומה \(i\) אלא סתם סימונים שבאים לומר לנו מה ה"משמעות הקווטרניונית" של המטריצות. נסו לכפול קצת את המטריצות ולראות שהן אכן מתנהגות כמו שאנחנו מצפים מהקווטרניונים. נקודת המבט הזו על קווטרניונים היא חשובה כי היא מאפשרת לנו לחקור הכללות של הקווטרניונים שניתנות להגדרה באמצעות מטריצות. למעשה, אוסף אדיר של חוגים לא קומוטטיביים ניתן לתיאור באמצעות מטריצות, אבל לא אכנס לזה עכשיו.

חוגי פונקציות

מטריצות ופולינומים הן דוגמאות למקרים שבהם אנחנו משתמשים בחוג קיים כדי לבנות חוג חדש, מורכב יותר. הנה עוד דוגמא. ניקח חוג \(R\) וקבוצה כלשהי \(X\), לאו דווקא חוג, ונסתכל על אוסף כל הפונקציות \(f:X\to R\). אז האוסף הזה הוא חוג עם הגדרת חיבור וכפל "נקודתיים", כך: \(\left(f+g\right)\left(x\right)\triangleq f\left(x\right)+g\left(x\right)\) ו-\(\left(f\cdot g\right)\left(x\right)\triangleq f\left(x\right)\cdot g\left(x\right)\). זה די שונה ממה שהלך בחבורות, שם הסתכלנו על חבורה של פונקציות תחת פעולת ההרכבה; כאן לא מרכיבים את הפונקציות אלא מנצלים את הפעולות שקיימות ב-\(R\) כדי להגדיר עליהן חיבור וכפל. אם ב-\(R\) יש איבר יחידה \(1\in R\), כפי שאנחנו בדרך כלל מניחים, אז גם בחוג הפונקציות יהיה איבר יחידה – הפונקציה \(f\left(x\right)=1\) לכל \(x\in X\). דברים אחרים לא נשמרים כל כך יפה – למשל, אם \(R=\mathbb{Z}\) אז זה חוג ללא מחלקי אפס, אבל גם אם נבחר \(X=\left\{ 0,1\right\} \) כבר נקבל מחלקי אפס: \(f\left(x\right)=x\) ו-\(g\left(x\right)=1-x\) יקיימו ש-\(f\left(x\right)g\left(x\right)\equiv0\) למרות שאף אחת מהן איננה אפס.

דוגמא מפורסמת במיוחד היא במקרה שבו \(X=R=\mathbb{R}\) ואנחנו מסתכלים לא על כל הפונקציות אלא על תת-חוג הפונקציות הרציפות. רציפות משתמרת בחיבור וכפל (זה דורש הוכחה בחדו"א, כמובן) ולכן אכן מתקבל תת-חוג מעניין למדי.

חוגי חבורה

לסיום, הנה עוד מקרה של בניה של חוג חדש מאובייקטים קיימים – הפעם חוג \(R\) וחבורה \(G\), שמתחברים יחד כדי ליצור משהו שנקרא חוג החבורה \(RG\) והולך להזכיר מאוד את הפולינומים או הקווטרניונים אבל לא יהיה אף אחד מהם. הרעיון הוא זה: נניח ש-\(G=\left\{ g_{1},\dots,g_{n}\right\} \) היא חבורה סופית, אז בואו נסתכל על משהו דומה למה שקרה עם פולינומים – סכומים פורמליים, שלא "מסכמים עד הסוף", רק שבמקום חזקות של משתנה יש לנו את איברי החבורה עצמה, והמקדמים הם מ-\(R\). במילים אחרות, \(RG\triangleq\left\{ r_{1}g_{1}+r_{2}g_{2}+\dots+r_{n}g_{n}\ |\ r_{1},\dots,r_{n}\in R\right\} \).

כמובן, צריך להגדיר חיבור וכפל של יצורים כאלו, ועושים את זה בצורה המתבקשת של לבצע את החישובים שאנחנו יודעים לבצע. חיבור יהיה "רכיב-רכיב" באופן הבא:

\(\sum r_{i}g_{i}+\sum s_{i}g_{i}=\sum\left(r_{i}+s_{i}\right)g_{i}\)

כפל לעומת זאת הוא מסובך יותר – אנחנו נניח שמתקיימת דיסטריביוטיביות ולכן אפשר לפתוח סוגריים ולקבל סכום של מכפלות, ובמכפלות הללו אפשר לטפל לפי פעולת הכפל בחבורה. הנה דוגמא פשוטה:

\(\left(r_{1}g_{1}+r_{2}g_{2}\right)\cdot r_{3}g_{3}=\left(r_{1}r_{3}\right)g_{1}g_{3}+\left(r_{2}r_{3}\right)g_{2}g_{3}\)

את הביטוי הזה אנחנו ממשיכים לחשב כי אנחנו יודעים להחליף את \(r_{1}r_{3}\) ו-\(r_{2}r_{3}\) באיברים בודדים מתאימים מ-\(R\), ואת \(g_{1}g_{3}\) ו-\(g_{2}g_{3}\) באיברים בודדים מתאימים מ-\(G\).

העסק הזה מזכיר מאוד פולינומים וקווטרניונים כי גם בהם האיבר הכללי הוא סכום פורמלי עם מקדמים מתוך חוג (שדה, במקרה ההוא). רק שבשני המקרים הללו ה"חבורה" שמשתתפת בסכום הפורמלי היא בכלל לא חבורה. במקרה של פולינומים, משתנה והחזקות שלו הן הקבוצה \(\left\{ 1,x,x^{2},x^{3},\dots\right\} \) שנראית קצת כמו \(\mathbb{Z}\) אבל בלי השליליים. כלומר, אין לנו כאן הופכיים, ולכן זו לא חבורה. זה כן מבנה אחר שנקרא מונואיד ואפשר לחשוב על פולינומים בתור "חוג המונואיד" אבל נעזוב את זה. עבור קווטרניונים הבעיה דומה. מה שקראתי לו חבורת הקווטרניונים היה חבורה בת 8 איברים, \(Q_{8}=\left\{ 1,-1,i,-i,j,-j,k,-k\right\} \) ואילו ב-\(\mathbb{H}\) הסכומים הפורמליים נלקחים עבור ארבעה איברים. אם אני אנסה לבנות את חוג החבורה \(\mathbb{R}Q_{8}\) אני אקבל תופעה מוזרה כמו האיבר \(1\cdot i+1\cdot\left(-i\right)\) שאיננו אפס כי הוא סכום פורמלי של שני איברים שונים של \(Q_{8}\).

יותר מזה, \(\mathbb{H}\) וחוגי פולינומים הם כולם תחומי שלמות, אבל קל לראות שחוג חבורה לא יכול להיות תחום שלמות כמעט אף פעם, בגלל התעלול הפשוט הבא: קחו \(g\) מסדר \(k\) כלשהו עם \(k>1\), כלומר \(g^{k}=1\) בחבורה \(G\), ולכן \(g^{k}-1\) הוא כן איבר האפס של חוג החבורה, כי לכתוב אותו באופן מדויק נותן \(g^{k}-1=1\cdot\left(1\right)-1\cdot\left(1\right)=\left(1-1\right)\cdot1=0\). כעת הביטו בקסם הטור הגאומטרי הסטנדרטי הבא:

\(g^{k}-1=\left(g-1\right)\left(1+g+g^{2}+\dots+g^{k-1}\right)\)

ושני המוכפלים באגף ימין אינם אפס, כי \(g\ne1\) ומכיוון שהסדר של \(g\) הוא \(k\), אין חזרות באיברים \(1,g,\dots,g^{k-1}\) ולכן הסכום הפורמלי של כולם לא ניתן לצמצום.

בקיצור, חוגי חבורה הם רעיון מגניב, אבל גם כשמנסים להפעיל אותם על דוגמאות שנראות לנו מוכרות זה לא באמת עובד כפי שאנחנו מצפים; למעשה, זו סיבה עיקרית שבגללה הבאתי אותם, כדי לקבל תחושה עד כמה טריקיים יכולים להיות ענייני החוגים הללו.

9 תגובות בנושא “חוגים – מבוא קצת יותר פורמלי”

  1. יפה מאוד! מסכם בצורה יסודית אך לא מעיקה את רוח המקרים של חוגים.
    הכותרת ״חוגי פונקציות״ לא מוצגת לי ככותרת, ובהגדרה של הקווטרניונים כתבת ij=-k אבל צריך ij=k, או פשוט ijk=-1 שמסכם את הכל.
    תודה על הפוסט!

  2. נהדר!
    מצטרף לאיל- גם אני רגיל להגדרה ההפוכה עבור קוורטרניונים.
    והצעה- אולי תמספר את הפוסטים בכל נושא (מלבד המלל שבפתיחת הפוסט), ככה נוכל לוודא שלא פספסנו (חלילה!) פוסט קודם…

  3. מצטרף ליל – בדקתי בויקיפדיה וגם שם אומרים שהאוקטוניונים אינם אסוציאטיביים.
    בנוסף, כתבת שבשביל שגם AB וגם BA יהיו מוגדרים המטריצות צריכות להיות ריבועיות ומאותו הסדר, אך זה גם אפשרי אם A היא n⨯m ו־B היא m⨯n. אני אשאיר לך לבחור איו עוד דרישה אתה רוצה להוסיף.

  4. בכפל פולינומיםאחרי השורה: אם נתאר את זה על ידי "כפל סדרות", נקבל
    כתוב
    (a,b)(c,d)=(bd,ad+bc,ac)
    צ"ל
    (a,b)(c,d)=(ac,ad+bc,bd)

כתיבת תגובה

האימייל לא יוצג באתר. שדות החובה מסומנים *