הומומורפיזמים, חוגי מנה, ואידאלים
עכשיו, אחרי שהבנו מהם חוגים, אפשר להתחיל לחקור אותם באופן כללי כפי שעשינו עם חבורות, והצעד המתבקש הראשון הוא חוגי מנה. מכיוון שהרעיון הבסיסי הוא זה שהיה בחבורות, בואו נזכר מה קרה בחבורות (ומי שיאבדו אותי - שילכו לקרוא את הפוסט בחבורות!). שם הייתה לי חבורה \( G \), שהפעם אתאר את הפעולה שלה בתור חיבור ולא כמו בתור כפל בדרך כלל (כי בחוגים, החוג \( R \) הוא קודם כל חבורה שהפעולה שלה מתוארת על ידי חיבור; ביחס לכפל \( R \) הוא לא בהכרח חבורה). השאלה ששאלתי הייתה: אילו יחסי שקילות אפשר להגדיר על \( G \), כך שקבוצת המנה המתקבלת תהיה חבורה ביחס לפעולת החיבור שמושרית מ-\( G \)? כלומר, רציתי למצוא את כל יחסי השקילות כך שההגדרה \( \left[a\right]+\left[b\right]\triangleq\left[a+b\right] \) תהפוך את קבוצת המנה של \( G \) לחבורה בפני עצמה.
בפוסט ההוא שיחקתי קצת עם ההגדרות, וקיבלתי שכדי שהעסק יעבוד, מחלקת השקילות \( \left[0\right] \) של איבר היחידה בחבורה תהיה חייבת להיות תת-חבורה נורמלית, \( H=\left[0\right] \), וגם נבע שכך מחלקת שקילות אחרת של יחס השקילות חייבת להיות קוסט של \( G \), כלומר קבוצה מהצורה \( a+H\triangleq\left\{ a+h\ |\ h\in H\right\} \) (“תת-חבורה נורמלית” \( H \) היא תת-חבורה שמקיימת \( a+H=H+a \) לכל \( a\in G \)). המושגים הללו צצו מעצמם, בלי שתהיה לי שליטה על זה, רק מתוך הרצון שלי לקבל קבוצת מנה שהיא בעצמה חבורה. את חבורת המנה המתאימה סימנו ב-\( G/H \).
אחרי שעשינו את הדברים הללו פתאום התברר שיש גם דרך אחרת לחשוב על כל זה, כשהכנסנו לתמונה את המושג של הומומורפיזם שהיה פונקציה \( \varphi:G\to G^{\prime} \) שמשמרת את הפעולה של החבורה, כלומר \( \varphi\left(a+b\right)=\varphi\left(a\right)+\varphi\left(b\right) \). אנחנו דיברנו על הגרעין של ההומומורפיזם הזה, \( \ker\varphi\triangleq\left\{ a\in G\ |\ \varphi\left(a\right)=0\right\} \) וראינו שהוא תת-חבורה נורמלית וש-\( G/\ker\varphi\cong\text{Im}\left(\varphi\right) \). כאן \( \cong \) מציין איזומורפיזם - הומומורפיזם שהוא חח”ע ועל, כך ששני האגפים הם “אותה חבורה עד כדי סימן”. הדבר הזה הוא מה שנקרא משפט האיזומורפיזם הראשון, והוא בעצם לימד אותנו שחבורות מנה זה אותו דבר כמו התמונות ההומומורפיות האפשריות של \( G \); כל תת-חבורה נורמלית של \( G \) יכולה להתקבל בתור גרעין של הומומורפיזם כלשהו מ-\( G \).
איך כל המושגים הללו עוברים לחוגים? בצורה מאוד פשוטה יחסית. הומומורפיזם, חוגי מנה, משפטי האיזומורפיזם - הכל עובד כמו בחבורות. ההבדל המעניין הוא במה שמחליף את המושג של תת-חבורה נורמלית שהופך לשונה למדי ובהקשר של חוגים נקרא אידאל. מה בדיוק מגדיר אידאל ומאיפה מגיע השם המשונה הזה - עוד מעט נראה.
הומומורפיזמים
נתחיל מהומומורפיזם. יהיו \( R,S \) שני חוגים ו-\( \varphi:R\to S \) פונקציה ביניהן. נקרא לה הומומורפיזם אם היא משמרת את המבנה של החוג, כלומר אם
- \( \varphi\left(a+b\right)=\varphi\left(a\right)+\varphi\left(b\right) \) לכל \( a,b\in R \)
- \( \varphi\left(ab\right)=\varphi\left(a\right)\varphi\left(b\right) \) לכל \( a,b\in R \)
לפעמים אם יש לנו איברי יחידה ב-\( R,S \) אז דורשים ש-\( \varphi \) יעביר איבר יחידה לאיבר יחידה. אני לא אדרוש את זה אלא אם צריך. הנה סיטואציה פשוטה שבה לא צריך את זה, בהתבסס על הדוגמאות מהפוסט הקודם: \( \varphi:\mathbb{R}\to M_{2}\left(\mathbb{R}\right) \) שעבורה \( \varphi\left(a\right)=\left[\begin{array}{cc} a & 0\\ 0 & 0 \end{array}\right] \). כאן \( \varphi \) מעבירה את 1 לאיבר היחידה של תת-חוג של \( M_{2}\left(\mathbb{R}\right) \) ולא לאיבר היחידה של \( M_{2}\left(\mathbb{R}\right) \) עצמו ולמי אכפת.
בהינתן הומומורפיזם \( \varphi \), הגרעין שלו מוגדר כך: \( \ker\varphi\triangleq\left\{ a\in R\ |\ \varphi\left(a\right)=0\right\} \). כלומר, האיברים שמועברים לאיבר היחידה החיבורי, לא הכפלי. יש כאן “שבירת סימטריה” כלשהי בין פעולות החיבור והכפל שתחזור על עצמה בהמשך. זה כמובן לא מקרי - מעצם הגדרתו, בחוג אין סימטריה בין שתי הפעולות הללו. זה יהיה חשוב בהמשך, כשננסה להבין את ההגדרה הלא סימטרית של אידאל. אגב, אני כבר עכשיו יכול להגדיר מהו אידאל: \( I\subseteq R \) הוא אידאל אם קיים הומומורפיזם \( \varphi \) שתחומו \( R \) כך ש-\( I=\ker\varphi \). רק שזו הגדרה מאוד לא מחכימה כך שבואו נחכה עם זה קצת.
הומומורפיזם של חוגים יכול להיות מושג טריקי, כמו כל מה שקשור לחוגים. בחבורות, למשל, יש לנו הומומורפיזם מאוד פשוט \( \varphi:\mathbb{Z}\to\mathbb{Z} \) שמוגדר על ידי \( \varphi\left(x\right)=nx \) כאשר \( n\in\mathbb{Z} \) כלשהו. בחבורות ההומומורפיזם הזה מראה איך החבורה \( \mathbb{Z} \) איזומורפית לתת-החבורות שלה. ובחוגים? פשוט לא קיים. למה? כי כדי שתשתמר תכונת הכפל של הומומורפיזם, צריך שיתקיים \( nxy=\varphi\left(xy\right)=\varphi\left(x\right)\varphi\left(y\right)=n^{2}xy \), כלומר צריך שיתקיים \( n=n^{2} \), ובמילים אחרות \( n=0 \) או \( n=1 \). קיבלנו רק את שני ההומומורפיזמים הטריוויאליים: הזהות והזה שמעביר הכל ל-0.
לעומת זאת, הנה הומומורפיזם מגניב ומעניין במיוחד - הצבה בפולינום. לכל חוג \( R \) ואיבר \( a\in R \), אנחנו תמיד יכולים לדבר על ההומומורפיזם \( \varphi_{a}:R\left[x\right]\to R \) שמוגדר על ידי \( \varphi_{a}\left(p\left(x\right)\right)=p\left(a\right) \), כלומר מה שקורה כשלוקחים את הפולינום \( p\left(x\right) \) כקלט, מציבים את \( a \) במקום \( x \) ו”מחשבים עד הסוף”. לא קשה לראות שזה הומומורפיזם בגלל שמלכתחילה חיבור וכפל של פולינומים הוגדרו כדי שהם “ישחקו יפה” עם התכונות של החוג. הגרעין של ההומומורפיזם הזה הוא אוסף כל הפולינומים שמתאפסים כשמציבים בהם \( a \), ועוד נחזור לזה בהמשך. מקרה פרטי נחמד ואינטואיטיבי הוא כאשר \( a=0 \), ואז “הצבה בפולינום” בעצם מחזירה את המקדם החופשי שלו.
חוגי מנה
בואו נעבור עכשיו לדבר על חוגי מנה. כמו בחבורות, אני רוצה לדעת מהם כל יחסי השקילות על \( R \) שעבורם אקבל חוג בעזרת ההגדרות הבאות:
- \( \left[a\right]+\left[b\right]\triangleq\left[a+b\right] \)
- \( \left[a\right]\cdot\left[b\right]\triangleq\left[a\cdot b\right] \)
לא צריך להתחיל את העבודה מאפס. הדרישה הראשונה זהה למה שעשינו בחבורות, כך שמייד נובע שמחלקת השקילות \( \left[0\right] \) של אפס חייבת להיות תת-חבורה נורמלית של החבורה \( \left(R,+\right) \). אני אסמן \( I=\left[0\right] \) במקרה הזה. העניין הוא בכך שמלכתחילה חוג \( R \) מוגדר כך שהחבורה \( \left(R,+\right) \) היא אבלית; בחבורה אבלית, כל תת-חבורה היא נורמלית. כך שבינתיים \( I \) היא בסך הכל תת-חבורה חיבורית של \( R \) ותו לא. כעת, לכל \( a\in R \) מתקיים ש-\( \left[a\right]+\left[0\right]=\left[a+0\right]=\left[a\right] \) כך שיוצא ש-\( \left[0\right] \) היא איבר היחידה החיבורי של אוסף מחלקות השקילות. כמו כן \( \left[a\right]+\left[-a\right]=\left[a-a\right]=\left[0\right] \) כך שיוצא שמחלקת השקילות של \( -a \) היא הנגדי החיבורי של מחלקת השקילות של \( a \).
כעת אפשר לראות שלכל \( a \) מתקיים ש-\( \left[a\right]=a+I=\left\{ a+x\ |\ x\in I\right\} \), כלומר מחלקת השקילות של כל \( a \) חייבת להיות הקוסט שמוגדר על ידו ביחס ל-\( I \). כדי לראות זאת, נשים לב לכך ש-\( \left[a\right]=\left[b\right] \) אם ורק אם \( \left[b-a\right]=\left[0\right] \), כלומר אם ורק אם \( b-a\in I \), כלומר אם ורק אם קיים \( x\in I \) כך ש-\( b-a=x \), כלומר אם ורק אם קיים \( x \) כזה כך ש-\( b=a+x \), מה שמשלמים את ההוכחה.
כל זה היה שייך לחבורות. עכשיו נראה מה קורה כשמכניסים לתמונה את מבנה החוג - כלומר, את פעולת הכפל. כאן נכנס לתמונה האופי ההרסני של אפס ביחס למכפלה - ראינו כבר בפוסט קודם ש-\( a\cdot0=0 \) תמיד, לכל חוג. זה אומר שבפרט, לכל \( a\in R \) ולכל \( x\in I \) צריך להתקיים ש-\( \left[ax\right]=\left[a\right]\left[x\right]=\left[a\right]\left[0\right]=\left[a\cdot0\right]=\left[0\right]=\left[x\right]=I \). במילים אחרות, \( ax\in I \), ובניסוח מילולי: כפל של איבר מהאידאל בכל איבר מהחוג יחזיר איבר מהאידאל. האידאל “בולע” את מי שמוכפל בו. \( a\cdot I=I \) תמיד. זו תכונה קיצונית יותר מ”סתם” סגירות לכפל של \( I \). סגירות לכפל אומרת שכפל של שני איברים ששניהם מתוך \( I \) יחזיר איבר ב-\( I \); תכונת ה”בליעה” אומרת שמספיק שאחד מהם יהיה מתוך \( I \) לשם כך. אמרתי שההגדרה של אידאל תהיה נטולת סימטריה? הנה זה. יותר מכך: מכיוון שכפל הוא לא בהכרח קומוטטיבי, יש הבדל בין בליעה “משמאל” כלומר התכונה \( aI=I \), ובליעה “מימין”, כלומר \( Ia=I \). לאידאל שבולע משמאל קוראים אידאל שמאלי אבל אני כמעט תמיד אסתפק בלהגיד “אידאל” ולדבר רק על אידאלים שמאליים.
עכשיו אני יכול לתת את ההגדרה המקובלת של אידאל: אידאל \( I\subseteq R \) הוא תת-קבוצה של \( R \) שהיא תת-חבורה חיבורית של \( \left(R,+\right) \) ומקיימת את תכונת ה”בליעה” ביחס לכפל. שימו לב שאני לא אומר ש-\( I \) היא תת-חוג כי בהגדרות שלי תת-חוג צריך להכיל את 1, ועבור אידאלים זה לא יכול לקרות אלא אם הם כל \( R \). למשל, ב-\( \mathbb{Z} \), הקבוצה \( 2\mathbb{Z}=\left\{ 0,2,-2,4,-4,\dots\right\} \) היא אידאל אבל היא לא תת-חוג. אם \( 1\in I \) אז לכל \( a\in R \) מתקיים ש-\( a=a\cdot1\in I \) ולכן \( I=R \) (זכרו את התכונה הקטנטנה הזו: היא מאוד שימושית!)
אידאל מגדיר יחס שקילות על אברי \( R \) בדיוק כמו שתת-חבורה נורמלית הגדירה עבור חבורה: \( a \) שקול ל-\( b \) אם \( a-b\in I \). מה שכבר ראינו הוא שאם עבור יחס שקילות כלשהו על \( R \) קבוצת המנה היא חוג ביחס לפעולות של \( R \), אז בהכרח יחס השקילות הזה הוא מהצורה שתיארתי כרגע. צריך עדיין להשתכנע בכיוון ההפוך - שלכל אידאל, קבוצת המנה המתקבלת, שאני מסמן \( R/I \), היא אכן חוג ביחס לפעולות הללו.
אנחנו כבר יודעים ש-\( R/I \) היא חבורה חיבורית, כי זאת העבודה שעשינו בחבורות. רק צריך להשתכנע שפעולת הכפל עובדת. אם לחדד, מה שצריך להראות כאן הוא שפעולת הכפל היא מוגדרת היטב. כלומר שאם \( a_{1},a_{2},b_{1},b_{2}\in R \) כך ש-\( \left[a_{1}\right]=\left[a_{2}\right] \) ו-\( \left[b_{1}\right]=\left[b_{2}\right] \) אז \( \left[a_{1}b_{1}\right]=\left[a_{2}b_{2}\right] \).
אין כאן הרבה יותר ממשחק בהגדרות. אם \( \left[a_{1}\right]=\left[a_{2}\right] \) אז יש \( x\in I \) כך ש-\( a_{2}=a_{1}+x \). בדומה יש \( y\in I \) כך ש-\( b_{2}=b_{1}+y \). כעת:
\( a_{2}b_{2}=\left(a_{1}+x\right)\left(b_{1}+y\right)=a_{1}b_{1}+\left(xb_{1}+ya_{1}+xy\right) \)
הסכום שבסוגריים מורכב משלושה מחוברים, שכל אחד מהם הוא מכפלה של איבר מ-\( I \) במישהו מ-\( R \). תכונת הבליעה מבטיחה שכל המחוברים שייכים ל-\( I \) והיותו של \( I \) תת-חבורה חיבורית מבטיחה שהסכום יהיה ב-\( I \). קיבלנו ש-\( a_{2}b_{2}=a_{1}b_{1}+z \) עבור \( z\in I \) כלשהו ולכן \( \left[a_{1}b_{1}\right]=\left[a_{2}b_{2}\right] \) כפי שרצינו.
אידאלים
כאן צריך, כמובן, לראות דוגמאות, אבל בשביל זה בואו נתאר את הדרך הפשוטה ביותר לבנות אידאלים. ניקח \( a\in R \) כלשהו ונגדיר את האידאל שנוצר על ידי \( a \) להיות \( \left\langle a\right\rangle =\left\{ r\cdot a\ |\ r\in R\right\} \). לפעמים נסמן את זה גם ב-\( Ra \), אבל אני מעדיף את \( \left\langle a\right\rangle \). הסימון \( Ra \) טוב כדי להבדיל את עצמנו מהמקרה \( aR \) שבו יוצרים אידאל ימני במקום שמאלי ואני לא אכנס אליו; ממילא הדוגמאות שלי יהיו ברובן מחוגים קומוטטיביים.
קל לראות ש-\( \left\langle a\right\rangle \) הוא אכן אידאל: \( r_{1}a-r_{2}a=\left(r_{1}-r_{2}\right)a\in\left\langle a\right\rangle \) כך שיש סגירות ברורה לחיסור (כלומר, \( \left\langle a\right\rangle \) הוא תת-חבורה חיבורית של \( R \)) ולכל \( r\in R \) ו-\( a^{\prime}\in\left\langle a\right\rangle \) מתקיים ש-\( a^{\prime}=r^{\prime}a \) ולכן \( ra^{\prime}=\left(rr^{\prime}\right)a\in\left\langle a\right\rangle \) ולכן יש בליעה. אם כן, ההגדרה של אידאל בידי איבר בודד היא עניין קל ואידאלים כאלו זוכים לשם מיוחד: אידאל ראשי הוא אידאל שנוצר בידי איבר בודד. יש גם מושג של אידאל שנוצר בידי קבוצה של איברים, אבל ההגדרות במקרה הזה יוצאות מסובכות יותר; באופן כללי, אידאל שנוצר על ידי קבוצה \( A \) הוא האידאל הקטן ביותר שמכיל את \( A \) - זה יוצא חיתוך כל האידאלים של \( R \) (כולל \( R \) עצמו, כך שזה אף פעם לא חיתוך שלא מערב קבוצות כלל) שמכילים את \( A \).
עבור החוג \( R=\mathbb{Z} \), האידאלים הם בדיוק כל הקבוצות \( \left\langle a\right\rangle =a\mathbb{Z}=\left\{ 0,a,-a,2a,-2a,\dots\right\} \). בפרט, כל האידאלים של \( \mathbb{Z} \) הם ראשיים - זה הופך את \( \mathbb{Z} \) למשהו שנקרא תחום ראשי ואדבר על כך בהמשך. הנה דרך פשוטה מאוד לראות שכל אידאל של \( \mathbb{Z} \) הוא אכן מהצורה הזו: נניח ש-\( I\ne\left\{ 0\right\} \) הוא אידאל כלשהו של \( \mathbb{Z} \) ונסמן ב-\( d \) את המספר הטבעי החיובי הקטן ביותר ששייך ל-\( I \). קיים כזה כי הנחנו שיש ב-\( I \) איבר שונה מאפס, ואם יש איבר שלילי פשוט נכפיל אותו ב-\( -1 \). כעת, בואו ניקח איבר חיובי כלשהו \( a\in I \). אפשר לחלק אותו ב-\( d \) עם שארית, ומקבלים \( a=qd+r \) כאשר \( 0\le r<d \). כלומר, \( r=a-qd\in I \) (כי \( a\in I \) ו-\( d\in I \) ותכונות הבליעה/סגירות לחיסור של אידאלים). מכיוון ש-\( d \) נבחר להיות המספר הטבעי החיובי הקטן ביותר ששייך ל-\( I \) ו-\( r<d \) בהכרח \( r=0 \), כלומר \( a \) מתחלק ב-\( d \) בלי שארית ולכן \( a\in\left\langle d\right\rangle \). בדומה אם \( a \) הוא איבר שלילי ב-\( I \) אז נכפול ב-\( -1 \), נקבל ש-\( -a\in\left\langle d\right\rangle \) ומכאן שגם \( a\in\left\langle d\right\rangle \) גם במקרה הזה. המסקנה: \( I=\left\langle d\right\rangle \). זו הוכחה קטנה ונחמדה שמה שיפה בה במיוחד הוא שאפשר להכליל אותה: עם טיפול חכם במושגים כמו “המספר הקטן ביותר” ו”חילוק עם שארית” מקבלים את המושג של חוג אוקלידי וההוכחה שלנו מראה שחוג אוקלידי הוא תחום ראשי. אבל על זה נדבר בפוסט נפרד.
הנה דוגמא לחוג שבו יש אידאל לא ראשי: \( \mathbb{Z}\left[x\right] \). פולינומים עם מקדמים שלמים (ה”שלמים” קריטי כאן; חוגי פולינומים מעל שדה הם מה שקראתי לו חוג אוקלידי, ולכן כן ראשיים). בחוג הזה נסתכל על האידאל \( \left\langle 2,x\right\rangle \), שזה סימון לאידאל ש”נוצר” על ידי \( 2 \) ו-\( x \), כלומר כל הפולינומים מהצורה \( 2p\left(x\right)+xq\left(x\right) \) כאשר \( p,q\in\mathbb{Z}\left[x\right] \) כלשהם, שזו דרך אחרת לומר “כל הפולינומים עם מקדם חופשי זוגי”. לא קשה להשתכנע שהקבוצה הזו היא אידאל, אבל למה היא לא אידאל ראשי? מי שיוצר את האידאל צריך יהיה ליצור בפרט את \( 2 \) ואת \( x \). כלומר, אם \( p\left(x\right) \) הוא יוצר שכזה, הוא יצטרך לקיים \( 2=p\left(x\right)q\left(x\right) \) וגם \( x=p\left(x\right)t\left(x\right) \) עבור פולינומים \( q,t\in\mathbb{Z}\left[x\right] \) כלשהם, וזה פשוט לא יכול לקרות. מהמשוואה \( 2=p\left(x\right)q\left(x\right) \) נקבל שבהכרח \( p\left(x\right) \) הוא מדרגה \( 0 \) (כי כאשר המקדמים בשדה נלקחים מתוך תחום שלמות כפל פולינומים רק יכול להגדיל את המעלה של הפולינומים המוכפלים) ולכן \( p\left(x\right)=a \) עבור \( a\in\mathbb{Z} \) כלשהו; אבל בפרט נקבל ש-\( a \) מחלק את 2 ולכן הוא או 1 או 2 או מינוס של שני אלו. אם הוא 1 או מינוס 1 אז נקבל שהוא בכלל לא שייך לאידאל שהוא לכאורה יוצר (כי זה פולינום עם מקדם חופשי אי זוגי). אם \( a=2 \) אז נקבל ש-\( x=p\left(x\right)t\left(x\right)=2t\left(x\right) \) וזה בלתי אפשרי מכיוון שהמקדמים של \( t \) נלקחים מתוך \( \mathbb{Z} \) ולכן לא ייתכן ש-2 כפול מקדם כלשהו ייתן 1, שהוא המקדם של \( x^{1} \) בפולינום \( x \).
עכשיו אפשר להציג נקודת מבט נוספת על אידאלים, שמתאימה למקור ההיסטורי שלהם: אפשר לחשוב על אידאל בתור קבוצה של איברים בחוג שמתחלקים על ידי מישהו משותף. עבור \( \mathbb{Z} \) אנחנו רואים את זה בבירור: \( \left\langle a\right\rangle \) זה בדיוק אוסף כל השלמים שמתחלקים על ידי \( a \). למשל, \( \left\langle 5\right\rangle =5\mathbb{Z} \) מתואר מילולית על ידי “אוסף האיברים שמתחלקים על ידי 5”. את הדיון על אידאלים אפשר להתחיל מנקודת המבט הזו. אני שואל את עצמי “הממ, מה מאפיין את קבוצת כל האיברים שמתחלקים על ידי מישהו משותף?” ועונה לעצמי שאני מכיר שתי תכונות פשוטות של חלוקה שכזו. ראשית, אם \( a,b \) מתחלקים על ידי מישהו משותף, אז גם \( a+b \) מתחלק על ידי המישהו הזה; ושנית, אם \( a \) מתחלק על ידי מישהו אז לכל \( x \) נקבל ש-\( ax \) מתחלק על ידי אותו מישהו, בהנחה שאנחנו בתחום שלמות. אם כן, אפשר להגדיר אידאל בתור קבוצה שסגורה לחיבור/חיסור ובולעת ביחס לכפל גם כשבאים מנקודת המבט של “איברים שמתחלקים על ידי מישהו”.
ב-\( \mathbb{Z} \) הדבר הזה נותן לנו דרך התבוננות חלופית על מספרים. במקום לדבר על המספרים \( a,b \) אנחנו יכולים לדבר על האידאלים שהם יוצרים, \( \left\langle a\right\rangle ,\left\langle b\right\rangle \). במקום לומר “\( a \) מחלק את \( b \)” אנחנו יכולים להשתמש בשפה של תורת הקבוצות ולומר \( \left\langle b\right\rangle \subseteq\left\langle a\right\rangle \), כי אם \( a \) מחלק את \( b \) אז בפרט \( a \) מחלק את כל מה שמתחלק ב-\( b \). שימו לב ל”היפוך הסדר” שיש כאן: \( a|b \) אם ורק אם \( \left\langle b\right\rangle \subseteq\left\langle a\right\rangle \). עכשיו, אנחנו יודעים לחתוך קבוצות ובמקרה של אידאלים, חיתוך של שני אידאלים נותן אידאל, אז מה יהיה \( \left\langle a\right\rangle \cap\left\langle b\right\rangle \)? זה יהיה בדיוק האידאל שנוצר על ידי \( \text{gcd}\left(a,b\right) \) (נסו להוכיח את זה!) אז קיבלנו התאמה בין פעולת ה-\( \text{gcd} \) של מספרים ופעולות החיתוך של קבוצות. בכיוון השני, אנחנו יכולים לקחת פעולות שקיימות במספרים השלמים ו”לתרגם” אותם ללשון של אידאלים. למשל, כפל: אני יכול להגדיר מכפלה של אידאלים בתור האידאל שנוצר על ידי המכפלות של איברים בתוך האידאלים, ובפרט נקבל ש-\( \left\langle a\right\rangle \cdot\left\langle b\right\rangle =\left\langle ab\right\rangle \).
באופן דומה אפשר להגדיר גם אידאל ראשוני, אבל לצורך כך אני צריך לתת הגדרה של “ראשוני” שהיא קצת פחות נפוצה: \( p>1 \) הוא ראשוני אם לכל \( a,b\in\mathbb{Z} \), אם \( p|ab \) אז \( p|a \) או \( p|b \), כאשר הסימון “\( p|a \)” אומר “\( p \) מחלק את \( a \)” (כלומר, שקיים \( d\in\mathbb{Z} \) כך ש-\( pd=a \)).
אנחנו מכירים ראשוני בתור מספר גדול מ-1 שמתחלק רק בעצמו וב-1, אבל אפשר להוכיח שההגדרה הזו שקולה להגדרה שנתתי כרגע עם החלוקה (זה מופיע לראשונה ב”יסודות” של אוקלידס). בואו ננסח עכשיו את התכונה החדשה בלשון של אידאלים: במקום לכתוב \( p|a \) אפשר לכתוב \( a\in\left\langle p\right\rangle \) (או אפילו \( \left\langle a\right\rangle \subseteq\left\langle p\right\rangle \) אבל אוותר על זה). אז “ראשוניות” של \( p \) מתבטאת בתור התכונה: אם \( ab\in\left\langle p\right\rangle \) אז \( a\in\left\langle p\right\rangle \) או \( b\in\left\langle p\right\rangle \). זה מוביל להגדרה הכללית של אידאל ראשוני בחוג \( R \) כלשהו (שאניח שהוא קומוטטיבי): \( I \) הוא ראשוני אם לכל \( a,b\in R \), אם \( ab\in I \) אז \( a\in I \) או \( b\in I \).
בפוסטים קודמים דיברתי על החוג \( \mathbb{Z}\left[\sqrt{-5}\right] \) ואיך שאין בו פירוק יחיד לגורמים, כי את 6 אפשר לפרק גם בתור \( 2\cdot3 \) וגם בתור \( \left(1+\sqrt{-5}\right)\cdot\left(1-\sqrt{-5}\right) \) והגורמים פה הם אי פריקים (אי אפשר להציג אותם בתור מכפלה של דברים לא הפיכים). הבעיה הזו הייתה נקודת שבר כלשהי במתמטיקה של אמצע המאה ה-19, כי פירוק יחיד לגורמים בהרחבות של השלמים, כמו שקורה ב-\( \mathbb{Z}\left[i\right] \), היה דבר מועיל בצורה בלתי רגילה. מי שהתמודד עם הבעיה הזו היה המתמטיקאי קומר, שהציע מעין הכללה של מושג הפירוק לגורמים שעדיין הצליחה לעבוד יפה מאוד גם בחוגים כמו \( \mathbb{Z}\left[\sqrt{-5}\right] \): גם אחרי שמפרקים “עד הסוף” את האיברים של החוג ומגיעים לאי-פריקים, עדיין אפשר לפרק עוד, למשהו שקומר קרא לו “מחלקים אידאליים”. המחלקים הללו הם איברים בדיוניים - הם לא חלק מהחוג, אבל הם גם לא המצאה שבאה יש מאין; אפשר לתת מבחנים למתי “הגיוני” שהם יתקיימו ומתי לא, ואפשר לתת מבחנים למתי שני איברים אמורים להתחלק על ידי אותו מחלק אידאלי. לרוע המזל, הסבר מלא של הדברים הללו יהיה מאוד טכני ואני לא רוצה להיכנס אליו כאן. אולי בעתיד.
כמה עשורים אחרי שקומר המציא את התורה שלו הגיע אליה דדקינד וחולל בה מהפכה משל עצמו. במקום להשתמש במושג של מחלקים אידאליים, הוא השתמש במושג הרבה יותר קונקרטי - קבוצות של איברים של החוג שמקיימות… ובכן, כבר ניחשתם: קבוצות שהן אידאלים. מכאן המילה “אידאל” הגיעה; זה השם שדדקינד השתמש בו ונולד מתוך המחלקים האידאליים של קומר שהוא בא להחליף. בניסוחים של קומר, אפשר להראות שבכל חוג כמו \( \mathbb{Z}\left[\sqrt{-5}\right] \) (מה שנקרא חוג השלמים של שדה מספרים; לא אכנס להגדרות המלאות כרגע) מתקיימת פריקות יחידה של אידאלים. באיזה מובן? שאם \( \mathfrak{a} \) הוא אידאל כלשהו בחוג, אז קיימים אידאליים ראשוניים \( \mathfrak{p}_{1},\dots,\mathfrak{p}_{r} \) כך ש-\( \mathfrak{a}=\mathfrak{p}_{1}\cdots\mathfrak{p}_{r} \) עם פעולת הכפל של אידאלים שראינו קודם, והפירוק הזה הוא יחיד עד כדי סדר המוכפלים. התוצאה הזו היא אבן יסוד של תורת המספרים האלגברית - ואני הולך לנטוש אותה כאן ולא לדבר עליה יותר בכלל, כי זה לוקח אותנו רחוק מדי מתורת החוגים הבסיסית. אז למה להראות את זה מלכתחילה? כי אני חושב שכדאי להכיר את המקור ההיסטורי הזה של אידאלים ולהבין למה קוראים להם ככה ומאיפה הם בכלל צצו ולאיזו מטרה.
שובם של משפטי האיזומורפיזם
כשדיברנו על חבורות הקדשתי פוסט למה שקראתי לו משפטי האיזומורפיזם של חבורות: אלו משפטים שמתעסקים בחבורות מנה ובמבנה שלהן. בפוסט ההוא טרחתי להוכיח את הכל ולכתוב בפירוט רב מאוד, וכל הזמן חשבתי לעצמי “הא-הא! כשנגיע לחוגים אני פשוט אפנה לפוסט על חבורות וזהו!”
ובכן, זה בערך מה שאני עושה, כי המשפטים הללו עובדים בחוגים באותה מידה בדיוק כפי שהם עובדים בחבורות, וההוכחות דומות מאוד עד לרמה שזה תרגיל טוב לקוראים לנסות להוכיח בעצמם ולראות מה קורה. אי לכך אני אסתפק רק בלנסח את המשפטים הללו. כל המשפטים שימושיים, אבל הראשון והרביעי שימושיים במיוחד וכדאי לשים לב אליהם במיוחד - ברביעי אני אשתמש עוד בפוסט הזה.
תזכורת לגבי סימונים: אם \( \varphi:R\to S \) הוא הומומורפיזם של חוגים, אני מסמן את הגרעין שלו ב-\( \ker\varphi\triangleq\left\{ a\in R\ |\ \varphi\left(a\right)=0\right\} \) ואת התמונה שלו ב-\( \varphi\left(R\right)\triangleq\left\{ \varphi\left(a\right)\ |\ a\in R\right\} \).
- משפט האיזומורפיזם הראשון: \( R/\ker\varphi\cong\varphi\left(R\right) \).
- משפט האיזומורפיזם השני: אם \( A,B \) תתי-חוגים של \( R \) ו-\( B \) הוא בנוסף לכך אידאל אז \( \left(A+B\right)/B\cong A/\left(A\cap B\right) \) (בפרט, \( A+B \) הוא תת-חוג של \( R \)).
- משפט האיזומורפיזם השלישי: אם \( I,J \) אידאלים של \( R \) כך ש-\( I\subseteq J \) אז \( \left(R/I\right)/\left(J/I\right)\cong\left(R/J\right) \) (בפרט \( J/I \) הוא אידאל של \( R/I \)).
- משפט האיזומורפיזם הרביעי: אם \( I \) אידאל של \( R \) אז יש התאמה חח"ע ועל \( A\mapsto A/I \) בין תתי-חוגים של \( R \) שמכילים את \( I \) ותתי-חוגים של \( R/I \). תת-חוג \( A \) של \( R \) שמכיל את \( I \) הוא אידאל ב-\( R \) אם ורק אם \( A/I \) הוא אידאל ב-\( R/I \).
עוד כמה משחקים לסיום
יש כמה משפטים פשוטים ואלגנטיים מאוד על אידאלים וחוגי מנה שאני לא יכול להתאפק מלהביא כאן; מה גם שהם יהיו מועילים בהמשך.
ראשית, שימו לב כמה ההגדרה של אידאל ראשוני מזכירה את ההגדרה של תחום שלמות:
- \( R \) הוא תחום שלמות אם \( ab=0 \) גורר \( a=0 \) או \( b=0 \).
- \( I \) הוא אידאל ראשוני אם \( ab\in I \) גורר \( a\in I \) או \( b\in I \).
קחו את הדמיון הזה ותוסיפו לו את האינטואיציה הבאה: אם \( R \) חוג כלשהו ו-\( I \) אידאל, אז \( R/I \) הוא חוג שבו כל האיברים של \( I \) “מכווצים לאפס”. איבר היחידה הנייטרלי של החוג \( R/I \) הוא \( 0+I \), כלומר הקוסט \( I \) עצמו, כלומר כל קוסט מהצורה \( a+I \) כאשר \( a\in I \) הוא איבר האפס של \( R/I \). במילים אחרות, אם \( a\in I \) אז “\( a \) הוא 0 בחוג \( R/I \)” (במרכאות כי \( a \) הוא לא איבר של החוג \( R/I \) אלא התמונה שלו על ידי ההטלה הטבעית לחוג הזה - ההומומורפיזם שמעביר את \( a \) ל-\( a+I \)). זה, יחד עם שתי ההגדרות למעלה, מניב את המשפט הבא:
- \( I \) הוא אידאל ראשוני ב-\( R \) אם ורק אם \( R/I \) הוא תחום שלמות.
בואו נוכיח את זה פורמלית, פשוט כי זה כל כך קל: נניח ש-\( I \) אידאל ראשוני ונוכיח ש-\( R/I \) תחום שלמות. ניקח שני קוסטים \( a+I,b+I \) בחוג \( R/I \) כך ש-\( \left(a+I\right)\left(b+I\right)=0+I \); על פי הגדרת כפל קוסטים זה אומר ש-\( ab+I=I \), כלומר \( ab\in I \). מכיוון ש-\( I \) ראשוני, נובע ש-\( a\in I \) או \( b\in I \), כלומר \( a+I=I \) או \( b+I=I \). קיבלנו שאחד משני הקוסטים \( a+I \) או \( b+I \) הוא איבר האפס של \( R/I \) וזה מוכיח ש-\( R/I \) תחום שלמות.
עכשיו אני רוצה לעבור למשפט אנלוגי שמדבר על שדות. כזכור, שדה הוא חוג קומוטטיבי שבו לכל איבר יש הופכי. בואו ניקח חוג קומוטטיבי \( R \) ואידאל \( I \) ונשאל את עצמנו - מתי \( R/I \) הוא לא סתם תחום שלמות אלא ממש שדה? \( I \) הזה יצטרך להיות ראשוני, אבל זה לא יספיק - הוא יצטרך להיות משהו שהוא קצת מעבר לכך.
האנלוגיה לראשוניים “רגילים” שוב עוזרת לנו. בשביל להגדיר אידאל ראשוני הזדקקתי להגדרה שקולה אבל לא כל כך מוכרת בציבור הרחב של ראשוניות. מה עם ההגדרה ה”רגילה”? מה רע ב-“\( p \) ראשוני אם הוא מתחלק רק ב-1 ובעצמו”?
ובכן, שום דבר לא רע. הנה ניסוח בלשון אידאלים של הההגדרה הזו: “\( p \) הוא ראשוני אם \( \left\langle p\right\rangle \) מוכל רק בשני אידאלים: \( \left\langle 1\right\rangle \) ו-\( \left\langle p\right\rangle \)” (זכרו: \( \left\langle a\right\rangle \subseteq\left\langle b\right\rangle \) זה כמו לומר \( b|a \)). עכשיו, מה זה האידאל \( \left\langle 1\right\rangle \)? זה פשוט כל החוג, \( R \). לפעמים אומרים ש-\( R \) ו-\( \left\{ 0\right\} \) הם אידאלים “לא אמיתיים” (או “לא נאותים”), או סתם אומרים שהם אידאלים “טריוויאליים”. אז הנה לנו ניסוח של תכונת הראשוניות שוב: \( p \) הוא ראשוני אם \( \left\langle p\right\rangle \) אינו מוכל ממש באף אידאל לא טריוויאלי.
אפשר להשתמש בזה כדי לנסח תכונה כללית של אידאלים: \( I \) נקרא אידאל מקסימלי אם הוא לא מוכל ממש באף אידאל לא טריוויאלי. פורמלית, לא קיים אידאל \( J \) כך ש-\( I\subsetneq J\subsetneq R \) . מה שראינו הוא שבשלמים \( p \) הוא ראשוני אם \( \left\langle p\right\rangle \) הוא אידאל מקסימלי; בחוגים כלליים יותר התכונה הזו נקראת אי-פריקות והיא לאו דווקא זהה לראשוניות.
אז הנה המשפט שחתרתי אליו: נניח ש-\( R \) הוא חוג קומוטטיבי, אז
- \( I \) הוא אידאל מקסימלי ב-\( R \) אם ורק אם \( R/I \) הוא שדה.
ראיתי כל מני הוכחות טכניות מזעזעות למשפט הזה שנלמדות לפעמים בספרים/קורסים וזה פשוט אסון, כי בעזרת משפט האיזומורפיזם הרביעי זה אחד מהמשפטים הפשוטים והברורים ביותר במתמטיקה.
ראשית, שימו לב לכך שאם \( I \) הוא אידאל בחוג כלשהו \( R \) כך ש-\( 1\in I \) אז \( I=R \). למה? נדמה לי שכבר ראינו את זה קודם בפוסט: כי לכל \( a\in R \) נסתכל במכפלה \( a=a\cdot1\in I \). כעת, אם \( a\in R \) הוא איבר הפיך ב-\( R \) כך ש-\( a\in I \) אז שוב נובע מכך ש-\( I=R \), כי נתבונן במכפלה \( 1=a^{-1}\cdot a\in I \) וכבר ראינו שאם \( 1\in I \) אז \( I=R \).
עכשיו אנחנו יכולים לאפיין את האידאלים של שדה, וזה יהיה פשוט במיוחד: חוג קומוטטיבי \( F \) הוא שדה אם ורק אם האידאלים היחידים שלו הם הטריוויאליים: \( \left\{ 0\right\} \) ו-\( F \). בכיוון אחד, אם \( F \) הוא שדה ו-\( I \) אידאל של \( F \) אז או ש-\( I=\left\{ 0\right\} \) או שקיים \( a\ne0 \) כך ש-\( a\in I \). בשדה כל איבר שונה מאפס הוא הפיך, כך ש-\( a\in I \) הפיך וראינו לפני רגע שזה מוכיח \( I=F \). בכיוון השני, בואו ניקח \( a\ne0 \) ב-\( F \) ונוכיח שהוא הפיך: נסתכל באידאל \( \left\langle a\right\rangle \). האידאל הזה שונה מ-\( \left\{ 0\right\} \) (כי \( a \) בפנים) ולכן \( \left\langle a\right\rangle =F \). מכיוון ש-\( 1\in F \) קיבלנו \( 1\in\left\langle a\right\rangle \), כלומר קיים \( b\in F \) כך ש-\( ba=1 \) (על פי ההגדרה של \( \left\langle a\right\rangle \)), ולכן \( a \) הפיך.
כמו שעשינו עם המשפט על אידאל ראשוני ותחום שלמות, בואו נראה כמה שני משפטים שונים הם דומים זה לזה:
- \( R \) קומוטטיבי הוא שדה אם ורק אם לכל אידאל \( J \) של \( R \) מתקיים \( J=\left\{ 0\right\} \) או \( J=R \).
- \( I \) הוא אידאל מקסימלי אם ורק אם לכל אידאל \( J \) שמכיל אותו מתקיים \( J=I \) או \( J=R \).
את שני הדברים הללו אנחנו מחברים בעזרת משפט האיזומורפיזם הרביעי. יהא חוג קומוטטיבי \( R \) ואידאל \( I \) של \( R \) (לאו דווקא מקסימלי, כרגע). על פי משפט האיזומורפיזם הרביעי יש לנו התאמה חח”ע ועל בין אידאלים \( J \) של \( R \) שמכילים את \( I \) ובין אידאלים \( J/I \) של \( R/I \).
כעת נעשה שרשרת של גרירות “אם ורק אם”:
- \( R/I \) שדה.
- לכל אידאל \( J/I \) של \( R/I \) מתקיים \( J/I=\left\{ 0\right\} \) או \( J/I=R/I \).
- לכל אידאל \( J \) של \( R \) המקיים \( I\subseteq J \) מתקיים \( J=I \) או \( J=R \).
- \( I \) אידאל מקסימלי של \( R \).
המעבר המבלבל פה הוא זה מ-2 אל 3. כשאני כותב \( J/I=\left\{ 0\right\} \) אני מתכוון לאיבר ה-0 של החוג \( R/I \), כלומר ל-\( I \) עצמו. האיברים של \( J/I \) הם מהצורה \( a+I \) כאשר \( a\in J \). השוויון \( J/I=\left\{ 0\right\} \) פירושו ש-\( a+I=I \) לכל \( a\in J \), כלומר \( a\in I \). קיבלנו \( J\subseteq I \) ויחד עם זה שידוע כבר \( I\subseteq J \) נקבל \( J=I \).
השוויון \( J/I=R/I \) פירושו שלכל \( a\in R \), מכיוון ש-\( a+I\in R/I \), מתקיים \( a+I\in J/I \) ולכן בפרט קיים \( b\in J \) כך ש-\( a+I=b+I \), כלומר בפרט \( a\in b+I \). מכיוון ש-\( I\subseteq J \) קיבלנו ש-\( a\in b+J=J \) ולכן נקבל \( J=R \). זה מסיים את הוכחת המעבר הזה בכיוון הקשה שלו, ואני מקווה שזה מספיק כדי לשכנע אתכם שהמשפט נכון.
המשפט הזה ספציפית הולך להיות שימושי בצורה בלתי רגילה בהמשך, כי הוא מלמד אותנו על שיטה מסודרת לבנות שדות מתוך חוגים - בונים אידאל מקסימלי, לרוב מתוך איברים מסויימים, ואז מחלקים בו והופס! מקבלים שדה. הנה הטעימה הבסיסית של הדבר הזה: את המספרים המרוכבים אפשר לבנות פורמלית בצורה הבאה: לוקחים את החוג \( \mathbb{R}\left[x\right] \) של פולינומים במשתנה אחד מעל הממשיים. זה חוג קומוטטיבי עם יחידה ולכן המשפטים שלעיל תקפים עבורו. עכשיו נגדיר את האידאל \( I=\left\langle x^{2}+1\right\rangle \). לא קשה להראות שהאידאל הזה מקסימלי בגלל שהפולינום \( x^{2}+1 \) הוא אי פריק; הסיבה לכך שהוא אי-פריק היא שאין לו שורש ב-\( \mathbb{R} \) (השורש שלו הוא בדיוק המספר המרוכב \( i \) שטרם בנינו). כעת נגדיר \( \mathbb{C}\triangleq R/\left\langle x^{2}+1\right\rangle \); חוג המנה שיתקבל אכן ייראה בדיוק כמו שדה המספרים המרוכבים שאנחנו מכירים ואוהבים. זו, לטעמי, הדרך הנכונה לבנות את המספרים המרוכבים. כשנדבר בהמשך על הרחבת שדות נראה איך אפשר להשתמש באותה הבניה בשלל סיטואציות שונות.
נהניתם? התעניינתם? אם תרצו, אתם מוזמנים לתת טיפ: