משפט ארבעת הריבועים של לגראנז’

אני רוצה לדבר על אחת מהתוצאות הנחמדות ביותר (לטעמי) בתורת המספרים האלמנטרית - משפט ארבעת הריבועים של לגראנז’. בפשטות, המשפט אומר שאפשר להציג כל מספר טבעי בתור סכום של ארבעה ריבועים של מספרים טבעיים (כש-0 נחשב למספר טבעי). הנה דוגמאות עבור המספרים הטבעיים מ-1 עד 7:

\( 1=1^{2}+0^{2}+0^{2}+0^{2} \)

\( 2=1^{2}+1^{2}+0^{2}+0^{2} \)

\( 3=1^{2}+1^{2}+1^{2}+0^{2} \)

\( 4=2^{2}+0^{2}+0^{2}+0^{2} \)

\( 5=2^{2}+1^{2}+0^{2}+0^{2} \)

\( 6=2^{2}+1^{2}+1^{2}+0^{2} \)

\( 7=2^{2}+1^{2}+1^{2}+1^{2} \)

הפסקתי ב-7 בכוונה - הוא הדוגמה הראשונה שיש לנו למספר שאנחנו חייבים ארבעה ריבועים כדי לקבל אותו (תוכיחו! זה בסך הכל כולל בדיקה של כמה מקרים). מה שמפתיע כאן הוא ש-4 זה כל מה שצריך - ואפשר לייצג כל מספר, גדול ומורכב ככל שיהיה, כסכום של ארבעה ריבועים.

כשאני אומר שזה משפט בתורת המספרים “האלמנטרית” הכוונה היא לכך שלא משתמשים בכלים מתמטיים כבדים שנדרשת היכרות מוקדמת איתם - ההוכחה מסתמכת על חשבון מודולורי ותו לא (וחשבון מודולורי הוא לגמרי הלחם והחמאה של תורת המספרים). זה לא אומר שההוכחה היא אלמנטרית, למרות שהיא לא מסובכת במיוחד; הפוסט הזה כן יהיה טכני, וקשה יהיה להבין את ההוכחה בלי להתעמק קצת בפרטים הטכניים הללו. וזה בסדר גמור ואין עם זה בעיה - בלי להתעסק בפרטים הטכניים מפספסים לא מעט מהכיף שבמתמטיקה, לטעמי.

את ההוכחה עצמה אפשר לחלק לשני חלקים: ראשית, מראים שאפשר לצמצם את הבעיה כך שמספיק להוכיח שכל מספר ראשוני ניתן להצגה כסכום של ארבעה ראשונים; ואז מראים את זה עבור ראשוניים. הרדוקציה הזו ל”מספיק להוכיח על ראשוניים” היא לכשעצמה טכניקה נפוצה בתורת המספרים והיא עובדת יפה גם כאן (כי יותר קל להוכיח עבור ראשוני שהוא סכום של ארבעה ריבועים מאשר עבור מספר כללי). אז בואו נתחיל קודם כל מהחלק הראשון - לשכנע אתכם שמספיק להוכיח שכל ראשוני הוא סכום של ארבעה ריבועים.

הטענה שאני רוצה להוכיח היא זו: אם \( a \) ניתן להצגה כסכום של ארבעה ריבועים, ו-\( b \) ניתן להצגה כסכום של ארבעה ריבועים, אז גם \( ab \) (המכפלה שלהם) ניתן להצגה כסכום של ארבעה ריבועים. נשמע לכם טריוויאלי או מובן מאליו? אין בעיה - קחו דקה בצד ונסו להוכיח את זה. כנראה שתגלו שזה לא פשוט כמו שזה נראה.

אם הוכחתי את הטענה הזו, אז נובע מייד שמספיק להוכיח את המשפט עבור ראשוניים. למה? ובכן, ראשית, טריוויאלי להכליל את הטענה עבור מכפלה של מספר סופי של מספרים (כלומר, המכפלה של כל מספר סופי של מספרים, שכולם סכום של ארבעה ריבועים, גם היא סכום של ארבעה ריבועים). שנית, כל מספר גדול מ-1 הוא מכפלה של מספר סופי של ראשוניים, ולכן אם כל הראשוניים הם סכום של ארבעה ריבועים, כל מספר הוא כזה (למעט 0 ו-1 אבל כבר ראינו מה קורה איתם). הנה דוגמה קלאסית לאופן שבו היות הראשוניים “אבני הבניין” של כל המספרים עוזר לנו.

ובכן, נניח ש-\( a,b \) הם סכום של ארבעה ריבועים. למה גם \( ab \) כזה? התשובה: זה כואב. מה כואב? לראות את הנוסחה המתאימה. מה שעושים הוא לכתוב הצגה של \( a \) כסכום של ארבעה ריבועים, ואת \( b \) כסכום של ארבעה ריבועים, ואז לכתוב את הביטוי המדויק שמתאר את \( ab \) בתור סכום של ארבעה ריבועים. אפשר לפתוח סוגריים ולראות שהכל יוצא כמו שצריך, אבל זה כואב. כמו כן, מי זוכר איך בכלל הנוסחה הזו נראית? האם אני צריך לזכור את הנוסחה בעל פה? ממתי צריך לזכור דברים במתמטיקה בעל פה? האם אני יכול לכתוב את החלק הזה של הפוסט מהראש בלי להעתיק מספר? ובכן, יש תעלול אחד שיקל עלי את החיים, ויתן לי תירוץ להציג מושג חדש ומעניין בפני עצמו: קווטרניונים.

לקווטרניונים היסטוריה מרתקת משל עצמם אבל לא אכנס אליה כרגע. הרעיון הבסיסי בהם הוא להרחיב בצורה מסויימת את המספרים המרוכבים. אם המספרים המרוכבים הם מספרים מהצורה \( a+bi \) כאשר \( a,b\in\mathbb{R} \) ו-\( i \) מקיים ש-\( i^{2}=-1 \), אז הקווטרניונים (מעל הממשיים; יש מושג כללי יותר של אלגברת קווטרניונים שלא אכנס אליו כאן) הם מספרים מהצורה \( a+bi+cj+dk \) כאשר \( a,b,c,d\in\mathbb{R} \) ו-\( i^{2}=j^{2}=k^{2}=-1 \), והמכפלות של \( i,j,k \) מתוארות על ידי הכלל “כפל על פי הסדר נותן את הבא בתור, וכפל בסדר הפוך נותן את המינוס שלו”. מה זאת אומרת? הנה המשוואות:

\( ij=k \) ו-\( ji=-k \)

\( jk=i \) ו-\( kj=-i \)

\( ki=j \) ו-\( ik=-j \)

(למעשה, מספיקות רק המשוואות \( ij=k,jk=i,ki=j \) והמשוואה \( i^{2}=j^{2}=k^{2}=-1 \) כדי שניתן יהיה להסיק את היתר).

הנה דוגמה פשוטה למכפלה של שני קווטרניונים:

\( \left(4+3i\right)\left(2+5k\right)=8+6i+20k+15ik=8+6i-15j+20k \)

עכשיו, למספרים מרוכבים יש נורמה, שהיא מדד ל”גודל” שלהם (פורמלית - המרחק של המספר המרוכב מראשית הצירים). הנורמה מסומנת בסימן של ערך מוחלט, ומוגדרת בתור \( \left|a+bi\right|=\sqrt{a^{2}+b^{2}} \), או \( \left|a+bi\right|^{2}=a^{2}+b^{2} \). תכונה חשובה של הנורמה הזו היא שהיא כפלית, כלומר \( \left|a+bi\right|\left|x+yi\right|=\left|\left(a+bi\right)\left(x+yi\right)\right| \). הרעיון הוא שעם קווטרניונים זה אותו הדבר בדיוק.

איך זה קשור לענייננו? ובכן, אם \( a+bi+cj+dk \) הוא קווטרניון, אז הנורמה שלו בריבוע היא בדיוק \( a^{2}+b^{2}+c^{2}+d^{2} \), כלומר סכום של ארבעה ריבועים. ולהפך: לכל ארבעה מספרים שנרצה, אפשר לבנות קווטרניון שהנורמה שלו בריבוע היא סכום הריבועים של המספרים (פשוט לוקחים את המספרים להיות מקדמי הקווטרניון). כעת, אם \( p,q \) הם קווטרניונים, אז המשוואה \( \left|p\right|^{2}\left|q\right|^{2}=\left|pq\right|^{2} \) אומרת לנו בדיוק שמכפלת שני סכומים ארבעה ריבועים (\( \left|p\right|^{2} \) ו-\( \left|q\right|^{2} \)) היא בעצמה סכום של ארבעה ריבועים (\( \left|pq\right|^{2} \)).

כעת ברור גם איך אפשר למצוא את הנוסחה במפורש: ניקח את \( \left(a+bi+cj+dk\right) \) ונכפול אותו ב-\( \left(x+yi+zj+uk\right) \), ונבדוק את הנורמה של מה שנקבל. זה לא יהיה נעים. זה יהיה כואב. אבל לפחות לא אצטרך להעתיק נוסחה משום מקום ואוכל לפתח את הכל בעצמי - ותאמינו לי, זה מרגיש יותר טוב.

ובכן:

\( \left(a+bi+cj+dk\right)\left(x+yi+zj+uk\right)=\left(ax-by-cz-du\right)+ \)

\( \left(ay+bx+cu-dz\right)i+\left(az-bu+cx+dy\right)j+\left(au+bz-cy+dx\right)k \)

ולכן קיבלתי את הנוסחה הבאה להצגה של מכפלת שני סכומי ארבעה ריבועים כסכום של ארבעה ריבועים:

\( \left(a^{2}+b^{2}+c^{2}+d^{2}\right)\left(x^{2}+y^{2}+z^{2}+u^{2}\right)= \)

\( \left(ax-by-cz-du\right){}^{2}+\left(ay+bx+cu-dz\right)^{2}+\left(az-bu+cx+dy\right)^{2}+\left(au+bz-cy+dx\right)^{2} \)

עדיין לא הוכחתי שהנוסחה נכונה, כי הסתמכתי על ההנחה שהנורמה של הקווטרניונים כפלית - אבל כאמור, מרגע שיש לנו את הנוסחה מול העיניים אפשר סתם לפתוח את הסוגריים ולראות שהיא עובדת. למי שבכל זאת רוצה דרך עקיפה, אפשר להסתמך על כך שקווטרניונים ניתנים לייצוג על ידי מטריצות מסדר \( 2\times2 \) מעל המרוכבים, באופן הבא: המספר \( a+bi+cj+dk \) מיוצג על ידי המטריצה \( \left[\begin{array}{cc}a+bi & c+di\\-c+di & a-bi\end{array}\right] \). כמובן, עכשיו צריך לבדוק שהייצוג הזה באמת נכון (כלומר, לכפול שתי מטריצות ולראות שמתקבלת המכפלה שציפינו לה), אבל מרגע שבדקנו את זה, סיימנו: הנורמה של הקווטרניון היא פשוט הדטרמיננטה של המטריצה (לראות את זה - זה מיידיי לחלוטין) ודטרמיננטה של מטריצות היא כפלית.

איבדתם אותי? גם אם כן, לא נורא - זה לא פוסט על קווטרניונים ולא חייבים להבין את מה שעשיתי פה בשביל ההמשך - כל מה שחשוב הוא שמכאן והלאה מספיק לנו להוכיח את משפט לגראנז’ עבור ראשוניים בלבד. וכאן אנחנו מתחילים להשתמש בטיעוני תורת המספרים.

המתווה של ההוכחה מעתה והלאה הוא זה: יהא \( p \) מספר ראשוני אי זוגי כלשהו (ב-2 כבר טיפלנו במפורש קודם, ובהמשך הוא יעשה בעיות כפי שהוא בדרך כלל עושה אז נניח ש-\( p \) שונה ממנו). בשלב ראשון אני אמצא מספר \( 1\le m<p \) כלשהו כך ש-\( mp \)הוא סכום של ארבעה ריבועים - זה יהיה די קל, באופן אולי מפתיע. לדוגמה, נניח שאני רוצה להוכיח ש-13 הוא סכום של 4 ריבועים, אני אתחיל מלהוכיח ש-65 (ששווה ל-\( 13\cdot5 \)) הוא סכום של ארבעה ריבועים כי קל לי לראות את זה: \( 65=8^{2}+1^{2}+0^{2}+0^{2} \). עכשיו, אחרי שמצאתי \( m \) כזה, אני רוצה להתחיל “להצטמצם”. אני אוכיח שאם יש \( 1<m<p \) כך ש-\( mp \) הוא סכום של ארבעה ריבועים, אז קיים \( 1\le n<m \) כך ש-\( np \) הוא עדיין סכום של ארבעה ריבועים - כלומר, הקטנתי את מי שמוכפל ב-\( p \). ואז אני יכול לחזור על ההוכחה הזו גם עבורו, ושוב ושוב עד שלבסוף בהכרח אגיע ל-\( p \) עצמו (כלומר, כשהוא מוכפל ב-1). ההוכחה של השלב הזה - הנסיגה הזו כלפי מטה - היא החלק הקשה והטכני ביותר בהוכחה (אבל לא לדאוג, גם הוא לא כל כך נורא).

כדי להוכיח שקיים \( m<p \) כך ש-\( mp \) הוא סכום של ארבעה ריבועים, אני אסתכל על \( \mathbb{Z}_{p} \) - שדה המספרים מודולו \( p \), ואוכיח שיש בו פתרון למשוואה \( x^{2}+y^{2}+1=0 \), כלומר ש-\( p|x^{2}+y^{2}+1 \), כלומר שקיים \( m \) כך ש-\( mp=x^{2}+y^{2}+1=x^{2}+y^{2}+1^{2}+0^{2} \), ואם יהיה לי חסם טוב כלשהו על הגודל של \( x,y \) אז גם אוכל לחסום את הגודל של \( m \). זה המקום הראשון שבו העובדה שהצטמצמנו לדיבור על ראשוני \( p \) עוזרת; למשל, ב-\( \mathbb{Z}_{8} \) אין פתרון למשוואה הזו, כי \( x^{2} \) מודולו 8 יכול להיות רק 0 או 1 או 4. אז מה ההבדל בין ראשוני ולא ראשוני? ב-\( \mathbb{Z}_{8} \) מה שקורה הוא שיש ארבעה מספרים שבריבוע נותנים 1 - 1,3,5,7, כלומר ל-1 יש ארבעה שורשים; לעומת זאת, עבור \( p \) ראשוני לכל מספר יש לכל היותר שני שורשים - זה נובע מכך ש-\( \mathbb{Z}_{p} \) הוא שדה ולכן לפולינום ממעלה \( n \) מעל \( \mathbb{Z}_{p} \) יש לכל היותר \( n \) שורשים (ולכן לפולינום \( x^{2}-a \) יש לכל היותר שני שורשים, כלומר ל-\( a \) יש לכל היותר שני שורשים).

ספציפית ב-\( \mathbb{Z}_{p} \), ל-0 יש רק שורש אחד (0) ולכל מספר אחר שהוא ריבוע יש בדיוק שני שורשים (אם \( a=x^{2} \) אז \( y=-x \) גם הוא שורש כי \( y^{2}=\left(-x\right)^{2}=x^{2}=a \), ולא ייתכן ש-\( x=y \) כי אם \( x=-x \) אז \( 2x=0 \) מודולו \( p \) ולכן \( p \) מחלק את 2). זה אומר שאם נגדיר את הקבוצה \( S=\left\{ a^{2}\ |\ a\in\mathbb{Z}_{p}\right\} \), גודלה יהיה בדיוק \( \frac{p+1}{2} \). למה? כי בואו ניקח את כל המספרים ב-\( \mathbb{Z}_{p} \) ונעלה אותם בריבוע. 0 הוא מקרה מיוחד, ופרט אליו נשארים \( p-1 \) איברים שאפשר לסדר בזוגות שנותנים את אותו ריבוע, כלומר נקבל \( \frac{p-1}{2}+1 \) ריבועים בסך הכל, וזה שווה ל-\( \frac{p+1}{2} \).

עכשיו בואו נביט שוב על המשוואה שאנו רוצים לפתור: \( x^{2}+y^{2}+1=0 \), כלומר \( x^{2}=-1-y^{2} \). אם נצליח למצוא ריבוע שהוא גם מהצורה \( -1-y^{2} \) ניצחנו; נגדיר \( S^{\prime}=\left\{ -1-a\ |\ a\in S\right\} \). אם \( a\ne b \) אז \( -1-a\ne-1-b \) ולכן גם הגודל של \( S^{\prime} \) הוא \( \frac{p+1}{2} \). אז מה קיבלנו? שתי קבוצות: \( S,S^{\prime} \), שמספר האיברים הכולל בשתיהן הוא \( p+1 \), אבל ב-\( \mathbb{Z}_{p} \) יש בדיוק \( p \) איברים. מסקנה: יש ל-\( S,S^{\prime} \) איבר משותף - איבר שניתן להציג גם כ-\( x^{2} \) וגם כ-\( -1-y^{2} \). לכן מצאנו שמתקיים \( x^{2}=-1-y^{2} \), כלומר \( x^{2}+y^{2}+1=0 \), ומכאן שקיים \( m \) כך ש-\( mp=x^{2}+y^{2}+1 \). לכן בפרט \( mp \) הוא סכום של ארבעה ריבועים: \( mp=x^{2}+y^{2}+1^{2}+0^{2} \).

אנחנו עדיין רוצים להגביל את הגודל של ה-\( m \) הזה, ונעשה את זה עם תעלול סטנדרטי. אם \( p|x^{2}+y^{2}+1 \), אז אפשר להוסיף או להחסיר \( p \) בחופשיות ל-\( x,y \) והמשוואה עדיין תתקיים (“להחליף את \( x \) באיבר ששקול לו מודולו \( p \)”). למשל, אם \( 7|2^{2}+4^{2}+1 \), אנחנו יכולים להחליף את \( 4 \) ב-\( -3 \) ולקבל את אותו דבר: \( 7|2^{2}+\left(-3\right)^{2}+1 \). הסכום הראשון נותן לנו \( 4+16+1=21 \) והסכום השני נותן לנו \( 4+9+1=14 \) - שניהם מתחלקים ב-7, אבל שימו לב שהסכום השני קטן יותר. אז מה שנעשה עם המשוואה \( p|x^{2}+y^{2}+1 \) הכללית הוא לבחור את \( x \) כך שיקיים \( \left|x\right|<\frac{p}{2} \) וכך גם עבור \( y \). אם אתם לא משוכנעים שאפשר, נסו להוכיח זאת לעצמכם. המסקנה? אם \( mp=x^{2}+y^{2}+1 \) אז \( mp<\left(\frac{p}{2}\right)^{2}+\left(\frac{p}{2}\right)^{2}+1=\frac{p^{2}}{2}+1\le p^{2} \) ועל ידי כך שנחלק ב-\( p \) את שני האגפים נקבל \( m<p \), כפי שרצינו.

בשעה טובה הגענו אל החלק האחרון של ההוכחה: להוכיח שאם \( mp \) הוא סכום של ארבעה ריבועים ו-\( 1<m \) אז קיים \( 1\le n<m \) כך שגם \( np \) הוא סכום של ארבעה ריבועים. אז ראשית כל נכתוב:

\( mp=x_{1}^{2}+x_{2}^{2}+x_{3}^{2}+x_{4}^{4} \)

במילים אחרות, \( m \) מחלק את הסכום הזה, כלומר \( x_{1}^{2}+x_{2}^{2}+x_{3}^{2}+x_{4}^{4}\equiv_{m}0 \). כמו קודם, נרצה לבחור איברים ששקולים ל-\( x \)-ים בצורה כזו שהם יהיו קטנים יחסית, אבל הפעם ביחס לגודל של \( m \) ולא של \( p \). אז לכל \( 1\le i\le4 \) נמצא \( y_{i} \) כך ש-\( x_{i}\equiv_{m}y_{i} \) ומתקיים ש-\( -\frac{m}{2}<y_{i}\le\frac{m}{2} \) (בכוונה לא כתבתי \( \left|y_{i}\right|\le\frac{m}{2} \) כי עוד מעט אסתמך על כך שאפשר לבחור את ה-\( y_{i} \)-ים כך שיהיו שונים מ-\( -\frac{m}{2} \)). נקבל שיש \( n \) כך ש-\( nm=y_{1}^{2}+y_{2}^{2}+y_{3}^{2}+y_{4}^{4}\le\frac{m^{2}}{4}+\frac{m^{2}}{4}+\frac{m^{2}}{4}+\frac{m^{2}}{4}=m^{2} \), כלומר \( 0\le n\le m \). מצאנו את ה-\( n \) שלנו. מה שנשאר לעשות: להוכיח ש-\( n>0 \), להוכיח ש-\( n<m \), ולהוכיח ש-\( np \) הוא סכום של ארבעה ריבועים.

נניח ש-\( n=0 \). זה אומר שבהכרח כל ה-\( y_{i} \)-ים הם 0, ומכיוון ש-\( x_{i}\equiv_{m}y_{i} \) נובע מכך ש-\( m \) מחלק את כל ה-\( x_{i} \)-ים. לכן \( m^{2} \) מחלק את \( x_{1}^{2}+x_{2}^{2}+x_{3}^{2}+x_{4}^{4}=mp \). אם \( m^{2}|mp \) נובע מכך ש-\( m|p \), וזו סתירה לכך ש-\( p \) ראשוני (הנה, השתמשנו בזה שוב!). אז \( n\ne0 \).

נניח ש-\( n=m \). מתי זה יכול לקרות? רק אם \( y_{i}=\frac{m}{2} \) לכל \( 1\le i\le4 \), כלומר \( x_{i}\equiv_{m}\frac{m}{2} \) לכל \( 1\le i\le4 \), ועל ידי העלאה בריבוע של האגפים ושל המודולוס נקבל \( x_{i}^{2}\equiv_{m^{2}}\frac{m^{2}}{4} \), כלומר \( mp\equiv_{m^{2}}m^{2} \), כלומר \( m^{2}|m\left(p-m\right) \) ולכן שוב נקבל \( m|p \) - סתירה. אז \( n\ne m \).

כדי להראות ש-\( np \) הוא סכום של ארבעה ריבועים, נסתכל קודם כל על שני הסכומים שכבר ראינו:

\( mp=x_{1}^{2}+x_{2}^{2}+x_{3}^{2}+x_{4}^{4} \)

\( nm=y_{1}^{2}+y_{2}^{2}+y_{3}^{2}+y_{4}^{4} \)

אנחנו כבר יודעים שמכפלה של שני סכומי ארבעה ריבועים היא בעצמה סכום של ארבעה ריבועים, אז על ידי כפל שתי המשוואות אני אקבל ש-\( npm^{2} \) הוא סכום של ארבעה ריבועים. הבעיה היא ה-\( m^{2} \) שתקוע בקצה המכפלה. כדי להיפטר ממנו, אני צריך להראות ש-\( npm^{2}=z_{1}^{2}+z_{2}^{2}+z_{3}^{2}+z_{4}^{2} \) כך שלכל \( 1\le i\le4 \) מתקיים \( m|z_{i} \) - זה יסיים את זה סופית. כדי לראות את זה, אני חושש שאין מנוס מלשלוף שוב את הנוסחה שמציגה את מכפלת שני סכומי הריבועים כסכום ריבועים בעצמה:

\( \left(x_{1}^{2}+x_{2}^{2}+x_{3}^{2}+x_{4}^{2}\right)\left(y_{1}^{2}+y_{2}^{2}+y_{3}^{2}+y_{4}^{2}\right)= \)

\( \left(x_{1}y_{1}-x_{2}y_{2}-x_{3}y_{3}-x_{4}y_{4}\right){}^{2}+\left(x_{1}y_{2}+x_{2}y_{1}+x_{3}y_{4}-x_{4}y_{3}\right)^{2}+ \)

\( \left(x_{1}y_{3}-x_{2}y_{4}+x_{3}y_{1}+x_{4}y_{2}\right)^{2}+\left(x_{1}y_{4}+x_{2}y_{3}-x_{3}y_{2}+x_{4}y_{1}\right)^{2} \)

בנוסחה הזו אני הולך לעשות מניפולציה קטנה: אני יכול להחליף את \( y_{2},y_{3},y_{4} \) במינוס שלהם - זה לא משפיע בכלל על אגף שמאל (כי אנחנו מעלים את המספרים הללו בריבוע) ובאגף ימין זה רק יגרום לביטויים שבתוך הסוגריים להיות יותר נוחים עבורי. עכשיו, אני צריך להוכיח שכל אחד מהביטויים הללו מתחלק ב-\( m \), ולכן אני אסתכל עליו מודולו \( m \) ואשתמש בכך ש-\( x_{i}\equiv_{m}y_{i} \).

נקבל שהביטוי בסוגריים הראשונים, אחרי החלפת ה-\( y \)-ים במינוסים שלהם ואחרי החלפת ה-\( y \)-ים ב-\( x \)-ים, הוא \( x_{1}^{2}+x_{2}^{2}+x_{3}^{2}+x_{4}^{2} \), והביטוי הזה שווה ממש ל-\( mp \) ולכן בוודאי ששקול ל-0 מודולו \( m \).

נותרו שלושת הסוגריים האחרים ובכולם המבנה דומה. נסתכל על הסוגר הראשון מביניהם: הביטוי בו בהתחלה היה \( x_{1}y_{2}+x_{2}y_{1}+x_{3}y_{4}-x_{4}y_{3} \). אחרי החלפת \( y_{2},y_{3},y_{4} \) במינוסים שלהם קיבלנו את \( x_{2}y_{1}-x_{1}y_{2}+x_{4}y_{3}-x_{3}y_{4} \). שימו לב לסימטריה! עכשיו, אחרי החלפת ה-\( y \)-ים ב-\( x \)-ים נקבל \( x_{2}x_{1}-x_{1}x_{2}+x_{4}x_{3}-x_{3}x_{4}=0 \), כלומר קיבלנו שהביטוי שקול ל-0 מודולו \( m \) ולכן מתחלק ב-\( m \). אותו דבר מטפל בכל יתר הביטויים שבסוגריים, אז ניצחנו!

המסקנה הסופית שלנו היא שכל מספר ניתן לייצוג כסכום של ארבעה ריבועים, אבל יש עוד שתי הערות צדדיות שאני רוצה לדבר עליהן כאן. ראשית, יש תוצאה חזקה אפילו יותר עבור ראשוניים ששקולים ל-1 מודולו \( 4 \): כל ראשוני כזה ניתן להצגה כסכום של שני ריבועים. זו אבחנה שהייתה קיימת כבר אצל פרמה ואוילר הוכיח; את ההוכחה כבר הצגתי בבלוג בעבר. אוילר הוא גם זה שמצא את הנוסחה שמציגה מכפלה של סכום של ארבעה ריבועים בתור סכום של ארבעה ריבועים בעצמו, אבל לא עלה בידיו למצוא את יתר ההוכחה - את זה עשה, כאמור, לגראנז’, ב-1770. לא מעט שנים לאחר מכן, ב-1834, יעקובי הצליח להוכיח תוצאה חזקה בהרבה - נוסחה שנותנת, לכל מספר טבעי, את מספר הדרכים השונות לכתוב אותו כסכום של ארבעה ריבועים; במילים אחרות, נוסחה שמתארת את מספר הפתרונות השונים למשוואה הדיופנטית \( x_{1}^{2}+x_{2}^{2}+x_{3}^{2}+x_{4}^{2}=n \). בפרט המספר הזה גדול תמיד מ-0 ולכן משפט לגראנז’ נובע. רק מה, ההוכחות לטענה הזו מסובכות יותר; הפשוטה ביותר שאני מכיר היא של דיריכלה ומסתמכת על קרקטרי דיריכלה, שגם אותם כבר הצגתי בבלוג בעבר. יהיה נחמד מאוד להציג את ההוכחה הזו מתישהו בבלוג, אבל לעת עתה אסתפק בלתת את הנוסחה: אם \( n \) הוא מספר טבעי חיובי אי זוגי אז מספר הפתרונות בשלמים (כולל שליליים! ועם חשיבות לסדר!) למשוואה \( x_{1}^{2}+x_{2}^{2}+x_{3}^{2}+x_{4}^{2}=n \) הוא \( 8\cdot\sum_{d|n}d \) (שמונה כפול סכום המחלקים הטבעיים של \( n \)), ואם \( n \) הוא זוגי אז מספר הפתרונות הוא \( 24\cdot\sum_{d|n}d \) כאשר כאן ה-\( d \)-ים הם רק המחלקים האי-זוגיים.

הנוסחה מגניבה לגמרי, אבל כשאני רואה אותה הדבר הראשון שאני תוהה לגביו הוא למה, לכל הרוחות, היא בכלל עובדת. לכן הוכחות הן דבר מעניין. לצערי, נצטרך לוותר עליה לבינתיים כי שולי הפוסט הזה צרים מלהכילה (מתי, מתי יימאס לי מהבדיחה הזו בסוף פוסטים של תורת המספרים?)

נהניתם? התעניינתם? אם תרצו, אתם מוזמנים לתת טיפ: