משפט ארבעת הריבועים של לגראנז'

אני רוצה לדבר על אחת מהתוצאות הנחמדות ביותר (לטעמי) בתורת המספרים האלמנטרית - משפט ארבעת הריבועים של לגראנז’. בפשטות, המשפט אומר שאפשר להציג כל מספר טבעי בתור סכום של ארבעה ריבועים של מספרים טבעיים (כש-0 נחשב למספר טבעי). הנה דוגמאות עבור המספרים הטבעיים מ-1 עד 7:

$latex 1=1^{2}+0^{2}+0^{2}+0^{2}$

$latex 2=1^{2}+1^{2}+0^{2}+0^{2}$

$latex 3=1^{2}+1^{2}+1^{2}+0^{2}$

$latex 4=2^{2}+0^{2}+0^{2}+0^{2}$

$latex 5=2^{2}+1^{2}+0^{2}+0^{2}$

$latex 6=2^{2}+1^{2}+1^{2}+0^{2}$

$latex 7=2^{2}+1^{2}+1^{2}+1^{2}$

הפסקתי ב-7 בכוונה - הוא הדוגמה הראשונה שיש לנו למספר שאנחנו חייבים ארבעה ריבועים כדי לקבל אותו (תוכיחו! זה בסך הכל כולל בדיקה של כמה מקרים). מה שמפתיע כאן הוא ש-4 זה כל מה שצריך - ואפשר לייצג כל מספר, גדול ומורכב ככל שיהיה, כסכום של ארבעה ריבועים.

כשאני אומר שזה משפט בתורת המספרים “האלמנטרית” הכוונה היא לכך שלא משתמשים בכלים מתמטיים כבדים שנדרשת היכרות מוקדמת איתם - ההוכחה מסתמכת על חשבון מודולורי ותו לא (וחשבון מודולורי הוא לגמרי הלחם והחמאה של תורת המספרים). זה לא אומר שההוכחה היא אלמנטרית, למרות שהיא לא מסובכת במיוחד; הפוסט הזה כן יהיה טכני, וקשה יהיה להבין את ההוכחה בלי להתעמק קצת בפרטים הטכניים הללו. וזה בסדר גמור ואין עם זה בעיה - בלי להתעסק בפרטים הטכניים מפספסים לא מעט מהכיף שבמתמטיקה, לטעמי.

את ההוכחה עצמה אפשר לחלק לשני חלקים: ראשית, מראים שאפשר לצמצם את הבעיה כך שמספיק להוכיח שכל מספר ראשוני ניתן להצגה כסכום של ארבעה ראשונים; ואז מראים את זה עבור ראשוניים. הרדוקציה הזו ל”מספיק להוכיח על ראשוניים” היא לכשעצמה טכניקה נפוצה בתורת המספרים והיא עובדת יפה גם כאן (כי יותר קל להוכיח עבור ראשוני שהוא סכום של ארבעה ריבועים מאשר עבור מספר כללי). אז בואו נתחיל קודם כל מהחלק הראשון - לשכנע אתכם שמספיק להוכיח שכל ראשוני הוא סכום של ארבעה ריבועים.

הטענה שאני רוצה להוכיח היא זו: אם $latex a$ ניתן להצגה כסכום של ארבעה ריבועים, ו-$latex b$ ניתן להצגה כסכום של ארבעה ריבועים, אז גם $latex ab$ (המכפלה שלהם) ניתן להצגה כסכום של ארבעה ריבועים. נשמע לכם טריוויאלי או מובן מאליו? אין בעיה - קחו דקה בצד ונסו להוכיח את זה. כנראה שתגלו שזה לא פשוט כמו שזה נראה.

אם הוכחתי את הטענה הזו, אז נובע מייד שמספיק להוכיח את המשפט עבור ראשוניים. למה? ובכן, ראשית, טריוויאלי להכליל את הטענה עבור מכפלה של מספר סופי של מספרים (כלומר, המכפלה של כל מספר סופי של מספרים, שכולם סכום של ארבעה ריבועים, גם היא סכום של ארבעה ריבועים). שנית, כל מספר גדול מ-1 הוא מכפלה של מספר סופי של ראשוניים, ולכן אם כל הראשוניים הם סכום של ארבעה ריבועים, כל מספר הוא כזה (למעט 0 ו-1 אבל כבר ראינו מה קורה איתם). הנה דוגמה קלאסית לאופן שבו היות הראשוניים “אבני הבניין” של כל המספרים עוזר לנו.

ובכן, נניח ש-$latex a,b$ הם סכום של ארבעה ריבועים. למה גם $latex ab$ כזה? התשובה: זה כואב. מה כואב? לראות את הנוסחה המתאימה. מה שעושים הוא לכתוב הצגה של $latex a$ כסכום של ארבעה ריבועים, ואת $latex b$ כסכום של ארבעה ריבועים, ואז לכתוב את הביטוי המדויק שמתאר את $latex ab$ בתור סכום של ארבעה ריבועים. אפשר לפתוח סוגריים ולראות שהכל יוצא כמו שצריך, אבל זה כואב. כמו כן, מי זוכר איך בכלל הנוסחה הזו נראית? האם אני צריך לזכור את הנוסחה בעל פה? ממתי צריך לזכור דברים במתמטיקה בעל פה? האם אני יכול לכתוב את החלק הזה של הפוסט מהראש בלי להעתיק מספר? ובכן, יש תעלול אחד שיקל עלי את החיים, ויתן לי תירוץ להציג מושג חדש ומעניין בפני עצמו: קווטרניונים.

לקווטרניונים היסטוריה מרתקת משל עצמם אבל לא אכנס אליה כרגע. הרעיון הבסיסי בהם הוא להרחיב בצורה מסויימת את המספרים המרוכבים. אם המספרים המרוכבים הם מספרים מהצורה $latex a+bi$ כאשר $latex a,b\in\mathbb{R}$ ו-$latex i$ מקיים ש-$latex i^{2}=-1$, אז הקווטרניונים (מעל הממשיים; יש מושג כללי יותר של אלגברת קווטרניונים שלא אכנס אליו כאן) הם מספרים מהצורה $latex a+bi+cj+dk$ כאשר $latex a,b,c,d\in\mathbb{R}$ ו-$latex i^{2}=j^{2}=k^{2}=-1$, והמכפלות של $latex i,j,k$ מתוארות על ידי הכלל “כפל על פי הסדר נותן את הבא בתור, וכפל בסדר הפוך נותן את המינוס שלו”. מה זאת אומרת? הנה המשוואות:

$latex ij=k$ ו-$latex ji=-k$

$latex jk=i$ ו-$latex kj=-i$

$latex ki=j$ ו-$latex ik=-j$

(למעשה, מספיקות רק המשוואות $latex ij=k,jk=i,ki=j$ והמשוואה $latex i^{2}=j^{2}=k^{2}=-1$ כדי שניתן יהיה להסיק את היתר).

הנה דוגמה פשוטה למכפלה של שני קווטרניונים:

$latex \left(4+3i\right)\left(2+5k\right)=8+6i+20k+15ik=8+6i-15j+20k$

עכשיו, למספרים מרוכבים יש נורמה, שהיא מדד ל”גודל” שלהם (פורמלית - המרחק של המספר המרוכב מראשית הצירים). הנורמה מסומנת בסימן של ערך מוחלט, ומוגדרת בתור $latex \left|a+bi\right|=\sqrt{a^{2}+b^{2}}$, או $latex \left|a+bi\right|^{2}=a^{2}+b^{2}$. תכונה חשובה של הנורמה הזו היא שהיא כפלית, כלומר $latex \left|a+bi\right|\left|x+yi\right|=\left|\left(a+bi\right)\left(x+yi\right)\right|$. הרעיון הוא שעם קווטרניונים זה אותו הדבר בדיוק.

איך זה קשור לענייננו? ובכן, אם $latex a+bi+cj+dk$ הוא קווטרניון, אז הנורמה שלו בריבוע היא בדיוק $latex a^{2}+b^{2}+c^{2}+d^{2}$, כלומר סכום של ארבעה ריבועים. ולהפך: לכל ארבעה מספרים שנרצה, אפשר לבנות קווטרניון שהנורמה שלו בריבוע היא סכום הריבועים של המספרים (פשוט לוקחים את המספרים להיות מקדמי הקווטרניון). כעת, אם $latex p,q$ הם קווטרניונים, אז המשוואה $latex \left|p\right|^{2}\left|q\right|^{2}=\left|pq\right|^{2}$ אומרת לנו בדיוק שמכפלת שני סכומים ארבעה ריבועים ($latex \left|p\right|^{2}$ ו-$latex \left|q\right|^{2}$) היא בעצמה סכום של ארבעה ריבועים ($latex \left|pq\right|^{2}$).

כעת ברור גם איך אפשר למצוא את הנוסחה במפורש: ניקח את $latex \left(a+bi+cj+dk\right)$ ונכפול אותו ב-$latex \left(x+yi+zj+uk\right)$, ונבדוק את הנורמה של מה שנקבל. זה לא יהיה נעים. זה יהיה כואב. אבל לפחות לא אצטרך להעתיק נוסחה משום מקום ואוכל לפתח את הכל בעצמי - ותאמינו לי, זה מרגיש יותר טוב.

ובכן:

$latex \left(a+bi+cj+dk\right)\left(x+yi+zj+uk\right)=\left(ax-by-cz-du\right)+$

$latex \left(ay+bx+cu-dz\right)i+\left(az-bu+cx+dy\right)j+\left(au+bz-cy+dx\right)k$

ולכן קיבלתי את הנוסחה הבאה להצגה של מכפלת שני סכומי ארבעה ריבועים כסכום של ארבעה ריבועים:

$latex \left(a^{2}+b^{2}+c^{2}+d^{2}\right)\left(x^{2}+y^{2}+z^{2}+u^{2}\right)=$

$latex \left(ax-by-cz-du\right){}^{2}+\left(ay+bx+cu-dz\right)^{2}+\left(az-bu+cx+dy\right)^{2}+\left(au+bz-cy+dx\right)^{2}$

עדיין לא הוכחתי שהנוסחה נכונה, כי הסתמכתי על ההנחה שהנורמה של הקווטרניונים כפלית - אבל כאמור, מרגע שיש לנו את הנוסחה מול העיניים אפשר סתם לפתוח את הסוגריים ולראות שהיא עובדת. למי שבכל זאת רוצה דרך עקיפה, אפשר להסתמך על כך שקווטרניונים ניתנים לייצוג על ידי מטריצות מסדר $latex 2\times2$ מעל המרוכבים, באופן הבא: המספר $latex a+bi+cj+dk$ מיוצג על ידי המטריצה $latex \left[\begin{array}{cc}a+bi & c+di\\-c+di & a-bi\end{array}\right]$. כמובן, עכשיו צריך לבדוק שהייצוג הזה באמת נכון (כלומר, לכפול שתי מטריצות ולראות שמתקבלת המכפלה שציפינו לה), אבל מרגע שבדקנו את זה, סיימנו: הנורמה של הקווטרניון היא פשוט הדטרמיננטה של המטריצה (לראות את זה - זה מיידיי לחלוטין) ודטרמיננטה של מטריצות היא כפלית.

איבדתם אותי? גם אם כן, לא נורא - זה לא פוסט על קווטרניונים ולא חייבים להבין את מה שעשיתי פה בשביל ההמשך - כל מה שחשוב הוא שמכאן והלאה מספיק לנו להוכיח את משפט לגראנז’ עבור ראשוניים בלבד. וכאן אנחנו מתחילים להשתמש בטיעוני תורת המספרים.

המתווה של ההוכחה מעתה והלאה הוא זה: יהא $latex p$ מספר ראשוני אי זוגי כלשהו (ב-2 כבר טיפלנו במפורש קודם, ובהמשך הוא יעשה בעיות כפי שהוא בדרך כלל עושה אז נניח ש-$latex p$ שונה ממנו). בשלב ראשון אני אמצא מספר $latex 1\le m<p$ כלשהו כך ש-$latex mp$הוא סכום של ארבעה ריבועים - זה יהיה די קל, באופן אולי מפתיע. לדוגמה, נניח שאני רוצה להוכיח ש-13 הוא סכום של 4 ריבועים, אני אתחיל מלהוכיח ש-65 (ששווה ל-$latex 13\cdot5$) הוא סכום של ארבעה ריבועים כי קל לי לראות את זה: $latex 65=8^{2}+1^{2}+0^{2}+0^{2}$. עכשיו, אחרי שמצאתי $latex m$ כזה, אני רוצה להתחיל “להצטמצם”. אני אוכיח שאם יש $latex 1<m<p$ כך ש-$latex mp$ הוא סכום של ארבעה ריבועים, אז קיים $latex 1\le n<m$ כך ש-$latex np$ הוא עדיין סכום של ארבעה ריבועים - כלומר, הקטנתי את מי שמוכפל ב-$latex p$. ואז אני יכול לחזור על ההוכחה הזו גם עבורו, ושוב ושוב עד שלבסוף בהכרח אגיע ל-$latex p$ עצמו (כלומר, כשהוא מוכפל ב-1). ההוכחה של השלב הזה - הנסיגה הזו כלפי מטה - היא החלק הקשה והטכני ביותר בהוכחה (אבל לא לדאוג, גם הוא לא כל כך נורא).

כדי להוכיח שקיים $latex m<p$ כך ש-$latex mp$ הוא סכום של ארבעה ריבועים, אני אסתכל על $latex \mathbb{Z}_{p}$ - שדה המספרים מודולו $latex p$, ואוכיח שיש בו פתרון למשוואה $latex x^{2}+y^{2}+1=0$, כלומר ש-$latex p|x^{2}+y^{2}+1$, כלומר שקיים $latex m$ כך ש-$latex mp=x^{2}+y^{2}+1=x^{2}+y^{2}+1^{2}+0^{2}$, ואם יהיה לי חסם טוב כלשהו על הגודל של $latex x,y$ אז גם אוכל לחסום את הגודל של $latex m$. זה המקום הראשון שבו העובדה שהצטמצמנו לדיבור על ראשוני $latex p$ עוזרת; למשל, ב-$latex \mathbb{Z}_{8}$ אין פתרון למשוואה הזו, כי $latex x^{2}$ מודולו 8 יכול להיות רק 0 או 1 או 4. אז מה ההבדל בין ראשוני ולא ראשוני? ב-$latex \mathbb{Z}_{8}$ מה שקורה הוא שיש ארבעה מספרים שבריבוע נותנים 1 - 1,3,5,7, כלומר ל-1 יש ארבעה שורשים; לעומת זאת, עבור $latex p$ ראשוני לכל מספר יש לכל היותר שני שורשים - זה נובע מכך ש-$latex \mathbb{Z}_{p}$ הוא שדה ולכן לפולינום ממעלה $latex n$ מעל $latex \mathbb{Z}_{p}$ יש לכל היותר $latex n$ שורשים (ולכן לפולינום $latex x^{2}-a$ יש לכל היותר שני שורשים, כלומר ל-$latex a$ יש לכל היותר שני שורשים).

ספציפית ב-$latex \mathbb{Z}_{p}$, ל-0 יש רק שורש אחד (0) ולכל מספר אחר שהוא ריבוע יש בדיוק שני שורשים (אם $latex a=x^{2}$ אז $latex y=-x$ גם הוא שורש כי $latex y^{2}=\left(-x\right)^{2}=x^{2}=a$, ולא ייתכן ש-$latex x=y$ כי אם $latex x=-x$ אז $latex 2x=0$ מודולו $latex p$ ולכן $latex p$ מחלק את 2). זה אומר שאם נגדיר את הקבוצה $latex S=\left\{ a^{2}\ |\ a\in\mathbb{Z}_{p}\right\} $, גודלה יהיה בדיוק $latex \frac{p+1}{2}$. למה? כי בואו ניקח את כל המספרים ב-$latex \mathbb{Z}_{p}$ ונעלה אותם בריבוע. 0 הוא מקרה מיוחד, ופרט אליו נשארים $latex p-1$ איברים שאפשר לסדר בזוגות שנותנים את אותו ריבוע, כלומר נקבל $latex \frac{p-1}{2}+1$ ריבועים בסך הכל, וזה שווה ל-$latex \frac{p+1}{2}$.

עכשיו בואו נביט שוב על המשוואה שאנו רוצים לפתור: $latex x^{2}+y^{2}+1=0$, כלומר $latex x^{2}=-1-y^{2}$. אם נצליח למצוא ריבוע שהוא גם מהצורה $latex -1-y^{2}$ ניצחנו; נגדיר $latex S^{\prime}=\left\{ -1-a\ |\ a\in S\right\} $. אם $latex a\ne b$ אז $latex -1-a\ne-1-b$ ולכן גם הגודל של $latex S^{\prime}$ הוא $latex \frac{p+1}{2}$. אז מה קיבלנו? שתי קבוצות: $latex S,S^{\prime}$, שמספר האיברים הכולל בשתיהן הוא $latex p+1$, אבל ב-$latex \mathbb{Z}_{p}$ יש בדיוק $latex p$ איברים. מסקנה: יש ל-$latex S,S^{\prime}$ איבר משותף - איבר שניתן להציג גם כ-$latex x^{2}$ וגם כ-$latex -1-y^{2}$. לכן מצאנו שמתקיים $latex x^{2}=-1-y^{2}$, כלומר $latex x^{2}+y^{2}+1=0$, ומכאן שקיים $latex m$ כך ש-$latex mp=x^{2}+y^{2}+1$. לכן בפרט $latex mp$ הוא סכום של ארבעה ריבועים: $latex mp=x^{2}+y^{2}+1^{2}+0^{2}$.

אנחנו עדיין רוצים להגביל את הגודל של ה-$latex m$ הזה, ונעשה את זה עם תעלול סטנדרטי. אם $latex p|x^{2}+y^{2}+1$, אז אפשר להוסיף או להחסיר $latex p$ בחופשיות ל-$latex x,y$ והמשוואה עדיין תתקיים (“להחליף את $latex x$ באיבר ששקול לו מודולו $latex p$”). למשל, אם $latex 7|2^{2}+4^{2}+1$, אנחנו יכולים להחליף את $latex 4$ ב-$latex -3$ ולקבל את אותו דבר: $latex 7|2^{2}+\left(-3\right)^{2}+1$. הסכום הראשון נותן לנו $latex 4+16+1=21$ והסכום השני נותן לנו $latex 4+9+1=14$ - שניהם מתחלקים ב-7, אבל שימו לב שהסכום השני קטן יותר. אז מה שנעשה עם המשוואה $latex p|x^{2}+y^{2}+1$ הכללית הוא לבחור את $latex x$ כך שיקיים $latex \left|x\right|<\frac{p}{2}$ וכך גם עבור $latex y$. אם אתם לא משוכנעים שאפשר, נסו להוכיח זאת לעצמכם. המסקנה? אם $latex mp=x^{2}+y^{2}+1$ אז $latex mp<\left(\frac{p}{2}\right)^{2}+\left(\frac{p}{2}\right)^{2}+1=\frac{p^{2}}{2}+1\le p^{2}$ ועל ידי כך שנחלק ב-$latex p$ את שני האגפים נקבל $latex m<p$, כפי שרצינו.

בשעה טובה הגענו אל החלק האחרון של ההוכחה: להוכיח שאם $latex mp$ הוא סכום של ארבעה ריבועים ו-$latex 1<m$ אז קיים $latex 1\le n<m$ כך שגם $latex np$ הוא סכום של ארבעה ריבועים. אז ראשית כל נכתוב:

$latex mp=x_{1}^{2}+x_{2}^{2}+x_{3}^{2}+x_{4}^{4}$

במילים אחרות, $latex m$ מחלק את הסכום הזה, כלומר $latex x_{1}^{2}+x_{2}^{2}+x_{3}^{2}+x_{4}^{4}\equiv_{m}0$. כמו קודם, נרצה לבחור איברים ששקולים ל-$latex x$-ים בצורה כזו שהם יהיו קטנים יחסית, אבל הפעם ביחס לגודל של $latex m$ ולא של $latex p$. אז לכל $latex 1\le i\le4$ נמצא $latex y_{i}$ כך ש-$latex x_{i}\equiv_{m}y_{i}$ ומתקיים ש-$latex -\frac{m}{2}<y_{i}\le\frac{m}{2}$ (בכוונה לא כתבתי $latex \left|y_{i}\right|\le\frac{m}{2}$ כי עוד מעט אסתמך על כך שאפשר לבחור את ה-$latex y_{i}$-ים כך שיהיו שונים מ-$latex -\frac{m}{2}$). נקבל שיש $latex n$ כך ש-$latex nm=y_{1}^{2}+y_{2}^{2}+y_{3}^{2}+y_{4}^{4}\le\frac{m^{2}}{4}+\frac{m^{2}}{4}+\frac{m^{2}}{4}+\frac{m^{2}}{4}=m^{2}$, כלומר $latex 0\le n\le m$. מצאנו את ה-$latex n$ שלנו. מה שנשאר לעשות: להוכיח ש-$latex n>0$, להוכיח ש-$latex n<m$, ולהוכיח ש-$latex np$ הוא סכום של ארבעה ריבועים.

נניח ש-$latex n=0$. זה אומר שבהכרח כל ה-$latex y_{i}$-ים הם 0, ומכיוון ש-$latex x_{i}\equiv_{m}y_{i}$ נובע מכך ש-$latex m$ מחלק את כל ה-$latex x_{i}$-ים. לכן $latex m^{2}$ מחלק את $latex x_{1}^{2}+x_{2}^{2}+x_{3}^{2}+x_{4}^{4}=mp$. אם $latex m^{2}|mp$ נובע מכך ש-$latex m|p$, וזו סתירה לכך ש-$latex p$ ראשוני (הנה, השתמשנו בזה שוב!). אז $latex n\ne0$.

נניח ש-$latex n=m$. מתי זה יכול לקרות? רק אם $latex y_{i}=\frac{m}{2}$ לכל $latex 1\le i\le4$, כלומר $latex x_{i}\equiv_{m}\frac{m}{2}$ לכל $latex 1\le i\le4$, ועל ידי העלאה בריבוע של האגפים ושל המודולוס נקבל $latex x_{i}^{2}\equiv_{m^{2}}\frac{m^{2}}{4}$, כלומר $latex mp\equiv_{m^{2}}m^{2}$, כלומר $latex m^{2}|m\left(p-m\right)$ ולכן שוב נקבל $latex m|p$ - סתירה. אז $latex n\ne m$.

כדי להראות ש-$latex np$ הוא סכום של ארבעה ריבועים, נסתכל קודם כל על שני הסכומים שכבר ראינו:

$latex mp=x_{1}^{2}+x_{2}^{2}+x_{3}^{2}+x_{4}^{4}$

$latex nm=y_{1}^{2}+y_{2}^{2}+y_{3}^{2}+y_{4}^{4}$

אנחנו כבר יודעים שמכפלה של שני סכומי ארבעה ריבועים היא בעצמה סכום של ארבעה ריבועים, אז על ידי כפל שתי המשוואות אני אקבל ש-$latex npm^{2}$ הוא סכום של ארבעה ריבועים. הבעיה היא ה-$latex m^{2}$ שתקוע בקצה המכפלה. כדי להיפטר ממנו, אני צריך להראות ש-$latex npm^{2}=z_{1}^{2}+z_{2}^{2}+z_{3}^{2}+z_{4}^{2}$ כך שלכל $latex 1\le i\le4$ מתקיים $latex m|z_{i}$ - זה יסיים את זה סופית. כדי לראות את זה, אני חושש שאין מנוס מלשלוף שוב את הנוסחה שמציגה את מכפלת שני סכומי הריבועים כסכום ריבועים בעצמה:

$latex \left(x_{1}^{2}+x_{2}^{2}+x_{3}^{2}+x_{4}^{2}\right)\left(y_{1}^{2}+y_{2}^{2}+y_{3}^{2}+y_{4}^{2}\right)=$

$latex \left(x_{1}y_{1}-x_{2}y_{2}-x_{3}y_{3}-x_{4}y_{4}\right){}^{2}+\left(x_{1}y_{2}+x_{2}y_{1}+x_{3}y_{4}-x_{4}y_{3}\right)^{2}+$

$latex \left(x_{1}y_{3}-x_{2}y_{4}+x_{3}y_{1}+x_{4}y_{2}\right)^{2}+\left(x_{1}y_{4}+x_{2}y_{3}-x_{3}y_{2}+x_{4}y_{1}\right)^{2}$

בנוסחה הזו אני הולך לעשות מניפולציה קטנה: אני יכול להחליף את $latex y_{2},y_{3},y_{4}$ במינוס שלהם - זה לא משפיע בכלל על אגף שמאל (כי אנחנו מעלים את המספרים הללו בריבוע) ובאגף ימין זה רק יגרום לביטויים שבתוך הסוגריים להיות יותר נוחים עבורי. עכשיו, אני צריך להוכיח שכל אחד מהביטויים הללו מתחלק ב-$latex m$, ולכן אני אסתכל עליו מודולו $latex m$ ואשתמש בכך ש-$latex x_{i}\equiv_{m}y_{i}$.

נקבל שהביטוי בסוגריים הראשונים, אחרי החלפת ה-$latex y$-ים במינוסים שלהם ואחרי החלפת ה-$latex y$-ים ב-$latex x$-ים, הוא $latex x_{1}^{2}+x_{2}^{2}+x_{3}^{2}+x_{4}^{2}$, והביטוי הזה שווה ממש ל-$latex mp$ ולכן בוודאי ששקול ל-0 מודולו $latex m$.

נותרו שלושת הסוגריים האחרים ובכולם המבנה דומה. נסתכל על הסוגר הראשון מביניהם: הביטוי בו בהתחלה היה $latex x_{1}y_{2}+x_{2}y_{1}+x_{3}y_{4}-x_{4}y_{3}$. אחרי החלפת $latex y_{2},y_{3},y_{4}$ במינוסים שלהם קיבלנו את $latex x_{2}y_{1}-x_{1}y_{2}+x_{4}y_{3}-x_{3}y_{4}$. שימו לב לסימטריה! עכשיו, אחרי החלפת ה-$latex y$-ים ב-$latex x$-ים נקבל $latex x_{2}x_{1}-x_{1}x_{2}+x_{4}x_{3}-x_{3}x_{4}=0$, כלומר קיבלנו שהביטוי שקול ל-0 מודולו $latex m$ ולכן מתחלק ב-$latex m$. אותו דבר מטפל בכל יתר הביטויים שבסוגריים, אז ניצחנו!

המסקנה הסופית שלנו היא שכל מספר ניתן לייצוג כסכום של ארבעה ריבועים, אבל יש עוד שתי הערות צדדיות שאני רוצה לדבר עליהן כאן. ראשית, יש תוצאה חזקה אפילו יותר עבור ראשוניים ששקולים ל-1 מודולו $latex 4$: כל ראשוני כזה ניתן להצגה כסכום של שני ריבועים. זו אבחנה שהייתה קיימת כבר אצל פרמה ואוילר הוכיח; את ההוכחה כבר הצגתי בבלוג בעבר. אוילר הוא גם זה שמצא את הנוסחה שמציגה מכפלה של סכום של ארבעה ריבועים בתור סכום של ארבעה ריבועים בעצמו, אבל לא עלה בידיו למצוא את יתר ההוכחה - את זה עשה, כאמור, לגראנז’, ב-1770. לא מעט שנים לאחר מכן, ב-1834, יעקובי הצליח להוכיח תוצאה חזקה בהרבה - נוסחה שנותנת, לכל מספר טבעי, את מספר הדרכים השונות לכתוב אותו כסכום של ארבעה ריבועים; במילים אחרות, נוסחה שמתארת את מספר הפתרונות השונים למשוואה הדיופנטית $latex x_{1}^{2}+x_{2}^{2}+x_{3}^{2}+x_{4}^{2}=n$. בפרט המספר הזה גדול תמיד מ-0 ולכן משפט לגראנז’ נובע. רק מה, ההוכחות לטענה הזו מסובכות יותר; הפשוטה ביותר שאני מכיר היא של דיריכלה ומסתמכת על קרקטרי דיריכלה, שגם אותם כבר הצגתי בבלוג בעבר. יהיה נחמד מאוד להציג את ההוכחה הזו מתישהו בבלוג, אבל לעת עתה אסתפק בלתת את הנוסחה: אם $latex n$ הוא מספר טבעי חיובי אי זוגי אז מספר הפתרונות בשלמים (כולל שליליים! ועם חשיבות לסדר!) למשוואה $latex x_{1}^{2}+x_{2}^{2}+x_{3}^{2}+x_{4}^{2}=n$ הוא $latex 8\cdot\sum_{d|n}d$ (שמונה כפול סכום המחלקים הטבעיים של $latex n$), ואם $latex n$ הוא זוגי אז מספר הפתרונות הוא $latex 24\cdot\sum_{d|n}d$ כאשר כאן ה-$latex d$-ים הם רק המחלקים האי-זוגיים.

הנוסחה מגניבה לגמרי, אבל כשאני רואה אותה הדבר הראשון שאני תוהה לגביו הוא למה, לכל הרוחות, היא בכלל עובדת. לכן הוכחות הן דבר מעניין. לצערי, נצטרך לוותר עליה לבינתיים כי שולי הפוסט הזה צרים מלהכילה (מתי, מתי יימאס לי מהבדיחה הזו בסוף פוסטים של תורת המספרים?)


נהניתם? התעניינתם? אם תרצו, אתם מוזמנים לתת טיפ:

Buy Me a Coffee at ko-fi.com