הבעיה העשירית של הילברט - הפונקציה האקספוננציאלית היא דיופנטית

סוף סוף הגענו אל האקשן האמיתי. כזכור, עבור \( a>1 \) הגדרנו את משוואת פל \( x^{2}-dy^{2}=1 \) כאשר \( d=a^{2}-1 \), וסימנו בתור \( x_{n}\left(a\right) \) את סדרת ערכי ה-\( x \)-ים של פתרונות של המשוואה (כשכולם מוצגים בתור “חזקות” של הפתרון היסודי). המטרה שלנו כרגע היא להראות שהפונקציה \( f\left(a,k\right)=x_{k}\left(a\right) \) היא דיופנטית; לשם כך נציג מערכת משוואות שבה מככבים \( x,k,a \) ועוד כל מני משתנים אחרים, כך שאחרי שמציבים ערכים קונקרטיים ב-\( x,k,a \), למערכת המשוואות שנותרה יש פתרון אם ורק אם \( x=x_{k}\left(a\right) \). במערכת הזו יש שמונה משוואות. מוכנים? הנה הן:

\( x^{2}-\left(a^{2}-1\right)y^{2}=1 \)
\( u^{2}-\left(a^{2}-1\right)v^{2}=1 \)
\( s^{2}-\left(b^{2}-1\right)t^{2}=1 \)
\( v=ry^{2} \)
\( b=1+4py=a+qu \)
\( s=x+cu \)
\( t=k+4\left(d-1\right)y \)
\( y=k+e-1 \)

יפה. בואו נתחיל להבין מה המשמעות של כל זה ואיך כל משוואה עוזרת לנו.

נתחיל מהראשונה. כל פתרון של המשוואה הזו בעצם נותן לנו פתרון של משוואת פל עבור \( a \) כלשהו. כלומר, כבר מהמשוואה הראשונה אנחנו יכולים להסיק שקיים \( i \) כלשהו כך ש-\( x=x_{i}\left(a\right) \) וגם \( y=y_{i}\left(a\right) \). בעצם כל האתגר שנותר לנו כעת הוא להוכיח ש-\( k=i \) (זכרו! יש לחשוב על \( k \) בתור קבוע - “פרמטר” שהצבנו במשוואות).

שתי המשוואות הבאות נותנות לנו עוד פתרונות למשוואות פל. משוואה 2 מראה לנו ש-\( u=x_{n}\left(a\right),v=x_{n}\left(a\right) \) עבור \( n \) כלשהו; שימו לב שאלו הם איברים שונים באותה סדרה (של פתרונות משוואת פל עבור \( a \)). לעומת זאת \( s=x_{j}\left(b\right),t=y_{j}\left(b\right) \) הם כבר פתרונות של משוואת פל שעשויה להיות שונה, תלוי אם \( b \) שווה ל-\( a \) או לא. לשם מה אנו נזקקים לעוד שני פתרונות? סבלנות.

מידע שאנחנו מקבלים מייד הוא ש-\( b \) אכן שונה מ-\( a \) ולמעשה הוא בהכרח גדול ממנו - זה נובע ממשוואה 5, \( b=a+qu \). זכרו שכל המשוואות הללו הן בשלמים חיוביים (זה פישוט שעשינו אי-אז בתחילת סדרת הפוסטים הזו).

כעת, האם אנחנו יכולים לומר משהו על הקשר שבין \( \left(x,y\right) \) ובין \( \left(u,v\right) \)? שניהם פתרונות של משוואת פל עם המקדם \( d=a^{2}-1 \), אבל חוץ מזה הם כרוכים האחד בשני עם משוואה 4: \( v=ry^{2} \), או במפורש: \( y_{n}\left(a\right)=r\left(y_{i}\left(a\right)\right)^{2} \). במילים אחרות, \( \left(y_{i}\left(a\right)\right)^{2} \) מחלק את \( y_{n}\left(a\right) \). בפוסט הקודם הראינו שמכך נובע ש-\( y_{i}\left(a\right) \) מחלק את \( n \) (וכמובן ש-\( i\le n \)).

יפה, למדנו משהו על הקשר בין \( i \) ו-\( n \). עכשיו בואו נכניס את \( x_{j}\left(b\right) \) לתמונה. משוואה 6, כשהיא מנוסחת בסימונים החדשים שלנו, אומרת ש-\( x_{j}\left(b\right)=x_{i}\left(a\right)+cx_{n}\left(a\right) \). אפשר לסמן זאת גם כך: \( x_{j}\left(b\right)\equiv_{x_{n}\left(a\right)}x_{i}\left(a\right) \). זה לא סוף מה שאפשר לעשות עם שקילות מודולו \( x_{n}\left(a\right) \); משוואה 5 אומרת ש-\( b=a+qx_{n}\left(a\right) \), כלומר \( b\equiv_{x_{n}\left(a\right)}a \).

עכשיו בואו נשלוף תוצאה מהפוסט הקודם: אם \( a\equiv_{c}b \) אז לכל \( n \) מתקיים ש-\( x_{n}\left(a\right)\equiv_{c}x_{n}\left(b\right) \) (זה נבע מההגדרה האינדוקטיבית של סדרות ה-\( x_{n} \)-ים). אצלנו אפשר להסיק מזה ש-\( x_{j}\left(b\right)\equiv_{x_{n}\left(a\right)}x_{j}\left(a\right) \), ולכן נקבל ש-\( x_{i}\left(a\right)\equiv_{x_{n}\left(a\right)}x_{j}\left(a\right) \). לפי התוצאה מסוף הפוסט הקודם, המסקנה היא ש-\( j\equiv_{4n}\pm i \). כעת, מכיוון ש-\( y_{i}\left(a\right) \) מחלק את \( n \), הרי ש-\( 4y_{i}\left(a\right) \) מחלק את \( 4n \) וכל דבר שמתחלק על ידו, ועל כן \( j\equiv_{4y_{i}\left(a\right)}\pm i \).

כעת בואו נשתמש שוב במשוואה 5, בחלק שלה שבו טרם השתמשנו שקובע ש-\( b=1+4py_{i}\left(a\right) \), כלומר ש-\( b\equiv_{4y_{i}\left(a\right)}1 \), כלומר ש-\( 4y_{i}\left(a\right) \) מחלק את \( b-1 \).

עכשיו בואו נשתמש בעוד תוצאה מהפוסט הקודם, לפיה \( y_{n}\left(a\right)\equiv_{a-1}n \) (גם זה נבע די מייד מנוסחאות הנסיגה). אצלנו נשתמש בזה עם \( j \) ונקבל ש-\( y_{j}\left(b\right)\equiv_{b-1}j \), כלומר \( y_{j}\left(b\right)\equiv_{4y_{i}\left(a\right)}j \). מבלבל? טיפה, כן. עכשיו כדי לבלבל עוד יותר נוסיף לתמונה את משוואה 7: \( y_{j}\left(b\right)=k+4\left(d-1\right)y_{i}\left(a\right) \) (שימו לב ש-\( d \) כאן הוא משתנה בלי אילוצים עליו פרט לכך שיהיה חיובי; אנחנו לאיכולים להניח ש-\( d=a^{2}-1 \) וגם לא ניסינו לדרוש משהו כזה). מהמשוואה הזו נקבל מייד ש-\( y_{j}\left(b\right)\equiv_{4y_{i}\left(a\right)}k \), והנה הכנסנו את \( k \) לתמונה סוף סוף. זכרו - מטרת העל שלנו היא להראות ש-\( k=i \), והתקדמנו יפה לקראת זה; בואו נערוך סיכום ביניים קצר של תוצאות שמצאנו:

\( j\equiv_{4y_{i}\left(a\right)}\pm i \)
\( y_{j}\left(b\right)\equiv_{4y_{i}\left(a\right)}j \)
\( y_{j}\left(b\right)\equiv_{4y_{i}\left(a\right)}k \)

משלושת אלו קיבלנו את השרשרת הבאה שבה כל השקילויות הן מודולו \( 4y_{i}\left(a\right) \): \( k\equiv y_{j}\left(b\right)\equiv j\equiv\pm i \). אם כן, עוד לא הוכחנו ש-\( k=i \) אבל ראינו ש-\( k\equiv_{4y_{i}\left(a\right)}\pm i \) וגם זו התחלה (וכמעט סיימנו!).

בואו נכניס לתמונה עכשיו את משוואה 8: \( y=k+e-1 \). מה היא בעצם אומרת? זו בסך הכל הדרך הדיופנטית לכתוב \( k\le y_{i}\left(a\right) \) (כי \( e \) הוא מספר חיובי כלשהו). כעת, בפוסט הקודם ראינו ש-\( i\le y_{i}\left(a\right) \). אם תחשבו על זה קצת, זה אומר ש-\( k=i \)! למה? כי \( k,i \) שניהם נמצאים בתוך טווח שבו אין שני מספרים שונים ששקולים מודולו \( 4y_{i}\left(a\right) \) - הטווח \( -2y_{i}\left(a\right)+1,\dots-1,0,1,\dots,2y_{i}\left(a\right) \) (זוכרים? דיברנו על זה קצת בפוסט הקודם). זהו, סיימנו את הכיוון הראשון! הראינו שאם נתון פתרון למשוואות הדיופנטיות עבור ערכים נתונים של \( x,k,a \) אז הוא מקיים \( x=x_{k}\left(a\right) \).

הכיוון השני הוא להראות שאם יש לנו ערכים נתונים של \( x,k,a \) שמקיימים \( x=x_{k}\left(a\right) \) ואנחנו מציבים אותם במשוואות שלעיל, אז התוצאה היא מערכת משוואות פתירה. כלומר, אנחנו צריכים לקבוע מה יהיו הערכים ששאר המשתנים מקבלים ולהוכיח שכל המשוואות מתקיימות (עכשיו המשוואות הופכות להיות האויבים שלנו - אם קודם הן סיפקו לנו מידע, עכשיו הן מספקות לנו אילוצים שאנחנו חייבים לקיים).

בואו נתחיל ממשוואה 1 - היא קלה. אם \( x=x_{k}\left(a\right) \) אז אנחנו יודעים שיש \( y=y_{k}\left(a\right) \) כך ש-\( x^{2}+\left(a-1\right)y^{2}=1 \) מהגדרת משוואת פל. אז סיפקנו כבר את משוואה 1. בואו נעבור ל-2; כל פתרון אחר של משוואת פל עבור \( a \) יספק אותה, אבל כדאי לבחור את הפתרון הזה בחוכמה כדי שגם שאר המשוואות יסופקו - נבחר \( m=2ky_{k}\left(a\right) \) (למה? כי זה עובד, כפי שנראה בהמשך) ונגדיר \( u=x_{m}\left(a\right) \) ו-\( v=y_{m}\left(a\right) \), וזה כמובן שיספק את משוואה 2.

עכשיו, בפוסט הקודם ראינו ש-\( y_{n} \) מחלק את \( y_{t} \) אם ורק אם \( n \) מחלק את \( t \), וכמו כן גם ראינו ש-\( y_{n}^{2} \) תמיד מחלק את \( y_{ny_{n}} \). מהתוצאה השניה נובע ש-\( y_{k}^{2} \) מחלק את \( y_{m/2} \), ומהראשונה נובע ש-\( y_{m/2} \) מחלק את \( y_{m} \) ולכן נקבל ש-\( y_{k}^{2} \) מחלק את \( y_{m} \), כלומר \( y^{2} \) מחלק את \( v \), כלומר יש \( r \) כך ש-\( v=ry^{2} \), והנה סיפקנו את משוואה 4. זה עדיין לא מסביר עד הסוף את האופן שבו בחרנו את \( m \) (אם כל מה שהיינו רוצים לעשות הוא להראות ש-\( y^{2} \) מחלק את \( v \) היה אפשר לבחור \( m=ky_{k} \)) אבל זה הרווח הראשון שקצרנו מההגדרה הזו.

האתגר הבא, והגדול ביותר שלנו, הוא לספק את משוואה 5 שאיכשהו קושרת את הפרמטרים של כל שלוש משוואות פל שלנו יחד. נצטרך לבחור את \( b \) בצורה חכמה מאוד, ועל פיו לבחור את מה שיפתור את משוואה 3. נתחיל דווקא מתכונה של \( u,v \): בפוסט הקודם ראינו שאם \( n \) הוא זוגי אז \( y_{n} \) הוא זוגי וכשהוא אי זוגי אז \( y_{n} \) אי זוגי. במקרה שלנו בחרנו את \( m \) בכוונה באופן שיבטיח שהוא זוגי ולכן \( v \) זוגי, אבל זה אומר שבהכרח \( u \) אי זוגי (כי \( u^{2}+\left(a^{2}-1\right)v^{2}=1 \); מה תהיה הזוגיות של אגף שמאל אם גם \( u \) וגם \( v \) זוגיים?). אנחנו גם יודעים שהמחלק המשותף הגדול ביותר של \( u,v \) הוא 1 (שוב, מהפוסט הקודם), ולכן גם המחלק המשותף הגדול ביותר של \( u \) ושל \( 4y \) הוא 1. רגע, למה? ובכן, בואו נניח ש-\( p \) הוא מספר גדול מ-1 שמחלק גם את \( u \) וגם את \( 4y \). אפשר תמיד להניח ש-\( p \) ראשוני כי אם ניקח מחלק משותף כלשהו של \( u,4y \) יהיה ראשוני שמחלק אותו; כמו כן, \( p \) חייב להיות אי זוגי כי \( u \) אי זוגי, ולכן \( p \) לא מחלק את \( 4 \), ולכן כדי לחלק את \( 4y \) הוא חייב לחלק את \( y \). אבל ראינו ש-\( y \) מחלק את \( v \) ולכן קיבלנו ש-\( p \) הוא מחלק משותף של \( u,v \) וזו סתירה לכך שהם זרים.

איך זה עוזר לנו ש-\( u,4y \) זרים? ובכן, זה מאפשר לנו לשלוף מהשרוול כלי נשק קטלני במיוחד. זכרו מהי משוואה 5 - בואו נכתוב אותה הפעם בתור זוג המשוואות שהיא:

\( b=1+4yp \)

\( b=a+uq \)

דרך אחרת, כמעט שקולה, לכתוב את מערכת המשוואות הזו היא:

\( b\equiv_{4y}1 \)

\( b\equiv_{u}a \)

וזו מערכת משוואות מודולרית שבה המודולוסים הם זרים, מה שאומר שמשפט השאריות הסיני מבטיח שתמיד קיים לה פתרון. נבחר את הערך של המשתנה \( b \) להיות הפתרון הזה. האם סיימנו? עוד לא, כי דרך הכתיבה המודולרית לא שקולה לחלוטין; היא הייתה שקולה רק אם \( p,q \) היו יכולים להיות גם שליליים. למרבה המזל, אם \( b \) הוא פתרון של מערכת המשוואות אז גם \( b+n\left(4yu\right) \) הוא כזה, לכל \( n \) טבעי, ולכן תמיד אפשר לבחור \( b \) גדול מספיק כדי ששתי המשוואות המקוריות יתקיימו. טראח! הנה סיפקנו גם את משוואה 5.

עכשיו, כשיש לנו את \( b \) ביד, אפשר להגדיר את \( s,t \) - הפתרונות למשוואה 3 - בתור \( s=x_{k}\left(b\right),t=y_{k}\left(b\right) \) (אותו \( k \) כמו זה שהיה נתון לנו מלכתחילה). בפוסט הקודם ראינו שאם \( a\equiv_{c}b \) אז \( x_{n}\left(a\right)\equiv_{c}x_{n}\left(b\right) \). במקרה שלנו, \( b\equiv_{u}a \) ולכן נקבל \( s\equiv_{u}x \), כלומר \( s=x+cu \) בדיוק כמו משוואה 6. רגע, בדיוק? לא! מי מכם האמין לי? יש פה שוב את אותה בעיה כמו קודם - אף אחד לא ערב לנו ש-\( c \) הזה הוא חיובי. כדי להיווכח בכך שהוא חיובי שימו לב לכך ש-\( b>a \) (זה נובע מהמשוואה \( b=a+uq \)). ולכן \( s=x_{k}\left(b\right)>x_{k}\left(a\right)=x \) (לא בטוחים בזה? הוכיחו לעצמכם, זה נובע מהגדרת \( x_{k} \) כסדרת נסיגה).

נותרו רק משוואות 7 ו-8. משוואה 7 מתעסקת בקשר שבין \( t=y_{k}\left(b\right) \) ו-\( y=y_{k}\left(a\right) \) ו-\( k \). ראשית כל, שימו לב לכך ש-\( t\ge k \) (בגלל שראינו בפוסט הקודם ש-\( y_{n}\ge n \) תמיד). כמו כן, בפוסט הקודם ראינו גם ש-\( y_{n}\equiv_{a-1}n \), ובמקרה שלנו זה אומר ש-\( t\equiv_{b-1}k \). ממשוואה 5 ראינו ש-\( b=1+4yp \) ולכן \( t\equiv_{4yp}k \) ומכאן שבפרט \( t\equiv_{4y}k \). כעת, מה אומרת משוואה 7? ש-\( t=k+4\left(d-1\right)y \), ולכן העובדה ש-\( t\equiv_{4y}k \) מראה את זה, כי כבר ראינו ש-\( t\ge k \).

נותרה רק משוואה 8: \( y=k+e-1 \). להראות שהיא פתירה זה מיידי: \( y=y_{k}\left(a\right)\ge k \) (מאוד שימושית, הטענה ש-\( y_{n}\left(a\right)\ge n \)) ולכן קיים \( e \) כנדרש (\( e=y-k+1 \)).

סיימנו! הוכחנו ש-\( f\left(k,a\right)=x_{k}\left(a\right) \) היא פונקציה דיופנטית! זה הישג לא מבוטל, עברנו דרך לא קצרה בדרך לחיסול הבעיה העשירית של הילברט.

לפני שאמשיך, אני רוצה לכתוב את משוואות 1-8 בצורה קצת יותר ידידותית למשתמש, עכשיו כשהבנו פחות או יותר מה הולך בהן:

\( x,y \) הם פתרונות של משוואת פל עם הפרמטר \( a \).
\( u,v \) הם פתרונות של משוואת פל עם הפרמטר \( a \).
\( s,t \) הם פתרונות של משוואת פל עם הפרמטר \( b \).
\( y^{2} \) מחלק את \( v \).
\( b\equiv_{4y}1 \) וגם \( b\equiv_{u}a \) וגם \( b>a \).
\( s\equiv_{u}x \) וגם \( s>x \).
\( t\equiv_{4y}k \) וגם \( t>k \).
\( y\ge k \).

זה כבר נראה הרבה יותר אנושי. בעצם יש לנו כאן שלושה פתרונות למשוואות פל עם שני פרמטרים וכמה קשרים בסיסיים בין הפרמטרים. כל שאר המשתנים שהיו מעורבים במשוואות היו רק משתני עזר שסייעו לנו לכתוב באופן דיופנטי תכונות כמו \( \ge \) וכמו שקילות מודולו. אני מציג את המשוואות כך כדי שיהיה קצת יותר קל להבין מאיפה הן הגיעו ומה עבר בראש של מי שהמציא אותן, למרות שאין לי מושג איך הגיעו להוכחה הזו.

עכשיו, קדימה לגביע הקדוש שלנו! נגדיר את הפונקציה \( h\left(n,k\right)=n^{k} \) ונוכיח שהיא דיופנטית. לשם כך נבנה מערכת משוואות שכוללת את 8 המשוואות שהצגתי קודם, ועוד 4 משוואות חדשות:

\( \left(x-y\left(a-n\right)-m\right)^{2}=\left(f-1\right)^{2}\left(2an-n^{2}-1\right)^{2} \)
\( m+g=2an-n^{2}-1 \)
\( w=n+h=k+l \)
\( a^{2}-\left(w^{2}-1\right)\left(w-1\right)^{2}z^{2}=1 \)

זה הכל. למה זה עובד?

ובכן, בואו נניח ראשית כל שיש לנו פתרון למערכת המשוואות ונוכיח שמתקיים \( m=n^{k} \).

ראשית, שימו לב שמשוואה מס’ 3 (החדשה; אם אתייחס למשוואות הישנות במספר שלהן אומר זאת במפורש מעתה) גוררת ש-\( w>1 \) (כי הוא סכום של שני מספרים חיוביים), ולכן \( \left(w^{2}-1\right)\left(w-1\right)^{2}z^{2}>0 \) ומכאן על פי משוואה 4 ש-\( a>1 \). אם \( a>1 \) אז כל המשוואות הישנות (1 עד 8) מראות ש-\( x=x_{k}\left(a\right) \) ו-\( y=y_{k}\left(a\right) \) - זה מה שעשינו קודם.

עכשיו, כולנו כבר הדחקנו את זה, אבל בפוסט הקודם ראינו ש-\( x_{k}\left(a\right)-y_{k}\left(a\right)\left(a-n\right)\equiv_{2an-n^{2}-1}n^{k} \) (בחיי! אני לא ממציא את זה!). סוף סוף זה יועיל לנו קצת. כפי שאתם רואים, משוואה 1 מהונדסת פחות או יותר כדי להתאים לביטוי הזה; אם ניקח אותה מודולו \( \left(2an-n^{2}-1\right)^2 \), נקבל:

\( \left(x-y\left(a-n\right)-m\right)^{2}\equiv_{\left(2an-n^{2}-1\right)^2}0 \)

ובגלל שבאופן כללי אם \( A^2|B^2 \) אז \( A|B \) נקבל:

\( x-y\left(a-n\right)-m\equiv_{2an-n^{2}-1}0 \)

או במילים אחרות:

\( m\equiv_{2an-n^{2}-1}x-y\left(a-n\right)\equiv n^{k} \) (המעבר האחרון נובע מהמשפט בפוסט הקודם).

יפה, אז אנחנו קרובים באופן מפתיע ליעד שלנו. רק צריך להשתכנע ש-\( m \) ו-\( n^{k} \) הם קטנים יותר מ-\( 2an-n^{2}-1 \) ואז נסיים כמו קודם.

בואו תסתכלו רגע על משוואה 4. נראה לכם מוכר? זה לא במקרה, גם זו משוואת פל! הפעם \( w \) הוא על תקן \( a \), ולכן יש \( j \) כלשהו כך ש-\( a=x_{j}\left(w\right) \) ו-\( \left(w-1\right)z=y_{j}\left(w\right) \). עכשיו, משפט מהפוסט הקודם שכבר השתמשנו בו כאן הוא ש-\( y_{j}\equiv_{w-1}j \), אבל מכיוון ש-\( y_{j} \) מתחלק על ידי \( w-1 \) נובע מכך ש-\( j\equiv_{w-1}0 \), ולכן בהכרח \( j\ge w-1 \). עכשיו, אנחנו יודעים ש-\( x_{j}\left(w\right)\ge w^{j} \) (שוב, פוסט קודם) ולכן \( a\ge w^{w-1}>n^{k} \), כשהמעבר האחרון נובע מכך שמשוואה 2 מראה ש-\( w>a,k \). זה טוב מאוד - זה מראה ש-\( a \) ענקי, כמו שאנחנו צריכים, אבל עוד לא סיימנו.

בואו נציץ במשוואה 2. מה שהיא בעצם אומרת הוא ש-\( m<2an-n^{2}-1 \) - כלומר, נותן לנו את הקוטן של \( m \) שרצינו באופן מפורש. אז אם נראה ש-\( n^{k}<2an-n^{2}-1 \), נסיים את הכיוון הזה של ההוכחה. הדרך לעשות את זה היא להכניס טיפה אנליזה לתמונה. בואו נגדיר פונקציה \( f\left(n\right)=2an-n^{2}-1 \). אז \( f\left(1\right)=2a-2\ge a \) (אי השוויון האחרון נובע מכך ש-\( a>1 \)). כעת, נגזור את \( f \) ונקבל \( f^{\prime}\left(n\right)=2a-2n \) וזה גדול מ-0 לכל התחום \( 1\le n<a \), כלומר \( f \) היא פונקציה עולה בתחום הזה ולכן \( f\left(n\right)\ge a \) לכל \( 1\le n<a \). כעת, אם \( a>n^{k} \) אז בפרט נקבל \( f\left(n\right)=2an-n^{2}-1\ge a>n^{k} \) (אין ל-\( n \) ברירה, הוא חייב להיות קטן מ-\( a \) אחרת \( n^{k} \) לא היה קטן מ-\( a \)). זה מסיים את הכיוון הראשון של ההוכחה!

נותר רק הכיוון השני - להראות שאם \( m=n^{k} \), אז יש למערכת המשוואות שלנו פתרון. בואו נתחיל ממשוואה 3. היא בסך הכל אומרת ש-\( w>n,k \), אז בואו נבחר את \( w \) להיות מספר כלשהו שמקיים את זה. עכשיו, נגדיר \( a=x_{w-1}\left(w\right) \). מה עם \( y_{w-1}\left(w\right) \)? מטענה מהפוסט הקודם שכבר עשינו בה שימוש פה, \( y_{w-1}\left(w\right)\equiv_{w-1}w-1\equiv0 \). במילים אחרות, \( w-1 \) מחלק את \( y_{w-1}\left(w\right) \) ולכן \( y_{w-1}\left(w\right)=z\left(w-1\right) \), והנה פתרנו את משוואה 4.

כעת, אם \( w>n \) ו-\( w>k \) אז \( a=x_{w-1}\left(w\right)\ge w^{w-1}>n^{k} \) ולכן נקבל (בדיוק כמו קודם) ש-\( m=n^{k}<2an-n^{2}-1 \), מה שנותן לנו פתרון למשוואה 2. נותרה רק משוואה 1!

ובכן, הבה ונגדיר \( x=x_{k}\left(a\right),y=y_{k}\left(a\right) \). אנחנו יודעים ש-\( x_{k}\left(a\right)-y_{k}\left(a\right)\left(a-n\right)\equiv_{2an-n^{2}-1}n^{k} \), ובמילים אחרות: \( 2an-n^{2}-1 \) מחלק את \( x-y\left(a-n\right)-m \), כלומר יש \( f \) כך ש-\( x-y\left(a-n\right)-m=\left(f-1\right)\left({2an-n^{2}-1}\right) \). רק שיש לנו בעיה קטנה - לא ברור אם \( f \) הזה חיובי או שלילי בכלל. הפתרון הוא להעלות את שני אגפי המשוואה בריבוע, ואז לקבל \( \left(x-y\left(a-n\right)-m\right)^{2}=\left(f-1\right)^{2}\left({2an-n^{2}-1}\right)^{2} \) וכעת אם \( f \) היה שלילי אפשר להחליף אותו ב-\( \left|f\right| \) מבלי לשים לב להבדל. זה מסיים עם משוואה 1, ומכיוון שכל המשוואות הישנות מסופקות על ידי הפתרון למשוואת פל \( x_{k}\left(a\right) \), סיימנו את ההוכחה!

זה עדיין לא מוכיח שהבעיה העשירית של הילברט היא לא כריעה, אבל זה מוכיח שהפונקציה האקספוננציאלית היא דיופנטית - וזה המכשול שעמד בפני המתמטיקאים שעבדו על הבעיה במשך עשרות שנים. מכאן ואילך העניינים יפסיקו להיראות כמו “חשבון מכולת” ונחזור לדבר על התמונה הגדולה ולהבין איך פונקציה אקספוננציאלית עוזרת לנו.

קצת קרדיט לסיום על כל ההוכחה הזו. אני עובד, כאמור, על בסיס מאמר של מרטין דיוויס שקישרתי אליו בתחילת סדרת הפוסטים הזו. הוא מייחס את ההוכחה שהצגתי כאן (שמבחינה היסטורית אינה ההוכחה הראשונה מסוגה) לג’וליה רובינסון (אחת מהחוקרות המרכזיות של הבעיה העשירית) תוך שימוש בכמה מהרעיונות של יורי מאטיסייביץ’ (מי שהוכיח לראשונה שיש פונקציה דיופנטית שגדלה אקספוננציאלית, ובכך סיים את ההוכחה של אי הכריעות של הבעיה העשירית). זו ההוכחה הפשוטה ביותר שהצלחתי למצוא; יש למאטיסייביץ’ עצמו ספר על הבעיה, אבל את המאמר של דיוויס תמיד חיבבתי יותר.

נהניתם? התעניינתם? אם תרצו, אתם מוזמנים לתת טיפ: