שברים משולבים, ולמה הם מגניבים
אוהבים לטעון שהמתמטיקה היא כל כולה ערב רב של נוסחאות מפחידות בעלות משמעות לא ברורה. אני חושב שזה מאוד לא מדויק, אבל מדי פעם אכן מתפלקת לה איזו נוסחה שנראית מפחיד גם למי שכבר יש לו נסיון בסיסי כלשהו במתמטיקה. מה שהפחיד אותי בשעתו היו השברים המשולבים - שברים מהצורה החביבה \( \frac{1}{1+\frac{1}{3+\frac{1}{1+\frac{1}{4}}}} \). כשרואים דבר כזה, התגובה המיידית של אדם שפוי צריכה להיות “מה, לעזאזל…”. בפוסט הזה אני רוצה להסביר מה, לעזאזל. מכיוון שאני חושב שבנושא הזה הדרך הטובה ביותר לדעת מה לעזאזל היא ללכלך את הידיים, חלקו השני של הפוסט יהיה יותר “חישובי” מהרגיל - אך חישובים שלדעתי הם יפים ומעניינים (ובלי לעשות אותם “בידיים”קצת קשה לראות את זה, לדעתי).
בראש ובראשונה, הדבר הזה הוא בסך הכל שבר רגיל. תלמיד כיתה ה’ אמור כבר להיות מסוגל להבין מהו ולחשב את ערכו. במקרה של השבר שלעיל, למשל, פשוט צריך לעשות סדרה של חיבורים. \( 1+\frac{1}{4}=\frac{5}{4} \) ו-\( \frac{1}{\frac{5}{4}}=\frac{4}{5} \) כך שהשבר שווה ל-\( \frac{1}{1+\frac{1}{3+\frac{4}{5}}} \); וכעת \( 3+\frac{4}{5}=\frac{19}{5} \) כך שנקבל שהשבר שווה ל-\( \frac{1}{1+\frac{5}{19}} \); ולסיום נקבל שהוא שווה ל-\( \frac{19}{24} \). מה שלא ברור הוא למה לבחור בדרך ייצוג כה מסורבלת ל-\( \frac{19}{24} \), והתשובה הבסיסית היא - כי זו דרך הייצוג הטבעית והנכונה ביותר למספרים. לא מאמינים? חכו חכו.
ראשית בואו נוותר על הייצוג המסורבל והמזוויע טיפוגרפית. שבר משולב כללי הוא מהצורה \( a_{0}+\frac{1}{a_{1}+\frac{1}{a_{2}+\dots}} \) (כמובן שאפשר להגדיר שברים משולבים בצורה כללית יותר כך שבמונים יהיו מספרים השונים מ-1, אך זה מסבך את האנליזה ואינו הכרחי כאן ולכן אשתמש בהגדרה המצומצמת) ואת אותו דבר אפשר לתאר בצורה ברורה בעזרת הסימון \( a_{0}+\frac{1}{a_{1}+}\dots\frac{1}{a_{n}} \). למשל, השבר המשולב שלעיל מיוצג בידי \( \frac{1}{1+}\frac{1}{3+}\frac{1}{1+}\frac{1}{4} \).
השאלה הראשונה שאני רוצה לעסוק בה היא זו - נניח שיש לנו מספר רציונלי, \( \frac{a}{b} \); איך מציגים אותו כשבר משולב? למשל, \( \frac{19}{24} \). מה עושים כדי לתת לו את הצורה ה”קנונית”? כדי לסבך עוד קצת את העניינים אעדיף לדבר על שבר שגדול מ-1, נניח \( \frac{67}{24} \). את הייצור הזה אפשר לייצג כ-\( 2+\frac{19}{24} \), כך ש-\( a_{0}=2 \) במקרה שלנו. מה עכשיו? אנחנו רוצים להחליף את ה-\( \frac{19}{24} \) בגורם מהצורה אחד חלקי משהו, אז ראשית כל נכתוב \( \frac{19}{24}=\frac{1}{\frac{24}{19}} \), וכעת במכנה יש לנו שוב שבר מדומה ואפשר לפרק אותו לחלק ממשי וחלק שברי: \( \frac{1}{1+\frac{5}{19}} \) (כלומר \( a_{1}=1 \)). נחזור על התעלול שוב עבור \( \frac{5}{19} \) ונקבל \( a_{2}=3 \) ו”שארית”של \( \frac{4}{5} \); וכשנטפל ב-\( \frac{5}{4} \) נקבל \( 1+\frac{1}{4} \) והמשחק יסתיים. זה תהליך שיטתי ופשוט למדי, וייתכן שלחדי העין שבכם הוא הזכיר תהליך אחר במתמטיקה, שידוע עוד מימי היוונים הקדמונים - האלגוריתם האוקלידי.
בהינתן שני מספרים טבעיים \( a,b \), האלגוריתם האוקלידי מוצא את המחלק המשותף המקסימלי שלהם: מספר טבעי \( d \) שמחלק הן את \( a \) והן את \( b \) והוא הגדול ביותר בעל תכונה זו. עבור \( 67 \) ו-\( 24 \) המחלק המקסימלי הזה הוא המספר הלא מרשים \( 1 \) (במקרה כזה אומרים ש-67 ו-24 הם “זרים”), אבל מן הסתם יש דוגמאות מעניינות יותר - למשל המחלק המשותף המקסימלי של \( 78 \) ו-\( 42 \) הוא \( 6 \).
כדי למצוא מחלק מקסימלי אפשר לעשות דברים מטופשים כמו לעבור על כל המספרים הקטנים מ-\( a \) ו-\( b \) ולבדוק אם הם מחלקים אותם וכדומה, אבל מבחינה חישובית זו שיטה איטית ומייגעת. האלגוריתם האוקלידי, לעומת זאת, פועל מהר מאוד (פורמלית - זמן לוגריתמי בגודל המספרים המעורבים). למעשה, היעילות של האלגוריתם האוקלידי היא הבסיס לתורת המספרים האלגוריתמית; רבים מהחישובים שמתבצעים בתורה זו מסתמכים ברמה זו או אחרת על האלגוריתם האוקלידי (בפרט על גרסה מורחבת שלו, שמאפשרת למצוא \( x,y \) שלמים (לא בהכרח חיוביים) כך ש-\( ax+by=d \), כש-\( d \) הוא המחלק המשותף המקסימלי) ואלמלא הוא היה יעיל, מספר הדברים שניתן לבצע ביעילות היה קטן משמעותית (בפרט, שימוש קריטי שלו הוא למציאת הופכי מודולו \( n \) של מספרים, מה שהוא הבסיס למימוש פעולות חשבון ב-\( \mathbb{Z}_{n}^{*} \) - אחרת, אין אפשרות לבצע חלוקה).
הרעיון שמאחורי האלגוריתם האוקלידי פשוט מאוד: בהינתן \( a,b \) (נניח ש-\( a \) גדול יותר מ-\( b \)) אפשר לחלק את \( a \) ב-\( b \) ולקבל שארית \( r \) (במילים אחרות, למצוא \( q,r \) כך ש-\( a=qb+r \) ו-\( 0<r<b \)). האבחנה המרכזית היא שהמחלק המשותף המקסימלי של \( a,b \) הוא גם המחלק המשותף המקסימלי של \( b,r \) (למה?) ולכן אפשר להפעיל את האלגוריתם באופן רקורסיבי על \( b,r \), כשתנאי העצירה שלנו הוא שאם \( b \) מחלק את \( a \) ללא שארית, אז המחלק המשותף המקסימלי שלהם הוא \( b \) עצמו.
בואו ונראה איך זה עובד עבור \( 67 \) ו-\( 24 \):
\( 67=2\times24+19 \)
\( 24=1\times19+5 \)
\( 19=3\times5+4 \)
\( 5=1\times4+1 \)
\( 4=4\times1+0 \)
ובשלב האחרון סיימנו: קיבלנו \( a=4,b=1 \) וראינו ש-\( b \) מחלק את \( a \) ללא שארית. אלא שמה שמעניין כאן הוא דווקא אותם ערכי \( q \) שהצטברו במהלך הדרך (המספרים שמשמאל לסימן ה-\( \times \) בכל שורה) - הסתכלו עליהם - האם הם נראים מוכרים?
הבה ונציג את החלוקות שמבצע האלגוריתם האוקלידי בדרך אחרת. במקום לדבר על חלוקה עם שארית, נעבוד ישירות עם שברים:
\( \frac{67}{24}=2+\frac{19}{24} \)
\( \frac{24}{19}=1+\frac{5}{19} \)
\( \frac{19}{5}=3+\frac{4}{5} \)
\( \frac{5}{4}=1+\frac{1}{4} \)
\( \frac{4}{1}=4+0 \)
וזה כבר מאוד מזכיר את התהליך שתיארתי למעלה, של בניית השבר המשולב עבור \( \frac{19}{24} \). המסקנה היא ש-\( \frac{67}{24} \) מתואר בידי השבר המשולב \( 2+\frac{1}{1+}\frac{1}{3+}\frac{1}{1+}\frac{1}{4} \), ושבאופן כללי אפשר למצוא את השבר המשולב עבור \( \frac{a}{b} \) ביעילות באמצעות האלגוריתם האוקלידי - ובגלל שהעצירה של האלגוריתם האוקלידי מובטחת, גם העצירה של בניית השבר המשולב מובטחת. מה שעוד לא ברור כאן הוא שאם מספר מיוצג בידי שבר משולב, הייצוג הזה הוא יחיד, ולא ייתכן ששני שברים משולבים ייצגו את אותו המספר; גם את זה לא מסובך להוכיח אך ההוכחה טכנית ואפסח עליה.
עד כה לא ממש ברור ממה ההתלהבות הגדולה. אז כן, מצאנו דרך חדשה ומופרעת להציג שברים, אך במה היא טובה יותר מלכתוב סתם \( \frac{a}{b} \)? החלק המעניין מתחיל כשאנו רוצים לייצג באמצעות שברים משולבים מספרים שלא ניתן לייצג באמצעות שברים רגילים, כלומר מספרים אי רציונליים. לצורך כך יהיה הכרחי להרחיב קצת את ההגדרה של שברים משולבים, שכן לא קשה לראות שכרגע כל שבר משולב שאנו מדברים עליו הוא מספר רציונלי (פשוט “פותחים”אותו באופן שעליו כבר דיברתי קודם).
אם כן, מה שנעשה הוא להרשות לתהליך של יצירת השבר להימשך עד אינסוף. במקום שנייצג שבר משולב עם סדרה סופית \( a_{0}+\frac{1}{a_{1}+}\dots\frac{1}{a_{n}} \), פשוט נרשה לסדרה להיות אינסופית: \( a_{0}+\frac{1}{a_{1}+}\dots \). למי שמטרידה אותו השאלה איך אפשר לתת משמעות פורמלית לכזה דבר, התשובה פשוטה: \( a_{0}+\frac{1}{a_{1}+}\dots=\lim_{n\to\infty}a_{0}+\frac{1}{a_{1}+}\dots\frac{1}{a_{n}} \). במילים אחרות, אם יש לנו סדרה אינסופית \( a_{0},a_{1},\dots \) אנחנו יכולים לקבל ממנה סדרה אינסופית של מספרים רציונליים שמתקבלים מכך ש”קוטמים”את השבר המשולב בכל פעם בשלב מתקדם יותר. כמובן שלא ברור מיידית שהסדרה הזו אכן שואפת למספר ספציפי יחיד; כדי להבין יותר טוב מה הולך כאן, נרצה קודם כל להבין את סדרת הקירובים שמגדיר שבר משולב. ההמשך יהיה יחסית טכני (אם כי לטעמי מעניין מאוד), ואת השורה התחתונה כבר אכתוב בפוסט הבא, לטובת אלו שלא יצליחו לעקוב.
באופן כללי, אם \( a_{0}+\frac{1}{a_{1}+}\frac{1}{a_{2}+}\dots \) הוא שבר משולב (סופי או אינסופי) אפשר להגדיר סדרה \( \frac{A_{0}}{B_{0}},\frac{A_{1}}{B_{1}},\frac{A_{2}}{B_{2}},\dots \) של הקירובים המתקבלים משלבי הביניים: \( \frac{A_{0}}{B_{0}}=a_{0} \), ו-\( \frac{A_{1}}{B_{1}}=a_{0}+\frac{1}{a_{1}} \) וכן הלאה. השאלה המעניינת ביותר כאן לטעמי היא “האם אפשר לכתוב את \( A_{n},B_{n} \) בצורה פשוטה כפונקציות של \( a_{0},\dots,a_{n} \)?” והתשובה המפתיעה היא שלא רק שאפשר לעשות את זה, אלא גם ש-\( A_{n} \) ו-\( B_{n} \) מאוד, מאוד דומים.
בואו נראה לאט לאט כיצד נבנה שבר משולב. בשלב הראשון יש לנו \( \frac{a_{0}}{1} \) ותו לא. בשלב השני יש לנו את \( a_{0}+\frac{1}{a_{1}} \); כדי לראות למה זה שווה אנחנו מבצעים מכנה משותף ומקבלים \( \frac{a_{0}a_{1}+1}{a_{1}} \). בשלב השלישי יש לנו \( a_{0}+\frac{1}{a_{1}+\frac{1}{a_{2}}} \) וכאן המכנה המשותף נוצר בשני שלבים: ראשית כל מתקבל \( a_{0}+\frac{1}{\frac{a_{1}a_{2}+1}{a_{2}}} \), ולאחר מכן המכנה “מתהפך”, מקבלים \( a_{0}+\frac{a_{2}}{a_{1}a_{2}+1} \), ולבסוף מתקבל \( \frac{a_{0}a_{1}a_{2}+a_{0}+a_{2}}{a_{1}a_{2}+1} \).
חדי העין בוודאי שמו לב לדמיון שבין המונה של \( a_{0}+\frac{1}{a_{1}} \) ובין המכנה של \( a_{0}+\frac{1}{a_{1}+}\frac{1}{a_{2}} \): הראשון הוא \( a_{0}a_{1}+1 \), השני הוא \( a_{1}a_{2}+1 \). זהו כמובן אינו מקרה: הרי המכנה של \( a_{0}+\frac{1}{a_{1}+}\frac{1}{a_{2}} \) התקבל מהמונה של \( a_{1}+\frac{1}{a_{2}} \). זכרו - כדי לחשב את \( a_{0}+\frac{1}{a_{1}+}\frac{1}{a_{2}} \) אמרנו “בואו קודם כל נשכח מה-\( a_{0} \) ונסתכל על המכנה \( a_{1}+\frac{1}{a_{2}} \)”, אבל מכנה זה הוא בעצמו שבר משולב “רגיל”. אחרי שגמרנו לחשב אותו ולהביא אותו לצורה \( \frac{x}{y} \) ביצענו בו “היפוך” שבו הוחלפו המונה והמכנה.
ההבנה הזו, שהמכנה של שבר משולב הוא בעצם המונה של שבר משולב קצת יותר פשוט, מאפשרת לנו לתאר בצורה קצת יותר נחמדה את המונה והמכנה. נשתמש בסימון \( \left[a_{0},a_{1},\dots,a_{n}\right] \) כדי לתאר את המונה של השבר המשולב, ועכשיו יש לנו תיאור יפה לקירובים: \( \frac{A_{n}}{B_{n}}=\frac{\left[a_{0},\dots,a_{n}\right]}{\left[a_{1},\dots,a_{n}\right]} \). זה עדיין לא עוזר לנו להבין איך בדיוק נראית המפלצת שמיוצגת על ידי \( \left[a_{0},\dots,a_{n}\right] \), אבל זו התחלה טובה.
כעת בואו ונתבונן שניה בשבר המשולב \( a_{0}+\frac{1}{a_{1}+}\frac{1}{a_{2}+}\dots\frac{1}{a_{n}} \). מצד אחד, אפשר לכתוב אותו כ-\( \frac{\left[a_{0},\dots,a_{n}\right]}{\left[a_{1},\dots,a_{n}\right]} \) כפי שכבר אמרתי. מצד שני, אפשר לכתוב אותו כ-\( a_{0}+\frac{\left[a_{2},\dots,a_{n}\right]}{\left[a_{1},\dots,a_{n}\right]} \), שכן אפשר “לחשב עד הסוף” את \( a_{1}+\frac{1}{a_{2}+}\dots\frac{1}{a_{n}} \) ולבסוף לבצע היפוך שלו. מכאן מתקבלת בקלות הנוסחה הבאה: \( \left[a_{0},\dots,a_{n}\right]=a_{0}\left[a_{1},\dots,a_{n}\right]+\left[a_{2},\dots,a_{n}\right] \). זו כבר ההתחלה של הגיון בשגעון - ראשית, כעת יש לנו דרך רקורסיבית פשוטה לחשב את \( \left[a_{0},\dots,a_{n}\right] \); אבל שנית, כעת נוכל להוכיח באינדוקציה תיאור כללי ולא רקורסיבי של המבנה של \( \left[a_{0},\dots,a_{n}\right] \) שהתגלה, כמו מיליארד דברים אחרים, בידי אוילר.
הכלל נשמע טיפה מוזר ומפחיד בשמיעה ראשונה, אבל עברנו את פרעה ואת “איך בוטלה המתמטיקה“ונעבור גם את זה: \( \left[a_{0},\dots,a_{n}\right] \) הוא סכום של מכפלות שמתקבלות באופן הבא: ראשית, המכפלה \( a_{1}a_{2}\cdots a_{n} \). שנית, המכפלה \( a_{1}a_{2}\cdots a_{n} \) כשהוסר ממנה זוג איברים סמוכים (נניח, \( a_{3}a_{4} \) הוסר ממנה) - כל המכפלות האפשריות שיכולות להתקבל מהסרת זוג כזה משתתפות בסכום. שלישית, כל המכפלות שמתקבלות מהסרת שני זוגות זרים (כלומר, למשל, \( a_{2}a_{3} \) ו-\( a_{7}a_{8} \)) וכן הלאה. אם כל האיברים הוסרו ממכפלה היא הופכת להיות “המכפלה הריקה” - 1 (שכן 1 הוא האיבר הנייטרלי לכפל, ולכן הוא מתאים רעיונית לייצוג מכפלה ריקה כשם ש-0 מתאים רעיונית לייצוג סכום ריק).
דוגמאות פשוטות עוזרות כמובן להבין. \( \left[a_{0}\right]=a_{0} \) שכן יש לנו את המכפלה של “כל” האיברים, וזהו (אין זוגות סמוכים שאפשר להוריד). \( \left[a_{0}a_{1}\right]=a_{0}a_{1}+1 \) שכן יש לנו את המכפלה של כל האיברים \( a_{0}a_{1} \) ואת המכפלה הריקה \( 1 \). \( \left[a_{0},a_{1},a_{2}\right]=a_{0}a_{1}a_{2}+a_{0}+a_{2} \), כש-\( a_{1} \) לא מופיע בסכום לבדו שכן אין זוג סמוך שניתן להוריד ויותיר רק אותו. לבסוף, הנה דוגמה יותר מורכבת:
\( \left[a_{0},a_{1},a_{2},a_{3},a_{4}\right]=a_{0}a_{1}a_{2}a_{3}a_{4}+ \)
\( a_{0}a_{1}a_{2}+a_{0}a_{1}a_{4}+a_{1}a_{2}a_{3}+a_{2}a_{3}a_{4}+ \)
\( a_{0}+a_{2}+a_{4} \)
כש-\( a_{2} \) התקבל מכך שהסרנו את הזוגות \( a_{0}a_{1} \) ו-\( a_{3}a_{4} \).
מבלבל? כן, אבל לא קשה כל כך להוכחה באינדוקציה בעזרת הנוסחה \( \left[a_{0},\dots,a_{n}\right]=a_{0}\left[a_{1},\dots,a_{n}\right]+\left[a_{2},\dots,a_{n}\right] \). את הבסיס (עבור \( \left[a_{0}\right] \) ו-\( \left[a_{0}a_{1}\right] \)) אפשר לראות ישירות; באופן כללי, הבה ונראה מה קורה עם \( \left[a_{0},\dots,a_{n}\right] \). ראשית, הגורם \( \left[a_{2},\dots,a_{n}\right] \) תופס את כל המחוברים שהתקבלו על ידי הסרת הזוג \( a_{0}a_{1} \) ואולי עוד דברים, כך שהגורם הזה בסדר; ואילו \( a_{0}\left[a_{1},\dots,a_{n}\right] \) תופס את כל הגורמים שהתקבלו ללא הסרת \( a_{0} \) מההתחלה, ומכיוון שאם מסירים את \( a_{0} \) זה חייב להיות במסגרת הזוג \( a_{0}a_{1} \) תפסנו את כל המקרים.
יופי, אז יש לנו תיאור די מפורש של \( \left[a_{0},\dots,a_{n}\right] \); מה עכשיו? ראשית, עכשיו ברור ש-\( \left[a_{0},\dots,a_{n}\right] \) הוא ביטוי סימטרי, במובן זה שהוא זהה ל-\( \left[a_{n},\dots,a_{0}\right] \), ולכן את נוסחת הנסיגה \( \left[a_{0},\dots,a_{n}\right]=a_{0}\left[a_{1},\dots,a_{n}\right]+\left[a_{2},\dots,a_{n}\right] \) אפשר לכתוב גם מהסוף להתחלה, בתור \( \left[a_{n},\dots,a_{0}\right]=a_{n}\left[a_{n-1},\dots,a_{0}\right]+\left[a_{n-2},\dots,a_{0}\right] \). עכשיו, מכיוון ש-\( A_{n}=\left[a_{0},\dots,a_{n}\right] \) ו-\( B_{n}=\left[a_{1},\dots,a_{n}\right] \), קיבלנו את נוסחת הנסיגה \( A_{n}=a_{n}A_{n-1}+A_{n-2} \) ו-\( B_{n}=a_{n}B_{n-1}+B_{n-2} \). אותה נוסחת נסיגה מתארת הן את המונה והן את המכנה וזה כמובן לא מפתיע בהתחשב בכך שכבר אמרתי שהם בעצם אותו הדבר.
מנוסחאות הנסיגה הללו אפשר לגזור נוסחה שקושרת את \( A_{n},B_{n} \) והיא לב-לבו של העסק. הבה ונסמן ב-\( \Delta_{n} \) את הביטוי הבא: \( \Delta_{n}=A_{n}B_{n-1}-A_{n-1}B_{n} \). למה הוא שווה? מסתבר שניתן לחשב אותו במדוייק וערכו מאוד פשוט. כדי לראות זאת, נשתמש בנוסחת הנסיגה ונקבל את הפיתוח הבא:
\( \Delta_{n}=A_{n}B_{n-1}-A_{n-1}B_{n}=\left(a_{n}A_{n-1}+A_{n-2}\right)B_{n-1}-A_{n-1}\left(a_{n}B_{n-1}+B_{n-2}\right)= \)
\( B_{n-1}A_{n-2}-A_{n-1}B_{n-2}=-\Delta_{n-1} \)
ולא קשה לראות כי \( \Delta_{1}=A_{1}B_{0}-A_{0}B_{1}=1 \), כך שקיבלנו בסך הכל ש-\( \Delta_{n}=\left(-1\right)^{n-1} \). הבה ונכתוב את הנוסחה במפורש:
\( A_{n}B_{n-1}-A_{n-1}B_{n}=\left(-1\right)^{n-1} \)
זו לדעתי דוגמה לנוסחה “יפה”, ובכלל - כל החיפוש אחר התכונות של \( A_{n},B_{n} \) מהווה לטעמי דוגמה למתמטיקה שהיא מצד אחד טכנית וחשבונית מאוד, ומצד שני היא יפה ואף יצירתית.
טוב, חדל התלהבות, נשאלת השאלה מה יצא לנו מכל זה. התשובה היא שיצא לנו המון - עכשיו אנחנו יודעים לתאר היטב את ההתנהגות של הסדרה \( \frac{A_{0}}{B_{0}},\frac{A_{1}}{B_{1}},\dots \). בפרט, אנחנו יודעים לתאר בקלות את ההפרש בין שני גורמים סמוכים. נסו לחשוב שנייה מדוע, ואז הציצו בשורה הבאה:
\( \frac{A_{n}}{B_{n}}-\frac{A_{n-1}}{B_{n-1}}=\frac{A_{n}B_{n-1}-A_{n-1}B_{n}}{B_{n}B_{n-1}}=\frac{\left(-1\right)^{n-1}}{B_{n}B_{n-1}} \).
מכיוון ש-\( B \)-ים חיוביים תמיד, נובע שאם \( n \) אי זוגי, אז \( \frac{A_{n}}{B_{n}} \) גדול מ-\( \frac{A_{n-1}}{B_{n-1}} \) (הפרשם חיובי) ואחרת הוא קטן ממנו. מכאן שסדרת הקירובים “מזפזפת” מעלה ומטה. אבל האם היא נרגעת? ובכן, בואו ננסה לראות מה קורה כשמשווים איבר לא לקודמו, אלא לזה שלפניו, כלומר מנסים לחשב את \( \frac{A_{n}}{B_{n}}-\frac{A_{n-2}}{B_{n-2}} \). הדרך הפשוטה ביותר לעשות זאת היא באמצעות תעלול נפוץ מאוד בחשבון: להוסיף ולהחסיר את אותו איבר. נקבל:
\( \frac{A_{n}}{B_{n}}-\frac{A_{n-2}}{B_{n-2}}=\left(\frac{A_{n}}{B_{n}}-\frac{A_{n-1}}{B_{n-1}}\right)+\left(\frac{A_{n-1}}{B_{n-1}}-\frac{A_{n-2}}{B_{n-2}}\right)=\frac{\left(-1\right)^{n-1`}}{B_{n}B_{n-1}}+\frac{\left(-1\right)^{n-2}}{B_{n-1}B_{n-2}}=\frac{\left(-1\right)^{n-1}}{B_{n-1}}\left[\frac{1}{B_{n}}-\frac{1}{B_{n-2}}\right] \)
האיבר בסוגריים המרובעים הוא ללא ספק שלילי, כי הוא מכיל משהו חיובי במכנה ו-\( B_{n-2}-B_{n} \) במונה, אבל ב-\( B_{n} \) גדול מ-\( B_{n-2} \) כי הוא מכיל את \( B_{n-2} \) כחלק מהסכום שלו (מדוע?). מסקנה: עבור ערכים זוגיים של \( n \), אנחנו מקבלים שההפרש כולו חיובי, ולכן הסדרה של ה-\( \frac{A_{n}}{B_{n}} \)-ים הזוגיים היא עולה, ואילו סדרת ה-\( \frac{A_{n}}{B_{n}} \)-ים האי זוגיים היא יורדת; וסדרת האיברים הזוגיים חסומה מלמעלה על ידי סדרת האיברים האי זוגיים (ובאופן סימטרי, סדרת האיברים האי זוגיים חסומה מלמטה על ידי סדרת האיברים הזוגיים). כאן נכנס לתמונה משפט בסיסי מחשבון אינפיניטסימלי: אם יש לנו שתי סדרות מספרים, האחת עולה והשנייה יורדת, כך שהמרחק ביניהן שואף לאפס - הן מתכנסות, ולאותו הגבול (במקרה שלנו המרחק הוא \( \frac{\left(-1\right)^{n-1}}{B_{n}B_{n-1}} \) והוא בוודאי שואף לאפס כי ה-\( B_{n} \)-ים שואפים לאינסוף).
הגענו לשורה התחתונה: אם ניקח סדרה כלשהי של מספרים טבעיים ונתבונן בשבר המשולב שהיא מגדירה, \( a_{0}+\frac{1}{a_{1}+}\frac{1}{a_{2}+}\dots \), נקבל תמיד שהשבר הזה מתכנס למספר ממשי כלשהו. השאלה שנותרה היא האם עבור כל מספר ממשי קיים שבר משולב שמתכנס אליו, ואני מניח שאתם מנחשים שהתשובה חיובית. מספיק לדבר על מספרים ממשיים חיוביים, כי עבור מספרים שליליים השינוי היחיד שיידרש הוא שהאיבר \( a_{0} \) יהיה שלילי.
ניקח אם כן מספר ממשי \( \alpha \) שהוא אי רציונלי (ברציונליים כבר טיפלנו). אפשר לפרק אותו לשני חלקים - החלק השלם \( a_{0} \), שהוא המספר הטבעי הגדול ביותר שעודנו קטן מ-\( \alpha \); והחלק השברי, שהוא מספר ממשי חיובי קטן מ-1. מכיוון שהוא קטן מ-1, ניתן לכתוב אותו בתור \( \frac{1}{\alpha_{1}} \). אם כן: \( \alpha=a_{0}+\frac{1}{\alpha_{1}} \). אני מניח שאתם מבינים מה יבוא כעת: אם \( \alpha_{1} \) אי רציונלי (אחרת \( \alpha \) היה רציונלי - מדוע?) ולכן נחזור על התעלול גם עבורו ונקבל \( \alpha=a_{0}+\frac{1}{a_{1}+\frac{1}{\alpha_{2}}} \) וכן הלאה וכן הלאה. כל שנשאר להבין הוא האם התוצאה אכן מתכנסת אל \( \alpha \) - ואם כן, כמה מהר?
לשם כך נשים לב לרגע לעובדה שלא באמת השתמשנו במה שעוללנו ל-\( A_{n},B_{n} \) בכך שה-\( a_{n} \)-ים כולם שלמים. זה מאפשר לנו לכתוב את \( \alpha \) בתור “שבר משולב” סופי אם נרשה לאיבר האחרון להיות לא שלם, דהיינו \( \alpha=\frac{\left[a_{0},a_{1},\dots,a_{n},\alpha_{n+1}\right]}{\left[a_{1},a_{2},\dots,a_{n},\alpha_{n+1}\right]} \). אם נשתמש כאן בנוסחת הנסיגה שכבר מצאנו למונה והמכנה, אז אפשר לכתוב \( \alpha=\frac{\alpha_{n+1}A_{n}+A_{n-1}}{\alpha_{n+1}B_{n}+B_{n-1}} \). עכשיו, כדי לראות עד כמה \( \frac{A_{n}}{B_{n}} \) הוא קירוב טוב ל-\( \alpha \) נחסר את האחד מהשני ונקבל:
\( \alpha-\frac{A_{n}}{B_{n}}=\frac{\alpha_{n+1}A_{n}+A_{n-1}}{\alpha_{n+1}B_{n}+B_{n-1}}-\frac{A_{n}}{B_{n}}=\frac{A_{n-1}B_{n}+A_{n}B_{n-1}}{B_{n}\left(\alpha_{n+a}B_{n}+B_{n-1}\right)}=\frac{\left(-1\right)^{n-1}}{B_{n}\left(\alpha_{n+a}B_{n}+B_{n-1}\right)} \)
כאן שוב השתמשנו בנוסחה הקסומה \( A_{n}B_{n-1}-A_{n-1}B_{n}=\left(-1\right)^{n-1} \). ניקח ערך מוחלט לביטוי, ונקבל בסופו של דבר ש:
\( \left|\alpha-\frac{A_{n}}{B_{n}}\right|<\frac{1}{B_{n}B_{n+1}} \) (מאיפה ה-\( B_{n+1} \) צץ פתאום? הוא קטן יותר מהגורם שבתוך הסוגריים במכנה - מדוע?).
ושוב, מכיוון ש-\( B_{n} \) היא סדרה עולה, נובע מכך ש-\( \frac{A_{n}}{B_{n}} \) מתכנסת ל-\( \alpha \), בדיוק כפי שרצינו. לא רק זה - קצב ההתכנסות הוא ריבועי; אך על כך ארחיב בפוסט הבא.
נהניתם? התעניינתם? אם תרצו, אתם מוזמנים לתת טיפ: