האם רוב המספרים הראשוניים הם קטנים?
חלק ראשון, ובו כמעט הכל ממש ממש ממש גדול
כשאני רואה דיונים נרגשים על מתמטיקה ברשתות חברתיות, זה לרוב בגלל שמישהו זרק פצצת סירחון וברח והשאיר אנשים לריב אחד עם השני על טיב הריח. הפצצה האהובה ביותר היא הביטוי \( 6\div2\left(1+2\right) \) הידוע לשמצה (יש לי על זה פוסט) אבל נתקלתי עכשיו בפצצה מסוג קצת שונה שכבר הכתה גלים - השאלה האם המשפט “רוב המספרים הראשוניים הם קטנים” הוא אמת או שקר.
לפני שמתחילים בכלל לדבר על זה צריך להתחיל מלציין את המובן מאליו: השאלה הזו היא הטרלה במובן הקלאסי ביותר של המילה - סוג של התחכמות או פרובוקציה שהמטרה שלה לגרום לאנשים להתרגז, לריב אחד עם השני או להגיד שטויות בזמן שהמטריל יכול להיתמם שהוא סך הכל ניסה לעורר דיון פורה. חברים, זו לא הדרך לעורר דיון פורה. זו הדרך לגרום לאנשים לשלוף תשובות סותרות ולריב אחד עם השני עליהן למרות שהשורה התחתונה היא שכולם צודקים כי אין פה תשובה חד משמעית. המשפט “רוב המספרים הראשוניים הם קטנים” הוא לא אמת ולא שקר, אין לו ערך אמת מוגדר כי באופן ממש לא מפתיע, ערך האמת של פסוקים תלוי בשאלה מה המשמעות שאנחנו נותנים למושגים שמופיעים בהם, והמושג קטן כאן הוא לחלוטין לא מוגדר היטב.
אבל פצצות כאלו הן גם הזדמנות - לא לריב עם אף אחד, אלא לכתוב פוסט שמציג כמה מהדרכים השונות לפרש את השאלה הזו ולראות איזו פיסת מתמטיקה מעניינת נחשפת אלינו בזכותן. זה מה שאני אנסה לעשות פה - אבל בשום פנים ואופן לא בצורה שתתיימר להיות מקיפה. אני בסך הכל נותן כמה מהאסוציאציות שלי שהשאלה הזו מעוררת.
בואו נתחיל מההתחלה. מספר ראשוני הוא מספר טבעי גדול מ-1 שמתחלק רק ב-1 ובעצמו, למשל 2 או 31. יש לי פוסט שמסביר למה ראשוניים הם מעניינים ולמה 1 לא נחשב ראשוני אז לא אחזור על זה כאן, אבל בגדול - אם רוצים לדבר על קבוצה כלשהי של מספרים טבעיים שהיא לא ממש בנאלית (למשל, “המספרים הזוגיים”) אז הראשוניים זו הדוגמא הכי מתבקשת ואני מניח שלכן השתמשו בה בשאלה הזו.
עכשיו, תכונה בסיסית של ראשוניים היא שיש אינסוף מהם. הדרך הפשוטה לראות את זה מלווה אותנו עוד מימי אוקלידס, שהציג את ההוכחה הזו לראשונה: בואו ניקח קבוצה סופית כלשהי של ראשוניים, \( \left\{ p_{1},p_{2},\ldots,p_{k}\right\} \). מכיוון שיש לנו מספר סופי של ראשוניים, אפשר לכפול את כולם ולהוסיף 1 ולקבל מספר \( n=p_{1}p_{2}\ldots p_{k}+1 \). המספר הזה לא מתחלק באף אחד מהראשוניים בקבוצה (לחלק בכל אחד מהם מחזיר שארית 1 בגלל ה-1 שהוספתי) ולכן אם אני אפרק את \( n \) לגורמים אני אמצא ראשוניים חדשים שלא היו שייכים לקבוצה. למשל, אם הקבוצה שלי היא \( \left\{ 2,3,5\right\} \) אז אני אקבל \( n=2\cdot3\cdot5+1=31 \) וכבר \( n \) עצמו הוא ראשוני “חדש”; אם לעומת זאת הקבוצה היא \( \left\{ 2,3,5,7,11,13\right\} \) אז אחרי כפל והוספת 1 אני אקבל את \( n=30,031 \) שהוא לא ראשוני כי הוא שווה \( 59\cdot509 \), אבל שני הגורמים הללו הם כן ראשוניים אז מצאתי את הראשוניים החדשים 59 ו-509. המסקנה: אין מספר סופי של ראשוניים, כי לכל קבוצה סופית של ראשוניים תמיד אפשר למצוא ראשוני שלא שייך אליה.
מכיוון שיש אינסוף ראשוניים, התחושה המיידית היא שנכון לומר שרוב הראשוניים הם גדולים כי “רוב המספרים הם גדולים”. יש אפילו “משפט” שאומר את זה, שמכונה “המשפט המגוחך של האריתמטיקה” שמופיע בספר Field Guide to Simple Graphs של Steinbach - הטענה ש”כמעט כל המספרים הטבעיים הם מאוד מאוד מאוד גדולים”. הרעיון פה הוא ש”כמעט כל” הוא מונח טכני מדויק: הוא אומר “כל הטבעיים פרט למספר סופי”, תוך שימוש בכך שיש אינסוף טבעיים אז אם מורידים מתוכם כמות סופית, עדיין נשארים עם אינסוף. אפשר לצקת תוכן למשפט בשתי דרכים שונות: ראשית, אפשר להניח שהמספרים הטבעיים מתחלקים איכשהו ל”קטנים” ו”גדולים” ויש מספר שרירותי, נאמר \( N \), שהחל ממנו ה”גדולים” מתחילים (או אפילו ה”מאוד מאוד מאוד גדולים” אם רוצים לשמור על נאמנות לניסוח של המשפט). אז אם נסתכל על קבוצת כל הטבעיים שגדולים מ-\( N \), כל האיברים בקבוצה הזו הם מאוד מאוד מאוד גדולים, ואילו איברים שלא גדולים מ-\( N \) יש רק במספר סופי, ולכן באמת כמעט כל הטבעיים הם מאוד מאוד מאוד גדולים.
את אותו רעיון בדיוק אפשר להחיל גם על הראשוניים. להגיד “אין לי מושג מה זה מספר קטן או גדול אבל יש איזה שהוא \( N \) שהחל ממנו כל המספרים הם גדולים, ובגלל שיש אינסוף ראשוניים אז יש אינסוף ראשוניים שגדולים מ-\( N \) ולכן רוב הראשוניים הם גדולים”. זו טענה סבירה בהחלט, והתלונה המרכזית שלי אליה היא שזו לא טענה כל כך מעניינת; התוכן המתמטי שבא בה לידי ביטוי הוא רק האבחנה שיש אינסוף ראשוניים - וזו אבחנה די מעניינת בפני עצמה, אבל אנחנו רק מגרדים איתה את השטח של מה שאפשר לומר על ראשוניים, זה הבסיס של הבסיס. אז לעצור כאן? ממש חבל.
בואו נחזור אל הטענה המקורית: “רוב המספרים הראשוניים הם קטנים”. יש כאן בעצם שלושה מושגים מתמטיים בפעולה. על אחד מהם, “מספרים ראשוניים”, אין ויכוח - כולנו יודעים מה הם מספרים ראשוניים ואיך הם מוגדרים. שני המושגים האחרים - “רוב” ו”קטנים” הם חסרי משמעות מתמטית קונקרטית. “קטנים” הוא מושג נטול הגדרה מתמטית קונקרטית כלשהי; ו”רוב” אמנם נשמע לנו כמו משהו טריוויאלי מבחינה מתמטית אבל הוא הרבה יותר ערמומי ממה שנראה במבט ראשון. למשל, האם “רוב” המספרים הטבעיים הם ריבועים של מספר טבעי (למשל \( 1,4,9,16,\dots \)) או לא? לכאורה רוב המספרים הטבעיים הם לא כאלו (למשל בין 9 ו-16 יש לנו את המספרים 10,11,12,13,14,15 - לא פחות משישה מספרים שאינם כאלו) אבל מצד שני כבר גלילאו שם לב לכך שיש התאמה חד-חד-ערכית ועל בין ריבועים של מספרים טבעיים ובין הטבעיים, כך שבמובן מסויים יש את אותה כמות של שניהם (במתמטית אנחנו אומרים שיש כאן שוויון עוצמות של שתי קבוצות אינסופיות). בקיצור, אני מבקש שננסה לשכוח את האינטואיציות היומיומיות שלנו לגבי “קטן” ו”רוב” וננסה לבנות אותן מחדש בזהירות, כמו שעושים הרבה פעמים במתמטיקה.
בואו נחזור למשפט המגוחך של האריתמטיקה, “כמעט כל המספרים הטבעיים הם מאוד מאוד מאוד גדולים”. אמרתי שאפשר לצקת אל המשפט הזה תוכן בשתי דרכים שונות. דרך אחת התבססה על זה שהמספרים הטבעיים הם אינסופיים, אבל הדרך השניה יכולה לומר - עזבו אותנו מאינסוף טבעיים. זה לא משהו אמיתי. זה לא משהו שאנחנו יודעים לתפוס בידיים. יש גבול לכמות המספרים שנוכל לייצג ביקום - אפילו אם נגייס את כל האטומים למשימת ייצוג מספר, בסוף יהיה מספר שהוא גדול מכדי שנוכל לייצג אותו. כל אינסוף המספרים שמעבר אליו? לא רלוונטיים לנו. במילים אחרות, בואו נניח שיש גבול עליון למספרים הטבעיים ונקרא לו \( N \) ומעכשיו “שדה המשחק” שלנו הוא רק אוסף המספרים הטבעיים מ-\( 1 \) עד \( N \); הקבוצה \( \left\{ 1,\ldots,N\right\} \). זו גישה שנשמעת תבוסתנית ומתעלמת מהמציאות במבט ראשון, אבל כפי שנראה עוד מעט היא דווקא פרודקטיבית ומועילה.
בואו נשכח לרגע מראשוניים ונדבר על מספרים באופן כללי. נניח ש-\( N=1,000,000,000,000 \) - “טריליון”. זה מספר גדול כל כך שאנחנו לא ממש נתקלים בו בחיי היום יום בהקשרים כמו מרחקים, מהירויות, גודל אוכלוסיה, כסף וכו’ (אנחנו כן נתקלים בו כל הזמן למשל בהקשר של זיכרון במחשב אבל אז קוראים לו “טרהבייט”). עכשיו, בואו נניח שההגדרה שלנו למספר גדול היא די קיצונית - אפילו מיליארד עדיין לא נתפס בעינינו כמספר גדול. אפילו לא עשרה מיליארד! או 37 מיליארד! לא, המספר הראשון שאנחנו מואילים בטובנו לומר שהוא גדול הוא לא פחות מאשר \( 100,000,000,000 \) - מאה מיליארד. ממש קרוב לטריליון. רק אפס אחד נוסף.
תחת ההגדרה הזו, רוב עצום של המספרים ב”עולם” שלנו הם מספרים ממש, ממש גדולים. למה? כי עד מאה מיליארד יש, ובכן, מאה מיליארד מספרים; וממאה מיליארד עד טריליון יש עוד תשע-מאות מיליארד מספרים - פי 9! אפילו אם נהיה שמרנים ונאמר שרק המספרים החל מ-500 מיליארד הם ממש, ממש ממש גדולים אז עדיין כמות המספרים הממש ממש ממש גדולים בעולם שלנו היא 500 מיליארד… ועוד 1 (טריליון עצמו; זה כמו שבין 5 ל-10 כולל 10 עצמו יש 6 מספרים) כלומר רוב המספרים הם ממש ממש ממש גדולים. זה המובן שבו המשפט “המגוחך” של האריתמטיקה הוא דווקא מעניין למדי; הוא מצביע יפה על כך שהמספרים שאנחנו רגילים אליהם מהיומיום הם כנראה רק טיפה בים לעומת כמות המספרים שעדיין אפשר לדחוס אל מה שנחשב בעינינו “הגבול של המספרים” שאחריו אנחנו כבר לא עוקבים בכלל.
טוב ויפה, אבל איך המספרים הראשוניים נכנסים לפה? אם למשל אני באמת בוחר את \( N \) להיות טריליון ומחלק את העולם שלי לכל המספרים שקטנים מ-500 מיליארד וכל המספרים מ-500 מיליארד עד טריליון, האם בחצי השני תהיה אותה כמות ראשוניים כמו בחצי הראשון? ובכן, לא. בחצי הראשון יהיו יותר ראשוניים. אז אם אני אמתח את הגבול ב-\( N/2 \), כלומר כל מה שעד \( N/2 \) הוא “קטן” וכל מה שאחריו הוא “גדול” אז רוב הראשוניים יהיו דווקא קטנים. אבל אם אני אמתח את הגבול טיפה אחרת, למשל ב-\( N/3 \) במקום ב-\( N/2 \) זה כבר לא יעבוד ויהיו יותר ראשוניים “גדולים”. אז יש לנו כאן סיטואציה מעניינת - סיטואציה שבה התשובה לשאלה תלויה מאוד בסדר הגודל המדויק, ביחס ל”גבול” העולם, שעבורו אנחנו מגדירים “גדול”.
איך בעצם אני יודע את מה שטענתי כרגע על הראשוניים? או, אני שמח ששאלתם כי זה מאפשר לנו לדבר על תוכן מתמטי אמיתי - משפט המספרים הראשוניים, שהוא אחד מפסגות המתמטיקה של המאה ה-19.
חלק שני, שבו בקירוב אנחנו מגיעים למסקנה שחצי הוא מיוחד
בואו נסמן לרגע ב-\( \pi\left(n\right) \) את מספר הראשוניים שקטנים או שווים ל-\( n \). זו פונקציה שמאוד מעניינת מתמטיקאים גם כי היא נותנת בדיוק את סוג המידע שמעניין אותנו כאן - כמה ראשוניים יש בתחום מסוים - וגם כי זו פונקציה שמתקדמת ב”קפיצות” (היא גדלה ב-1 בכל פעם שבה \( n \) הוא ראשוני) ולכן אם היינו יודעים לחשב אותה טוב, היינו יכולים למצוא ראשוניים על ידי זיהוי של נקודות הקפיצה. ספוילר: אנחנו לא יודעים לחשב אותה טוב, ולכן מה שהמתמטיקאים עשו הוא לנסות ולהבין איך הפונקציה מתנהגת בערך. מה התכונות האסימפטוטיות שלה. ומשפט המספרים הראשוניים (שההוכחה שלו מורכבת למדי ובוודאי שלא אכנס אליה כאן) אומר ש-\( \pi\left(n\right)\approx\frac{n}{\ln n} \).
אני לא אכנס כאן למשמעות המדויקת של \( \approx \) כי מספיק לנו לחשוב על זה בתור “בערך” שהולך ומשתפר ככל ש-\( n \) גדול יותר. ה-\( \ln n \) שמופיע במכנה הוא פונקציית הלוגריתם הטבעי, כלומר לוגריתם שהבסיס שלו הוא לא 10 אלא המספר הקבוע המיוחד \( e=2.78\ldots \) וגם את זה לא באמת חייבים להבין עד הסוף. במקום זה, בואו נראה כמה דוגמאות.
ראשית, לא כזה קשה לחשב את \( \pi\left(n\right) \) לערכים קטנים יחסית. אני למשל מצליח במחשב שלי, עם שפת תכנות לא יעילה במיוחד כמו פייתון, לחשב את \( \pi\left(10,000,000\right)=664,579 \) די בקלות באמצעות הכברה של ארטוסתנס (אין לי פוסט על זה עדיין, כל כך מביך). אז הנה כמה זוגות של \( \pi\left(n\right) \) לעומת \( \frac{n}{\ln n} \), כדי שנבין איך הקירוב הזה עובד:
\( n=100,\pi\left(n\right)=25,\frac{n}{\ln n}=21.71\ldots \)
\( n=1,000,\pi\left(n\right)=168,\frac{n}{\ln n}=144.76\ldots \)
\( n=10,000,\pi\left(n\right)=1229,\frac{n}{\ln n}=1085.73\ldots \)
\( n=100,000,\pi\left(n\right)=9592,\frac{n}{\ln n}=8685.88\ldots \)
\( n=1,000,000,\pi\left(n\right)=78498,\frac{n}{\ln n}=72382.41\ldots \)
\( n=10,000,000,\pi\left(n\right)=664579,\frac{n}{\ln n}=620420.68\ldots \)
משהו שאפשר מייד לראות הוא שהקירוב הזה עובד לא רע, אבל בוודאי גם לא טוב כפי שאפשר היה לקוות. גודל הטעות - ההפרש בין המספר האמיתי והקירוב - רק גדל. עבור 100 הטעות היא בערך 3, עבור 100,000 היא בערך 906 ועבור 10,000,000 היא בערך 44158, כלומר היא הולכת וגדלה בערך האבסולוטי שלה. אבל הערך היחסי שלה - כלומר, הגודל שלה כשהוא מחולק ב-\( n \) - דווקא הולך וקטן, מ-0.03 עבור \( n=100 \) אל \( 0.004 \) עבור \( n=10,000,000 \).
איך כל זה עוזר לנו? אם אנחנו קובעים רף מסוים שמעליו כל המספרים הם “גדולים” ומתחתיו הם “קטנים”, זה מאפשר לנו להעריך כמה ראשוניים קטנים יהיו אל מול כמה ראשוניים גדולים. נניח למשל שהרף היא \( \frac{N}{2} \), אז כמות הראשוניים הכוללת עד \( N \) היא בערך \( \frac{N}{\ln N} \) וכמות הראשוניים ה”קטנים” עד \( N \) היא בערך \( \frac{N/2}{\ln\left(N/2\right)} \) וכדי לדעת איך היא ביחס לכמות הראשוניים הכוללת אני אחלק את \( \frac{N/2}{\ln\left(N/2\right)} \) ב-\( \frac{N}{\ln N} \). כדי לפשט את הביטוי אני הולך להשתמש בתכונה סטנדרטית של לוגריתמים: \( \ln\left(\frac{a}{b}\right)=\ln a-\ln b \), ולכן \( \ln\left(N/2\right)=\ln N-\ln2 \). הערך המספרי המדויק של \( \ln2 \) לא כל כך חשוב, אבל הוא בערך \( 0.693\ldots \) (כלומר - מספר חיובי, אבל ממש קטן). אם כן:
\( \frac{N/2}{\ln\left(N/2\right)}/\frac{N}{\ln\left(N\right)}=\frac{1}{2}\frac{\ln N}{\left(\ln N-\ln2\right)}=\frac{1}{2}\frac{1}{1-\frac{\ln2}{\ln N}} \)
מה קיבלנו פה? לוגריתם הוא פונקציה עולה שהיא אי-שלילית החל מ-1, כך ש-\( 0<\ln2<\ln N \), כלומר \( 0<\frac{\ln2}{\ln N}<1 \), כלומר \( 0<1-\frac{\ln2}{\ln N}<1 \) ולכן \( \frac{1}{2}\frac{1}{1-\frac{\ln2}{\ln N}}>\frac{1}{2} \). מכאן אנחנו לומדים שני דברים:
- תמיד יש יותר ראשוניים "קטנים" מאשר "גדולים" אם "קטן" מוגדר בתור "קטן מ-\( \frac{N}{2} \)".
- כאשר \( N \) שואף לאינסוף, היחס בין ה"קטנים" וה"גדולים" שואף ל-\( 1 \), כלומר יש פחות ופחות ראשוניים "קטנים" ביחס ל"גדולים". למרות שהם תמיד רוב.
כל זה קורה אם אני בוחר באופן שרירותי ש”קטן” יהיה קטן מ-\( \frac{N}{2} \). מה קורה במקרים אחרים? למשל אם “קטן” זה קטן מ-\( \frac{N}{10} \)? בואו נסתכל באופן כללי על \( \frac{N}{k} \), אז החישוב שעשיתי למעלה לא משתנה בצורה מהותית - אני מקבל בסוף \( \frac{1}{k}\cdot\frac{1}{1-\frac{\ln k}{\ln N}} \). זה אומר שאם אני רוצה להגיע למצב שבו רוב הראשוניים (יותר מחצי) הם “קטנים” אני חייב להגדיר “קטן” בתור “קטן מ-\( \frac{N}{2} \)” (או קטן אפילו ממספר עוד יותר גדול). עכשיו, האינטואיציה שלי היא שחצי זה לא מספיק - צריך להיות קטנים יותר בסדר גודל או משהו, כמו קודם שהיה לנו 100 מיליארד ביחס לטריליון. אז גם מהניתוח הזה מקבלים את אותה התוצאה ה”ברורה” - יש יותר ראשוניים גדולים מאשר קטנים. אפילו אם לא מסתכלים על כל אינסוף הראשוניים אלא מצמצמים את עצמנו לאיזור מסוים, ואפילו אם משתמשים בכלים מתמטיים כבדים ומרשימים. ההבדל? עכשיו יש לטענות שלנו יותר תוכן מתמטי, וראינו תוצאות מתמטיות יפות על הדרך.
אבל רגע, זה עדיין רחוק מאוד מלהיות סוף הסיפור!
חלק שלישי, ובו השאלה הפילוסופית איך בעצם משווים?
עד עכשיו הגישה שאימצנו כדי לדבר על “קטן” הייתה פשוטה: קבענו מספר טבעי כלשהו, כל מה שמתחתיו היה “קטן” וכל מה שמעליו היה “גדול”. זו גישה סבירה מאוד כי הרי צריך לשים גבול איפה שהוא, אבל מצד שני היא לוקה בכשל הסטנדרטי של “פרדוקס הערימה”. אם \( n \) הוא מספר גדול, הרי שגם \( n-1 \) הוא מספר גדול, לא? הוא בוודאי לא קטן; ההפרש שלו מהמספר הגדול \( n \) הוא בסך הכל 1. אם 1 הוא מה שמפריד מספר קטן מגדול, למה \( n-1 \) עצמו אינו גדול? הרי \( n-2 \) הוא קטן, ו-\( n-1 \) הוא \( \left(n-2\right)+1 \), אז הוספת ה-1 הזו הייתה אמורה להיות אותו לגדול, לא? התשובה לפרדוקס הזה היא שאין תשובה. “גדול” הוא מושג עמום ובגלל שאין לנו הגדרה טובה אליו אנחנו קובעים משהו שרירותית, וזהו. תסתדרו. עכשיו, שיהיה ברור, מותר לנו לבצע קביעות כאלו; אבל מה שלא כדאי לנו לעשות הוא להתנהג כאילו קביעה כזו היא האמת האחת והיחידה, וגישות אחרות לשאלה מה זה קטן/גדול הן לא לגיטימיות.
אז אני הולך להראות כמה גישות כאלו, ואנסה שיהיו שונות ממש באופי שלהן כדי שנבין עד כמה אפשר להשתגע פה אם רוצים.
ראשית, הנה הגדרה שונה לגמרי ל”קטן”: מספר \( n \) הוא קטן אם קיים מספר \( N \) שגדול ממנו פי גוגול, כלומר פי \( 10^{100} \). מה מצדיק את ההגדרה הזו? יחסיות - בוודאי ש-\( n \) כזה הוא ממש ממש ממש ממש ממש ממש ממש קטן ביחס ל-\( N \) שגדול ממנו פי \( 10^{100} \). אלא מה, עבור כל מספר טבעי \( n \) קיים מספר \( N=n\cdot10^{100} \) שכזה, אז ההגדרה שנתתי בעצם אומרת שכל המספרים הטבעיים הם קטנים. אפשר לומר שזה מוכיח שההגדרה גרועה, אבל אפשר גם לומר שזה מראה שהציפייה שלנו למושג אבסולוטי של “קטן” היא מופרכת כי כל מספר, גדול ככל שיהיה, הוא קטן בהקשר מסוים.
ערעור אפשרי אחד על ההגדרה הזו אפשר לתת בכך שאותו \( n \) “קטן” שלי עשוי להיות בעצמו גדול פי \( 10^{100} \) מאיזה מספר טבעי אחר - מה שהופך אותו בו זמנית ל”גדול” ול”קטן” והיינו רוצים הגדרה שלא תאפשר משהו כזה בכלל. אז הנה הגדרה טיפה שונה שלא חשופה לסימטריה כזו: מספר \( n \) הוא קטן אם קיימים אינסוף מספרים טבעיים שגדולים ממנו. אין כאן סימטריה כי לכל מספר טבעי יש רק מספר סופי של מספרים טבעיים שקטנים ממנו, ואני חושב שיש פה אינטואיציה טובה - לא משנה כמה \( n \) נראה לנו גדול, הוא בסך הכל צעד ראשוני זעיר בדרך אל הנצח העצום שהוא כלל המספרים הטבעיים. אלא מה, גם ההגדרה הזו בעצם אומרת שכל המספרים הטבעיים הם קטנים. בצורה הזו אנחנו מקבלים את הטענה “כל המספרים הראשוניים הם קטנים” שזה נחמד, אבל האמת היא שהיה מעניין אם היינו רואים כאן תכונה שייחודית לראשוניים עצמם, לא לכל המספרים הטבעיים.
אז הנה גישה שונה לחלוטין לחשוב על כל העניין - יחסי סדר. יש לי פוסט על יחסי סדר, אבל בואו נראה את זה גם כאן. כשאני אומר \( a\le b \), אל מה אני מתכוון בזה? אם \( a,b \) שניהם מספרים טבעיים, הסימון הזה בדרך כלל אומר “קיים \( d \) טבעי כך ש-\( a+d=b \)”. זו ההגדרה הפורמלית. למשל \( 3\le5 \) כי \( 3+2=5 \), או \( 7\le7 \) כי \( 7+0=7 \). זו הגדרה קונקרטית של יחס סדר מסוים אבל מתמטיקאים אוהבים לבצע הפשטה של אובייקטים קונקרטיים - לזהות את התכונות המעניינות של האובייקט ולהישאר רק איתן ולראות איך עדיין אפשר “לשחזר” חלקים גדולים מהמידע הרלוונטי על האובייקט רק מהתכונות המעניינות הללו - רק שעכשיו גם אובייקטים אחרים שחולקים את אותן תכונות ייהנו מהדברים שהסקנו. עבור יחסי סדר, התכונות המעניינות שאנחנו שמים לב אליהן הן:
- לכל \( a \) מתקיים \( a\le a \) (זה נקרא רפלקסיביות)
- לכל \( a,b,c \) אם \( a\le b \) וגם \( b\le c \) אז \( a\le c \) (זה נקרא טרנזיטיביות)
- לכל \( a,b \) אם \( a\le b \) וגם \( b\le a \) אז \( a=b \) (זה נקרא אנטי-סימטריה).
בואו נראה דוגמא ליחס אחר על הטבעיים שמקיים את אותן תכונות בדיוק - יחס החלוקה. אני מסמן \( a|b \) כדי לומר “\( a \) מחלק את \( b \)” ופורמלית זה מוגדר באופן די דומה ליחס הסדר הרגיל: זה אומר שקיים \( d \) טבעי כך ש-\( a\cdot d=b \). כלומר, במקום לחבר את \( d \) אנחנו כופלים ב-\( d \).
קל להראות ששלוש התכונות למעלה מתקיימות: לכל \( a \), \( a\cdot1=a \) ולכן \( a|a \). לכל \( a,b,c \) אם \( a|b \) אז קיים \( d_{1} \) כך ש-\( ad_{1}=b \) ואם גם \( b|c \) אז קיים \( d_{2} \) כך ש-\( bd_{2}=c \), ומשני אלו נקבל \( a\left(d_{1}d_{2}\right)=\left(ad_{1}\right)d_{2}=bd_{2}=c \) כלומר \( a|c \); ולבסוף, אם \( a|b \) וגם \( b|a \) אז זה אומר שקיימים \( d_{1},d_{2} \) כך ש-\( ad_{1}=b \) ו-\( bd_{2}=a \) ולכן \( a\left(d_{1}d_{2}\right)=\left(ad_{1}\right)d_{2}=bd_{2}=a \), ואם נצמצם את \( a \) משני האגפים נקבל \( d_{1}d_{2}=1 \) ומכיוון ש-\( d_{1},d_{2} \) שניהם מספרים טבעיים זה יכול לקרות רק אם \( d_{1}=d_{2}=1 \), כלומר \( a=b \). זה מסיים את ההוכחה שחלוקה היא יחס סדר.
עכשיו מגיע החלק המוזר - אם אנחנו משווים גודל של איברים על בסיס יחס הסדר הזה, יוצא שכל הראשוניים הם קטנים. הרי \( p \) הוא ראשוני אם שני המספרים היחידים שמחלקים אותו הם 1 ו-\( p \) עצמו. כלומר אנחנו מקבלים ש-\( 1 \) הוא המספר ה”מינימלי” על פי יחס הסדר (לכל \( a \) קיים, \( 1|a \)) אבל הראשוניים נמצאים דרגה אחת מעליו.
אני אפילו לא אטרח לנסות להגדיר את “קטן” בצורה יותר מפורשת; אם אנחנו הולכים על פי יחס הסדר שהצגתי, די ברור לי שכל מספר ראשוני הולך להיות “קטן” כי הוא כמעט לגמרי בתחתית הדיאגרמה. כמובן, כשמבינים ש-0 נמצא בראש הדיאגרמה ולכן הוא הכי גדול שיש האינטואיציה שלנו עלולה להתפוצץ, אבל זה טוב; כל הרעיון הוא לראות דברים ששונים מהאינטואיציה היומיומית.
חלק רביעי, ובו דרך אחרת לחשוב על ראשוניים קטנים וגדולים
בדוגמת יחס הסדר שנתתי, כל הראשוניים היו קטנים. אפשר אולי היה לחשוב על הגדרה ל”גדול” שבה חלק מהמספרים הטבעיים יהיו גדולים (מספרים שיש להם המון מחלקים? מחלקים שהם חזקות גדולות?) אבל לא משנה מה היא הייתה, אף ראשוני לא היה מתאים אליה. אבל אפשר להציג עוד תוצאה, מרהיבה לחלוטין לטעמי, שנותנת לנו זווית התבוננות נוספת על מושגי ה”קטן”/”גדול” הללו. הדרך הזו תשתמש במתמטיקה טיפה יותר מתוחכמת אבל גם אם אתם לא מכירים אותה, אל תתייאשו! לא באמת צריך להבין אותה לעומק.
בואו נתחיל עם סיפור יפה: אכילס רוצה לרוץ לאורכו של אצטדיון בן קילומטר אחד. לפני שהוא יגיע לקצה השני שלו הוא חייב לעבור דרך נקודת האמצע, כלומר הוא קודם כל צריך לעבור \( \frac{1}{2} \) קילומטר. אחר כך נותר לו עוד חצי קילומטר, אבל לפני שיעבור את כל המרחק הזה הוא צריך לעבור חצי ממנו, כלומר לעבור עוד \( \frac{1}{4} \) קילומטר. ואחרי שעבר אותו, הוא צריך לעבור עוד \( \frac{1}{8} \) קילומטר כדי להגיע לחצי מהמרחק שנותר, וכן הלאה וכן הלאה. עכשיו, אני חושב שכולנו נסכים שאכילס יגיע לקצה השני של האצטדיון ואכן יעבור 1 קילומטר (“אני לא מסכים!” צועק מישהו בשם זנון מהיציע, אבל אנחנו במרחק 2,000 שנים ממנו אז נתעלם) ולכן, אינטואיטיבית, אנחנו יכולים לזרום עם הטענה שלי ש-\( \frac{1}{2}+\frac{1}{4}+\frac{1}{8}+\ldots=1 \). כלומר, שאפשר לחבר אינסוף מספרים ולקבל משהו סופי. דגש על אפשר, אני בהחלט לא אומר שזה תמיד יעבוד.
הסיבה שזה עובד במקרה למעלה היא שהאיברים שמשתתפים בסכום הופכים מהר מאוד לקטנים מאוד. אפשר לנסח את זה בצורה פורמלית לגמרי, אבל כרגע לא אכנס לזה. הנקודה החשובה היא שלא מספיק שהאיברים הופכים לקטנים עוד ועוד - זה צריך לקרות מהר. כמה מהר? ובכן, אם נסתכל על הסכום הבא:
\( 1+\frac{1}{2}+\frac{1}{3}+\frac{1}{4}+\frac{1}{5}+\ldots \)
הסכום הזה לא מסתכם לשום דבר סופי - הוא יוצא “אינסוף”. לעומת זאת, הסכום הבא:
\( 1+\frac{1}{4}+\frac{1}{9}+\frac{1}{16}+\ldots \)
שאפשר לכתוב גם בתור
\( \frac{1}{1^{2}}+\frac{1}{2^{2}}+\frac{1}{3^{2}}+\frac{1}{4^{2}}+\ldots \)
יוצא מספר סופי, ועוד אחד שמעורר תהיות “מאיפה זה בכלל הגיע?!” - המספר \( \frac{\pi^{2}}{6} \) (מאיפה זה באמת הגיע? יש שלל הסברים, אבל זה לפוסט אחר).
את מה שראינו אפשר לסכם בצורה הבאה: אם אנחנו מחברים את כל האיברים מהצורה \( \frac{1}{n} \) כאשר \( n \) הוא מספר טבעי זה יוצא אינסוף, אבל אם אנחנו לא סוכמים את כל האיברים הללו אלא רק חלק מהם, אנחנו עשויים לקבל מספר סופי. אם מחברים רק את האיברים שעבורם \( n \) הוא חזקה של 2, מקבלים משהו סופי; אם מחברים רק את האיברים שעבורם \( n \) הוא ריבוע של מספר טבעי, מקבלים משהו סופי.
מה קורה אם מחברים את כל האיברים שעבורם \( n \) ראשוני? זו התוצאה שאני רוצה לדבר עליה כאן. התשובה היא שמקבלים אינסוף, והעובדה הזו בפני עצמה היא עוד הוכחה לכך שיש אינסוף ראשוניים כי אם היה רק מספר סופי שלהם, בוודאי שגם סכום שלהם היה סופי. אבל איך מוכיחים את הטענה הזו? יש שלל הוכחות, אבל זו שמעניינת אותי כאן היא הוכחה של פאול ארדש, שכמעט ולא דורשת היכרות עם מתמטיקה מתקדמת ואני אחליק בקלילות גם את מה שכן צריך. נתמקד בחלק שאותו אפשר להבין בלי ידע מתמטי מתקדם כלשהו, אם כי זה לא אומר שהוא יהיה קל להבנה. אבל אם נבין אותו, נבין גם דרך אחרת לגמרי להתבונן על ענייני ה”קטן”/”גדול”, מה שנותן תוכן מתמטי מאוד מעניין לשאלה המקורית.
ראשית, האינטואיציה הכללית: ככל ש-\( n \) יותר גדול כך \( \frac{1}{n} \) יותר קטן ולכן תורם פחות לסכום. לכן אפשר לתת את האינטואיציה לפיה אם הסכום מתכנס (כלומר, מסתכם למספר סופי) אז רוב ה-\( n \)-ים המעורבים בו הם גדולים (כי אז מה שהם תורמים לסכום הוא קטן יחסית) ואילו אם הסכום מתבדר (כלומר, יוצא אינסוף) אז רוב ה-\( n \)-ים המעורבים בו הם קטנים (ולכן מה שהם תורמים לסכום הוא גדול יחסית). זו אינטואיציה די מסוכנת, כי כשמסתכלים על סכומים אינסופיים השאלה אם הם מתכנסים או מתבדרים לא תלויה בראש של הסכום, כלומר באיברים הראשונים שבו, אלא רק ב”זנב” שלו - באינסוף האיברים האחרונים. אם אני אקח את הסכום\( 1+\frac{1}{2}+\frac{1}{3}+\frac{1}{4}+\frac{1}{5}+\ldots \) ובמקום להתחיל אותו מ-1 אני אתחיל אותו מ-\( \frac{1}{1,000,000,000} \), שום דבר לא ישתנה - הסכום עדיין יצא אינסוף. אם אני אתחיל את הסכום \( 1+\frac{1}{4}+\frac{1}{9}+\frac{1}{16}+\ldots \) רק מ-\( \frac{1}{121} \) אז הסכום עדיין יתכנס, אם כי הוא יתכנס למספר אחר (הסכום המקורי פחות סכום כל האיברים ב”ראש” שקיצצנו). אז אפילו אם סכום הוא מתבדר ולכן אני מסיק ש”רוב” האיברים בו קטנים, אני לא באמת יכול להגיד איפה מתחיל ונגמר הרוב הזה, כי אני יכול להתחיל את הזנב מאיפה שאני רוצה; כלומר, אני שוב רואה את “קטן” כמושג יחסי ולא אבסולוטי, אבל עכשיו אפילו קשה לומר ביחס אל מה. אין לי אנלוגיה טובה במיוחד מהמקרה הנוכחי למקרים הקודמים, וזו בדיוק הסיבה שבגללה אני מביא את המקרה הנוכחי - אמרתי שזו תהיה דרך שונה לגמרי לחשוב על זה.
בואו נראה את ההוכחה של ארדש לכך שהסכום מתבדר. מה שארדש עושה הוא הוכחה בשלילה - הוא מניח שהסכום כן מתכנס למספר כלשהו ומגיע מכך לסתירה, מה שגורם לו להסיק שההנחה שהסכום מתכנס הייתה שגויה. ארדש מתחיל מלהגיד שאם הסכום מתכנס, ולא משנה לאיזה מספר הוא מתכנס, אז יש לו זנב שמתכנס לערך קטן. מה זאת אומרת? נניח שאני מסמן את כל הראשוניים באופן הבא: \( p_{1},p_{2},p_{3},\ldots \), אז קיים \( k \) טבעי כלשהו כך ש-\( \frac{1}{p_{k+1}}+\frac{1}{p_{k+2}}+\frac{1}{p_{k+3}}+\ldots<\frac{1}{2} \) - ה”זנב” שהוא סכום כל ההופכיים של ראשוניים שגדולים מ-\( p_{k} \) יוצא פחות מחצי.
למה הטענה הזו נכונה? זו הטענה היחידה שדורשת מתמטיקה קצת יותר מתקדמת כדי להוכיח אותה - ספציפית, תוצאות בסיסיות יחסית בתורה של טורים אינסופיים. הרעיון הוא כזה: נניח שכל הטור של הופכיי הראשוניים מתכנס לאיזה מספר \( A \), כלומר \( \frac{1}{p_{1}}+\frac{1}{p_{2}}+\ldots=A \). אז אני מתחיל לסכום את כל האיברים בטור ובודק לאן הגעתי. אני חייב מתישהו לעבור את \( A-\frac{1}{2} \) כי אם אני אף פעם לא עובר אותו אני לא אגיע אל \( A \) (היי, אכילס!). מרגע שעברתי את \( A-\frac{1}{2} \) כל האיברים שנשארו בטור חייבים להסתכם אל משהו שלא גדול מ-\( \frac{1}{2} \) אחרת נעבור את \( A \) (כאן אני משתמש בכך שכל האיברים בטור הם מספרים חיוביים, כלומר אי אפשר לחבר איברים לטור ובכך להקטין את הסכום הכולל). זה הרעיון, ועל הפורמליזם אני אוותר כאן.
על הראשוניים עד וכולל \( p_{k} \) אפשר לחשוב, כאמור, בתור “הראשוניים הקטנים”, אלו שתורמים הכי הרבה לסכום (כי כשמחלקים 1 בהם מקבלים משהו גדול יחסית) ועל כל יתר הראשוניים אפשר לחשוב בתור “הראשוניים הגדולים”. עכשיו ארדש מראה שקורים שני דברים שונים: ראשית: שמהראשוניים הקטנים אי אפשר להרכיב יותר מדי מספרים; שנית, שמאותם ראשוניים בדיוק אפשר להרכיב המון מספרים. שני אלו מן הסתם מובילים לסתירה אם בוחרים את הפרמטרים שלנו בצורה זהירה.
מה שארדש עושה דומה למה שראינו קודם בפוסט - הוא לוקח \( N \) טבעי כלשהו ומצמצם את ה”עולם” שלנו רק למספרים עד וכולל \( N \) ושואל את עצמו - מבין כל המספרים בתחום \( 1,\ldots,N \), כמה מהמספרים הללו בנויים אך ורק מראשוניים קטנים? כלומר, שבפירוק לגורמים שלהם יש רק ראשוניים עד וכולל \( p_{k} \). בואו נראה דוגמא קונקרטית לזה עם שלושת הראשוניים הראשונים, \( 2,3,5 \). איזה מספרים אפשר להרכיב מהם? ובכן, את 2,3,5 כמובן, אבל גם את \( 6,10,15 \) שמתקבלים ממכפלה של זוגות של איברים מתוכם, וגם את \( 30 \) שמתקבל מהמכפלה של שלושתם. ואם רוצים אפשר להכניס גם את \( 1 \) לתמונה בתור “המכפלה הריקה” שלהם. במילים אחרות, מה שתיארתי עד כה הוא את כל המספרים מהצורה
\( 2^{a}3^{b}5^{c} \)
כאשר \( a,b,c \) הם או 0 או 1. מכיוון שלכל אחד מהמשתנים הללו יש 2 אפשרויות, אז מספר הקומבינציות האפשריות של ערכים לכל המשתנים הם 2 (עבור \( a \)) כפול 2 (עבור \( b \)) כפול 2 (עבור \( c \)) - בסך הכל 8, מה שמתאים למספרים שמצאנו: \( 1,2,3,5,6,10,15,30 \).
אותו טיעון עובד גם באופן כללי כשיש לנו \( k \) ראשוניים: מסתכלים על כל המכפלות \( p_{1}^{a_{1}}\ldots p_{k}^{a_{k}} \) כך שכל \( a_{i} \) הוא או 0 או 1 ומקבלים מספר שמתחלק רק בראשוניים קטנים - בסך הכל \( 2^{k} \) מספרים. ייתכן שחלק מהמספרים הללו יוצאים גדולים מ-\( N \) (הרי לא התחייבתי בשום צורה לגבי הערך של \( N \)) ולכן לא אמורים להיות בספירה, אבל זה בסדר כי מספיק לי להראות חסם מלמעלה על כמות המספרים שאפשר להרכיב עם ראשוניים קטנים - כל עוד החסם הזה יהיה די קטן, אני אוכל להסיק את המסקנה שלי, שאי אפשר להרכיב “יותר מדי” מספרים.
העניין הוא שכרגע אני מפספס די הרבה מספרים, ורואים את זה בדוגמא שלנו. מה עם \( 4 \)? הוא מתחלק רק ב-2. ו-9 מתחלק רק ב-3. ומה עם \( 60 \)? גם הוא מתחלק רק ב-\( 2,3,5 \). העניין הוא שעד כה הסתכלתי רק על מספרים שכל ראשוני משתתף במכפלה שנותנת אותם לכל היותר פעם אחת. אבל ראשוני יכול להופיע הרבה פעמים במכפלה. הטיעון של ארדש מטפל בזה בצורה חכמה - הוא סופר גם את המקרים הללו, אבל מתייחס לכך שאם יש ראשוניים שמופיעים יותר מפעם אחת זה מגדיל עוד יותר את המספר שאנחנו בונים ולכן פחות ופחות מספרים יצליחו להיות מתחת לחסם של \( N \).
הנה הטיעון המסודר. נסתכל על כל המכפלות \( p_{1}^{n_{1}}\ldots p_{k}^{n_{k}} \) כך שאין לי הגבלה על ה-\( n \)-ים מלבד זו ש-\( n \) הוא מספר טבעי. עכשיו, כל מספר טבעי אפשר לכתוב בתור \( n=2m+a \) כך ש-\( m \) הוא מספר טבעי אחר ו-\( a \) הוא או 0 או 1 (אם \( n \) זוגי אז \( a \) יהיה 0 ואחרת הוא יהיה 1). בואו ניזכר לרגע בחוקי החזקות הבסיסים:
\( x^{a+b}=x^{a}\cdot x^{b} \)
\( x^{ab}=\left(x^{a}\right)^{b} \)
\( \left(xy\right)^{a}=x^{a}y^{a} \)
עם החוקים הללו אנחנו רואים ש-\( p^{n}=p^{2m+a}=p^{a}\cdot\left(p^{m}\right)^{2} \), ולכן
\( p_{1}^{n_{1}}\ldots p_{k}^{n_{k}}=p_{1}^{a_{1}}\ldots p_{k}^{a_{k}}\cdot\left(p_{1}^{m_{1}}\ldots p_{k}^{m_{k}}\right)^{2} \)
במילים אחרות, אני יכול לכתוב כל מספר בתור מכפלה מהצורה \( s^{2}r \), כאשר \( r \) הוא בעל התכונה שהוא “חופשי מריבועים” - הוא לא מתחלק על ידי אף ריבוע, כי כל מספר ראשוני במכפלה שנותנת אותו מופיע לכל היותר פעם אחת. פירוק כזה של מספר טבעי למכפלה של ריבוע ומספר חופשי מריבועים הוא טריק סטנדרטי בתורת המספרים האלמנטרית ותמיד נחמד להראות אותו.
איך זה עוזר לארדש? ובכן, ארדש כבר הוכיח לנו שאין יותר מדי מספרים חופשיים מריבועים שמורכבים רק מ-\( k \) הראשוניים הראשונים: יש בדיוק \( 2^{k} \) ערכים אפשריים של \( r \). אילו ערכים אפשריים יש ל-\( s \)? אנחנו צריכים שיתקיים \( s^{2}r\le N \) ולכן בפרט שיתקיים \( s^{2}\le N \) כלומר \( s\le\sqrt{N} \). אז יש לנו \( 2^{k} \) דרכים אפשריות לבחור את \( r \) ולכל היותר \( \sqrt{N} \) דרכים אפשריות לבחור את \( s \), ולכן חסם מלמעלה על כמות המספרים בתחום \( 1,\ldots,N \) שמורכבים רק מהראשוניים \( p_{1},\ldots,p_{k} \) היא \( 2^{k}\sqrt{N} \). אוטוטו נראה שזה מספר קטן מדי.
עכשיו, בואו נסתכל על המספרים בתחום \( 1,\ldots,N \) שמתחלקים על ידי ראשוני גדול אחד לפחות, למשל על ידי הראשוני \( p_{t} \) כך ש-\( t>k \). הרעיון הוא שלא יכולים להיות יותר מדי מספרים כאלו כי \( p_{t} \) הוא גדול. פורמלית, אם מספר כלשהו מתחלק על ידי \( p_{t} \) אז הוא מהצורה \( p_{t}\cdot s \) כאשר \( s \) הוא מספר טבעי כלשהו (שיכול אפילו להתחלק שוב על ידי \( p_{t} \), זה לא מפריע לי). מכיוון ש-\( p_{t}s\le N \) אז \( s\le\frac{N}{p_{t}} \), כלומר יש לנו לכל היותר \( \frac{N}{p_{t}} \) מספרים שמתחלקים על ידי \( p_{t} \) בתחום \( 1,\ldots,N \). אז כמה מספרים יש לי בסך הכל? אני אספור את כל מי שמתחלקים על ידי \( p_{k+1} \), כלומר לכל היותר \( \frac{N}{p_{k+1}} \), ועוד מי שמתחלקים על ידי \( p_{k+2} \) כלומר לכל היותר \( \frac{N}{p_{k+2}} \)וכן הלאה. בצורה הזו ייתכן מאוד שאני אספור את אותו מספר כמה פעמים (כי הוא מתחלק גם על ידי \( p_{k+1} \) וגם על ידי \( p_{k+2} \), למשל) אבל זה לא מפריע לי - אני רק רוצה לחסום מלמעלה את כמות המספרים שמתחלקים על ידי ראשוני גדול. אני אקבל:
\( \frac{N}{p_{k+1}}+\frac{N}{p_{k+2}}+\frac{N}{p_{k+3}}+\ldots=N\cdot\left(\frac{1}{p_{k+1}}+\frac{1}{p_{k+2}}+\frac{1}{p_{k+3}}+\ldots\right)<\frac{N}{2} \)
כשהמעבר האחרון נובע ממה שהתחלנו איתו - בחרנו את \( k \) בכוונה כדי שה”זנב” יתכנס למספר קטן מחצי. עכשיו, את מה שעשיתי בשורה הקודמת צריך להצדיק בצורה פורמלית, כי כל עבודה עם טורים אינסופיים דורשת הצדקות זהירות - אבל זה עובד, לא לדאוג.
מה קיבלנו? שלכל היותר חצי מהמספרים בתחום \( 1,\ldots,N \) יכולים להתחלק על ידי ראשוניים “גדולים”. לכן לפחות חצי מהם מתחלקים רק על ידי ראשוניים קטנים. זה אומר שצריך להתקיים \( \frac{N}{2}<2^{k}\sqrt{N} \), או במילים אחרות - \( \sqrt{N}<2^{k+1} \) (חילקתי את שני האגפים ב-\( \sqrt{N} \) וכפלתי אותם ב-2) או במילים אחרות, \( N<2^{2\left(k+1\right)} \) (העליתי בריבוע את שני האגפים).
אלא מה, לא הנחתי שום דבר כזה על \( N \). כל מה שארדש עשה תקף עבור \( N \) כללי, כלשהו. לכן זה אמור לעבוד גם אם \( N\ge2^{2\left(k+1\right)} \), אבל אז מקבלים סתירה והמתמטיקה מתרסקת, מה שמוביל את ארדש לכך שההנחה המקורית שלו, שהטור של הופכיי הראשוניים מתכנס, לא הייתה נכונה.
בואו נחדד שוב מה ארדש אומר בעצם: הוא אומר שאם נחלק את הראשוניים ל-\( k \) ראשוניים “קטנים” וכל יתר אינסוף הראשוניים הם “גדולים”, אז אם נסתכל על חתיכה גדולה מספיק מהמספרים הטבעיים, הראשוניים ה”קטנים” יהיו חייבים להרכיב לבדם לפחות חצי מהחתיכה הזו כי הראשוניים ה”גדולים” הם גדולים מדי מכדי להרכיב את רוב המספרים שם, אבל מצד שני פשוט אין מספיק ראשוניים קטנים כדי להרכיב כזו כמות של מספרים. המסקנה, אם תרצו, היא שראשוניים “קטנים” יש המון, אם כי כאמור קשה לי לתאר את המובן המדויק הזה של “המון”.
חלק חמישי וקצר במיוחד שבו אני שואל ולא באמת מבין מה למדנו מכל זה
לסיכום, מה בעצם למדנו? האם למדנו שרוב הראשוניים הם קטנים? לא. האם למדנו שרוב הראשוניים הם גדולים? לא. אני עדיין לא בטוח מה המשמעות שאנחנו רוצים לתת למילים הללו. אבל כן למדנו כל מני דברים נחמדים בפני עצמם - מה זה ראשוניים, שיש אינסוף מהם, מה זה “כמעט כל” המספרים, מה משפט המספרים הראשוניים מספר לנו על הכמות של הראשוניים עד גודל כלשהו, על האופן שבו אפשר להגדיר יחסי סדר שונים על הטבעיים ובפרט יחס של חילוק במקום “קטן מ-“ הרגיל, ואיך אפשר להשתמש בטורים אינסופיים כדי להעריך עד כמה מהר סדרת מספרים כלשהי נהיית גדולה. כל אלו הם דברים מעניינים במתמטיקה, ושאלה היא מוצדקת אם היא נותנת לנו תירוץ לדבר על דברים מעניינים, אז אני בסך הכל סבבה עם השאלה “האם רוב הראשוניים הם קטנים?” כל עוד אנחנו זוכרים שהמטרה פה היא לא לענות עליה ובטח שלא לחשוב שיש לה תשובה חד משמעית, אלא להשתמש בה בתור תירוץ לראות דברים מעניינים באמת.
נהניתם? התעניינתם? אם תרצו, אתם מוזמנים לתת טיפ: