נוסחת ההיפוך של מביוס

נוסחת ההיפוך הקלאסית

נתחיל מדוגמה. ככה יהיה הרבה יותר קל להבין מה אני רוצה. בפוסט הקודם הזכרתי את פונקציית אוילר \( \varphi\left(n\right) \) שלכל מספר טבעי מחזירה את מספר המספרים הקטנים ממנו שזרים לו. בנוסף לכל מעלותיה, היא מקיימת את התכונה היפה הבאה: \( \sum_{d|n}\varphi\left(d\right)=n \). כלומר, כל מספר טבעי שווה לסכום הערכים של פונקציית אוילר כל כל מחלקיו.

לנוסחה הזו יש הוכחה קומבינטורית פשוטה שלחלוטין לא רלוונטית לפוסט אז העצלנים יכולים לדלג עליה - נספור את כל המספרים מ-1 עד \( n \) (בדיוק \( n \)) בדרך קצת שונה - לכל מספר \( 1\le k\le n \), נסמן ב-\( N_{k} \) את מספרם של המספרים בין 1 ו-\( n \) שהמחלק המשותף המקסימלי שלהם ושל \( n \) הוא בדיוק \( k \), כלומר \( N_{k}=\left|\left\{ 1\le a\le n|\gcd\left(a,n\right)=k\right\} \right| \). בבירור אם \( k \) לא מחלק את \( n \) אז \( N_{k}=0 \); מהו \( N_{k} \) אם \( k|n \)? ובכן, זהו מספרם של המספרים מהצורה \( k,2k,3k,\dots,n \) שאין להם מחלק משותף גדול מ-\( k \) עם \( n \), כלומר מספרים מהצורה \( tk \) כך ש-\( t \) זר ל-\( \frac{n}{k} \) (תעצרו, תנשמו עמוק ותסבירו את זה לעצמכם - אם אתם לא מצליחים, לא נורא כי זה לא קשור ממש לפוסט). נסמן \( d=\frac{n}{k} \) ונקבל ש-\( N_{k}=\varphi\left(d\right) \), ומכאן נובעת הנוסחה.

יופי, בשביל מה זה היה טוב? ובכן, זו דוגמה לסיטואציה שבה יש לנו פונקציה מסובכת \( f \) שסכום שלה על פני המחלקים של \( n \) יוצא משהו פשוט יותר. פורמלית, זה אומר שקיימת פונקציה \( g\left(n\right) \) כך ש-\( g\left(n\right)=\sum_{d|n}f\left(d\right) \). היינו רוצים איכשהו “לחלץ” את \( f \) מתוך הנוסחה הזו ולכתוב אותה כפונקציה כלשהי של \( g \) הפשוטה יותר. נוסחת ההיפוך של מביוס נותנת לנו בדיוק את זה.

אפשר עכשיו פשוט להציג את הנוסחה, אבל חבל - אני רוצה לנצל את ההזדמנות כדי להכיר לכם מושג חדש, שממנו אפשר יהיה להגיע לנוסחה באופן טבעי יותר - קונבולוציית דיריכלה. קונבולוציה “רגילה” של שתי פונקציות \( f,g \) שמוגדרות על הטבעיים היא פונקציה חדשה \( h \) שמוגדרת כך: \( h\left(n\right)=\sum_{k=0}^{n}f\left(k\right)g\left(n-k\right) \). דוגמה קלאסית לסיטואציה מתמטית שבה קונבולוצייה רגילה צצה מאליה היא כפל של פולינומים: אם \( p\left(x\right)=\sum a_{i}x^{i} \) ו-\( q\left(x\right)=\sum b_{j}x^{j} \) אז כל מקדם של המכפלה שלהם הוא קונבולוציה: המקדם של \( x^{n} \) ב-\( p\left(x\right)q\left(x\right) \) הוא \( \sum_{k=0}^{n}a_{k}b_{n-k} \). שימו לב, שניתן לכתוב קונבולוציה גם עם חיבור ולא חיסור: \( h\left(n\right)=\sum_{k+r=n}f\left(k\right)g\left(r\right) \).

קונבולוציית דיריכלה היא דומה באופיה, רק שבמקום חיבור/חיסור משתמשים בכפל/חילוק, דהיינו אם \( h\left(n\right) \) היא קונבולוציית דיריכלה של \( f\left(n\right),g\left(n\right) \) אז

\( h\left(n\right)=\sum_{d\cdot e=n}f\left(d\right)g\left(e\right)=\sum_{d|n}f\left(d\right)g\left(\frac{n}{d}\right) \)

זה כבר טיפה מזכיר את מה שהלך למעלה.

בואו נסמן \( h=f*g \) כדי לומר ש-\( h \) היא קונבולוציית דיריכלה של \( f,g \). אז האלגבראיסט הפנימי שבנו מתלהב מכך שמצאנו פעולה חשבונית חדשה ודוחק בנו לחקור את התכונות שלה. למשל, \( \left(f*g\right)*h=f*\left(g*h\right) \) עבור שלוש פונקציות \( f,g,h \) כלשהן (שמוגדרות על טבעיים; זה תמיד ההקשר של הדיון), כך שקונבלוציית דיריכלה היא אסוציאטיבית. זה מגביר את ההתלהבות של האלגבראיסט הפנימי לשמיים כי הוא מקווה שיש לנו כאן חבורה, כלומר מבנה אלגברי שהפעולה שלו היא אסוציאטיבית, עם איבר יחידה, ועם הופכי לכל איבר. ובכן, איבר יחידה בהחלט יש: נסמן ב-\( \epsilon \) את הפונקציה שמקיימת \( \epsilon\left(1\right)=1 \) ו-\( \epsilon\left(n\right)=0 \) לכל \( n>1 \), אז קל מאוד לראות מההגדרה ש-\( \epsilon*f=f*\epsilon=f \).

וכעת, מה עם הופכי? ובכן, נניח שעבור \( f \) קיימת \( g \) כך ש-\( f*g=\epsilon \), זה אומר ש-\( \sum_{d|1}f\left(d\right)g\left(\frac{n}{d}\right)=1 \), כלומר \( f\left(1\right)g\left(1\right)=1 \); אבל אם \( f\left(1\right)=0 \) אז אבוד לנו - המשוואה הזו לעולם לא תתקיים. לכן תנאי הכרחי לכך ש-\( f \) יהיה הפיך הוא ש-\( f\left(1\right)\ne0 \). מסתבר שזה גם תנאי מספיק, אבל נעזוב את החיפוש אחר הופכי במקרה הכללי כרגע ובמקום זאת נתמקד בהופכי של פונקציה פשוטה במיוחד: הפונקציה שמחזירה 1 לכל קלט, שאסמן פשוט כ-\( \mathbb{I} \). את ההופכי שלה, שתכף נוכיח את קיומו, נסמן ב-\( \mu \) מסיבות היסטורית. אם כן, \( \mathbb{I}*\mu=\epsilon \). בואו נראה מה נובע מכך.

זכרו שהתחלנו את כל הסיפור מהמשוואה \( g\left(n\right)=\sum_{d|n}f\left(d\right) \). עם הטרמינולוגיה החדשה שלנו ניתן לנסח זאת בתור \( g=f*\mathbb{I} \). כעת נכפול את שני האגפים ב-\( \mu \), נשתמש באסוציאטיביות, ונקבל:

\( g*\mu=f*\left(\mathbb{I}*\mu\right)=f*\epsilon=f \)

במילים אחרות, \( g=f*\mathbb{I} \) אם ורק אם \( f=g*\mu \), ובניסוח המקורי שלנו \( g\left(n\right)=\sum_{d|n}f\left(d\right) \) אם ורק אם \( f\left(n\right)=\sum_{d|n}g\left(d\right)\mu\left(\frac{n}{d}\right) \). זוהי נוסחת ההיפוך של מביוס, והפונקציה \( \mu \) נקראת, בהתאם, פונקצית מביוס. בואו נבין איך היא נראית.

ראשית, \( \mu\left(1\right)=1 \) בבירור על פי ההגדרה, כי צריך שיתקיים \( \mu\left(1\right)\mathbb{I}\left(1\right)=1 \). שנית, לכל \( n>1 \) צריך שיתקיים \( 0=\epsilon\left(n\right)=\sum_{d|n}\mu\left(d\right)\mathbb{I}\left(\frac{n}{d}\right)=\sum_{d|n}\mu\left(d\right) \). כלומר, אם לסכם באופן קומפקטי, פונקציית מביוס חייבת לקיים \( \sum_{d|n}\mu\left(d\right)=\delta_{1n} \). מכאן אפשר להסיק בשלבים איך \( \mu \) נראית על כל מספר טבעי. נתחיל מהמספרים הקלים ביותר לטיפול בהקשר הזה (כמו שקורה לעתים קרובות ביותר בתורת המספרים) - ראשוניים, אם \( d|p \) עבור \( p \) ראשוני, אז \( d=1 \) או \( d=p \), ולכן הנוסחה שלעיל מתורגמת עבורנו ל-\( 0=\mu\left(1\right)+\mu\left(p\right) \), כלומר \( \mu\left(p\right)=-1 \) לכל ראשוני. אפשר להמשיך ולטפל בצורה דומה במכפלות של ראשוניים, אבל אני לא מכיר דרך אלגנטית במיוחד להציג את הניתוח הזה ולכן אקפוץ למסקנה הסופית: \( \mu \) היא כפלית על מספרים זרים. מה זה אומר? שאם \( a,b \) הם שני מספרים ללא מחלק משותף גדול מ-1, אז \( \mu\left(ab\right)=\mu\left(a\right)\mu\left(b\right) \) (באופן הולם למדי, גם \( \varphi \) של אוילר היא כזו). ומה אם \( a,b \) לא זרים? גם אז המצב פשוט: \( \mu\left(ab\right)=0 \).

כעת אפשר להסיק נוסחה עבור \( \mu \). נניח ש-\( n=p_{1}p_{2}\cdots p_{k} \) כאשר כל הראשוניים הללו שונים זה מזה, אז \( \mu\left(n\right)=\prod_{i=1}^{k}\mu\left(p_{k}\right)=\left(-1\right)^{k} \); ואילו אם \( n \) מכיל את אותו ראשוני פעמיים בפירוק שלו, \( \mu\left(n\right)=0 \).

לא קשה לראות שאכן \( \sum_{d|n}\mu\left(d\right)=0 \) בהגדרה זו לכל \( n>0 \); אם \( n=p_{1}^{t_{1}}\cdots p_{k}^{t_{k}} \) הרי שהסכום יהיה רק על מחלקים \( d \) מהצורה \( p_{1}^{e_{1}}\cdots p_{k}^{e_{k}} \) עם \( e_{i}\in\left\{ 0,1\right\} \) (כי היתר יתאפסו), ועבור כל מכפלה כזו, \( \mu\left(p_{1}^{e_{1}}\cdots p_{k}^{e_{k}}\right) \) שווה למינוס 1 בחזקת מספר ה-\( e_{i} \)-ים שהם 1, ולכן \( \sum_{d|n}\mu\left(d\right)=\sum_{i=0}^{k}{k \choose i}\left(-1\right)^{i}=\left(1-1\right)^{k}=0 \) (המעבר האחרון הוא הבינום של ניוטון). כלומר, \( \mu \) שנתתי אכן מקיימת את מה שנדרש ממנה, וזה מבטיח שהיא אכן תהיה ההופכית של \( \mathbb{I} \) ושנוסחת ההיפוך של מביוס תתקיים.

יפה, זה סוגר את העניין בכל הנוגע לנוסחת ההיפוך ה”קלאסית” של מביוס, זו שרואים בספרי תורת המספרים. אבל יש כאן יותר מזה. נתחיל מלהיזכר במה שראינו על ההכללה של עקרון ההכלה וההפרדה בפוסט הקודם. שם היו לנו שתי פונקציות \( f,g \) כך שהתקיים

\( g\left(A\right)=\sum_{B\supseteq A}f\left(B\right) \)

ואת הנוסחה הזו “הפכנו” לקבלת

\( f\left(A\right)=\sum_{B\supseteq A}\left(-1\right)^{\left|B-A\right|}g\left(B\right) \)

הדמיון כאן לנוסחת ההיפוך של מביוס אדיר. במקום \( d|n \) יש לנו \( B\supseteq A \) כש-\( B \) על תקן \( d \) ו-\( A \) על תקן \( n \), ובמקום \( \mu\left(d\right) \) יש לנו \( \left(-1\right)^{\left|B-A\right|} \), אבל זה כל ההבדל. המבנה הרעיוני זהה. יתר על כן, הדמיון בין חלוקה והכלה של קבוצות הוא משהו שכבר ראינו בבלוג פעם, בהקשר של תורת המספרים האלגברית; אם נגדיר את \( A \) כקבוצת “כל המספרים המתחלקים על ידי \( n \)” ואת \( B \) כקבוצת “כל המספרים המתחלקים על ידי \( d \)” אז \( B\supseteq A \) שקול לאמירה \( d|n \) (אבל אז לא ברור מהו \( \left|B-A\right| \) שיהיה אינסופי). הדמיון הרב מאוד בין שני המקרים לא נגמר בהם; הוא נובע מכך ששניהם מקרים פרטיים של נוסחת היפוך כללית ביותר, שתקפה לכל מבנה מתמטי שמכליל את התכונות של “הכלה” או של “חלוקה” שרלוונטיות לעניינו - ולמבנה כזה קוראים קבוצה סדורה חלקית (קס”ח).

קס"חים

קבוצות סדורות חלקית הן מהמבנים הבסיסיים ביותר במתמטיקה, והצורה הפשוטה ביותר שבה אנו מתארים את הרעיון של סדר. בואו ניתן את ההגדרות האבסטרקטיות התורת-קבוצתיות: קבוצה \( X \) הוא סדורה חלקית עם יחס שמסומן ב-\( \le \) (יחס כאן הוא אוסף של זוגות \( \left(a,b\right) \) כך ש-\( a\in X \) וגם \( b\in X \); אנחנו מסמנים \( a\le b \)) אם \( \le \)מקיים את שלוש התכונות הבאות:

  1. (רפלקסיביות) \( a\le a \) לכל \( a\in X \)
  2. (אנטי-סימטריה) \( a\le b \) וגם \( b\le a \) גורר \( a=b \)
  3. (טרנזיטיביות) \( a\le b \) וגם \( b\le c \) גורר \( a\le c \)

צריך מייד להבהיר ש-\( \le \) הוא סימון של היחס. זה לא “גדול או שווה” במשמעות הרגילה שלו. מה שכן, היחס “גדול או שווה” הוא יחס סדר חלקי, אולי אחד מהפשוטים ביותר, ומכאן הסימון. אם כן, \( \mathbb{N} \) עם יחס הסדר “גדול או שווה מ-“ היא דוגמה לקבוצה סדורה חלקית; אבל \( \mathbb{N} \) עם יחד הסדר “מחלק את”, כלומר אם \( a|b \) מסמנים זאת \( a\le b \) היא דוגמה מעניינת הרבה יותר. ברור שזה אכן יחס סדר חלקי כי \( a|a \) לכל \( a\in\mathbb{N} \), וגם שתי התכונות האחרות נובעות די בקלות מההגדרות; אבל בניגוד ליחס הקטן-או-שווה הרגיל, עבור יחס החלוקה יש לנו איברים שאינם ניתנים להשוואה. למשל, 2 ו-3 לא מחלקים זה את זה ולכן לא מתקיים לא \( 2\le3 \) וגם לא \( 3\le2 \) עבור יחס סדר זה. קבוצה סדורה חלקית שבה כל שני איברים כן ניתנים להשוואה נקראת קבוצה סדורה מלאה, או סדורה לינארית.

שימו לב שקס”ח היא זוג - צריך לציין גם את \( X \) וגם את \( \le \), כי על אותו \( X \) אפשר להגדיר הרבה יחסי סדר שונים. למרות זאת רוב הזמן אני אכתוב כאן “קס”ח \( X \)” ותו לא, מתוך הנחה שמה שאני אומר תקף לכל יחס סדר חלקי שנצמיד ל-\( X \) (לפעמים עם דרישות נוספות שאציין).

אם יש לנו קבוצה \( X \) כלשהי, אז אפשר להגדיר על אוסף תת-הקבוצות שלה \( P\left(X\right) \) יחס סדר על ידי הכלה (כלומר, לכל \( A,B\subseteq X \) מגדירים \( A\le B \) אם \( A\subseteq B \)), וגם, באופן מעניין, על ידי הכלה הפוכה, כלומר \( A\le B \) אם \( B\supseteq A \) (אומרים שהקס”ח שסדורה על ידי הכלה הפוכה דואלית לזו שסדורה על ידי הכלה רגילה; אפשר להגדיר דואלי שבו יחס הסדר מתהפך לכל קס”ח). אם כן, המושג של יחס סדר חלקי תופס את ה”עולם” שבו מתקיימות שתי הנוסחאות שהצגתי למעלה, ועכשיו נותר רק לברר איך נראית הנוסחה הכללית ביותר. כדי לספק את הסקרנות שלכם אני אציג אותה כבר עכשיו, ואז נוכל לחשוב איך להציג אותה בצורה מעניינת, על ידי הבנה טובה יותר של קבוצות סדורות חלקית (המטרה שלנו תהיה להכליל במובן מסויים את גישת הקונבולוציה של נוסחת ההיפוך הקלאסית).

ובכן, נוסחת ההיפוך הכללית אומרת שאם \( \left(X,\le\right) \) היא קבוצה סדורה חלקית עם יחס הסדר \( \le \) אשר מקיימת תכונת סופיות מסויימת (כל אידאל סדר ראשי הוא סופי - זה יתבהר בהמשך) אז אם יש לנו שתי פונקציות \( f,g:X\to\mathbb{C} \) אשר מקיימות \( g\left(x\right)=\sum_{y\le x}f\left(y\right) \), אז מתקיים \( f\left(x\right)=\sum_{y\le x}g\left(y\right)\mu\left(y,x\right) \), כאשר \( \mu \) היא פונקצית מביוס של הקס”ח \( X \). איך בדיוק היא מוגדרת - גם את זה נבין בהמשך. לכל קס”ח יש את פונקצית המביוס שלו, וכבר ראינו שתיים: את זו של הקס”ח עם יחס החלוקה, שהייתה \( \mu \) הקלאסית; ואז זו של הקס”ח עם יחס ההכלה ההפוך של קבוצות, שקיימה \( \mu\left(B,A\right)=\left(-1\right)^{\left|B-A\right|} \).

מכיוון שאני רוצה להציג את נוסחת ההיפוך ופונקצית מביוס כנובעים מרעיון עמוק יותר, מעין הכללה של קונבולוציית דיריכלה, אני צריך לתת עוד כמה הגדרות שקשורות לקס”חים. ראשית, לכל שני איברים \( x,y\in X \) אפשר להגדיר את הקטע \( \left[x,y\right]=\left\{ z\in X|x\le z\le y\right\} \), כלומר כל האיברים שניתנים להשוואה עם \( x,y \) ונמצאים ביניהם, כולל הם עצמם. אם אין אף איבר בין \( x \) ל-\( y \), כלומר \( \left[x,y\right]=\left\{ x,y\right\} \), אומרים ש-\( y \) מכסה את \( x \). על \( X \) אומרים שהיא סופית מקומית אם כל קטע ב-\( X \) הוא סופי (כך למשל \( \mathbb{Z} \) עם יחס הסדר הרגיל היא סופית מקומית, אבל \( \mathbb{Q} \) עם אותו יחס סדר בדיוק איננה).

שרשרת היא פשוט קבוצה של איברים ב-\( X \) שכולם ניתנים להשוואה זה עם זה (תת-קבוצה סדורה מלאה של \( X \)), ושמה מגיע מכך שאפשר לכתוב את איבריה כ-\( x_{1}\le x_{2}\le\dots\le x_{n} \) (במקרה שבו השרשרת סופית, אבל ממילא רק זה יעניין אותנו כאן). אנטי-שרשרת היא בדיוק ההפך מכך - קבוצה של איברים ב-\( X \) שלא ניתן להשוות אף זוג מהם - למשל, אם ניקח את הטבעיים עם יחס החלוקה, אז כל קבוצה של ראשוניים היא אנטי-שרשרת.

אידאל סדר \( I \) הוא תת-קבוצה של \( X \) בעלת התכונה שאם \( x\in I \) ו-\( y\le x \) אז \( y\in X \) (מי שמכיר קצת אלגברה מופשטת ודאי רואה את הדמיון להגדרה ה”קלאסית” של אידאל). יש קשר בין אידאלי סדר ואנטי-שרשראות: אם ניקח את כל האיברים המקסימליים באידאל סדר \( I \) כלשהו (איברים \( x\in I \) כך שלא קיים \( y\in I \) כך ש-\( x\le y \)) אז נקבל אנטי-שרשרת, ומצד שני אם ניקח אנטי-שרשרת \( A \) ונגדיר \( I=\left\{ y\in X|\exists x\in A,y\le x\right\} \) נקבל אידאל סדר, ואם \( X \) סופית זה נותן לנו התאמה חח”ע ועל בין אנטי-שרשרות ואידאלי סדר. באופן כללי אם בהינתן \( A \) מגדירים ממנה \( I \) כפי שתיארתי כאן, אז אומרים ש-\( A \) יוצרת את האידאל \( I \); ואידאל \( I \) הוא אידאל סדר ראשי אם הוא נוצר בדיוק על ידי איבר אחד, כלומר קיים \( x\in A \) כך ש-\( I=\left\{ y\le x|y\in X\right\} \). במקרה הזה מסמנים לעתים \( I=\left\langle x\right\rangle \). שוב, למי שבקיא באלגברה מופשטת הדמיון לאידאלים “קלאסיים” מאוד ברור כאן.

קונבולוצייה והיפוך, הגרסה המוכללת

אוקיי, הגענו לאקשן. בואו ניקח קבוצה סדורה חלקית \( X \) שהיא סופית מקומית, ונגדיר פונקציות על קבוצת כל הקטעים ב-\( X \) (פונקציות ממשיות, אבל אפשר גם עבור שדות אחרים). במילים אחרות, פונקציות שנראות ככה: \( f\left(\left[x,y\right]\right) \). לצורך פשטות אפשר לחשוב עליהן כפונקציות בשני משתנים: \( f\left(x,y\right) \), אבל הכרחי שיתקיים \( x\le y \) אחרת אין משמעות ל-\( \left[x,y\right] \).

בין כל זוג פונקציות כזה אפשר להגדיר פעולת כפל שתכליל את קונבולוציית דיריכלה, אבל נמאס לי מהכוכב המעצבן הזה אז אני פשוט אשתמש בסימון הסטנדרטי לכפל: שום סימון. אם \( f,g \) הן פונקציות מקבוצת הקטעים של \( X \) אל \( \mathbb{R} \), אז נגדיר:

\( fg\left(x,y\right)=\sum_{x\le z\le y}f\left(x,z\right)g\left(z,y\right) \)

כאן העובדה ש-\( X \) סופית מקומית היא קריטית; אחרת הסכום הזה לא בהכרח היה סופי.

בואו נראה איך המושג הזה מכליל את זה של תחילת הפוסט. שם התעסקנו עם פונקציות שמוגדרות על הטבעיים; כאן \( X=\mathbb{N} \) ויחס הסדר הוא חלוקה, כלומר \( a\le b \) פירושו \( a|b \). כעת, אם \( f \) היא פונקציה שמוגדרת על הטבעיים, אפשר להגדיר אותה גם על קטעים באופן הבא: \( f\left(a,b\right)=f\left(\frac{b}{a}\right) \) (זכרו: בגלל ש-\( \left[a,b\right] \) הוא קטע, \( a\le b \) ולכן \( a|b \)). לכן בפרט \( f\left(a\right)=f\left(1,a\right) \), ומההגדרה למעלה נקבל:

\( fg\left(n\right)=fg\left(1,n\right)=\sum_{1|d|n}f\left(1,d\right)g\left(d,n\right)=\sum_{d|n}f\left(d\right)g\left(\frac{n}{d}\right) \)

הופה! בדיוק ההגדרה של קונבולוציית דיריכלה.

אפשר להגדיר \( \epsilon \) כמו קודם: \( \epsilon\left(x,x\right)=1 \) לכל \( x\in X \), ולכל \( x\ne y \) \( \epsilon\left(x,y\right)=0 \) (למעשה, \( \delta \) מתאים פה יותר, למי שזוכר את הדלתא של קרונקר, אבל לא חשוב). לא קשה לראות ש-\( \epsilon \) היא איבר יחידה ביחס לכפל הפונקציות שהגדרתי לעיל. גם לא קשה לראות שהכפל אסוציאטיבי.

את מקומה של הפונקציה שסימנתי אז \( \mathbb{I} \) תופסת עכשיו פונקציית זטא: \( \zeta\left(x,y\right)=1 \) לכל \( x\le y \). רגע, למה זטא? אודה ואתוודה - לא יודע, אני לא בטוח מה הקשר של הפונקציה הזו לשאר פונקציות הזטא הקיימות, אבל אלו הסימונים. באופן בלתי מפתיע, מגדירים כעת את פונקצית מביוס של הקס”ח \( X \) בתור ההופכית של \( \zeta \), כלומר \( \zeta\mu=\mu\zeta=\epsilon \). כעת, נוסחת ההיפוך של מביוס, בתיאורה האבסטרקטי ביותר, היא פשוט האבחנה הסופר-טריוויאלית ש- \( f\zeta=g \) אם ורק אם \( f=g\mu \) (רק שיש כאן טוויסט כאן שתכף אסביר).

קרוב לודאי שאתם מרגישים שיצאתי יותר מדי בזול מכל העניין. איפה אני מוכיח משהו, בכלל? אתם כמובן צודקים - מה שחסר לי הוא הוכחה ש-\( \zeta \)הפיכה בכלל. כדי לטפל בכך אוכיח משהו כללי יותר - שפונקציה \( f \) היא הפיכה אם ורק אם \( f\left(x,x\right)\ne0 \) לכל \( x\in X \). חזרנו אל “החיפוש אחרי הופכי במקרה הכללי” של תחילת הפוסט, רק שהפעם אני לא הולך להתחמק.

למרבה המזל, האתגר לא גדול במיוחד. נתונה לי \( f \) ואני רוצה למצוא \( g \) כך ש-\( fg=\epsilon \). כלומר, כך ש-\( fg\left(x,x\right)=\epsilon\left(x,x\right)=1 \) לכל \( x \), ומכיוון שעל פי הגדרה \( fg\left(x,x\right)=f\left(x,x\right)g\left(x,x\right) \), הרי ש-\( g\left(x,x\right)=\left(f\left(x,x\right)\right)^{-1} \) (כאן אני נעזר בכך שהערכים שהפונקציות מקבלות שייכים לשדה), ואנו רואים גם למה הכרחי שיתקיים \( f\left(x,x\right)\ne0 \).

כעת, לכל \( x\ne y \) שניתנים להשוואה צריך להתקיים \( fg\left(x,y\right)=\epsilon\left(x,y\right)=0 \), ולכן על פי הנוסחה \( \sum_{x\le z\le y}f\left(x,z\right)g\left(z,y\right)=0 \). בואו נבודד מהסכום הזה את האיבר שמתקבל כש-\( z=x \) ונעביר אגף, נקבל ש:

\( g\left(x,y\right)=-\left(f\left(x,x\right)\right)^{-1}\sum_{x<z\le y}f\left(x,z\right)g\left(z,y\right) \).

הנוסחה הזו מספיקה כדי להגדיר את \( g \) לכל קטע באופן רקורסיבי. זה לא מבטיח לנו נוסחה פשוטה יותר עבור \( g \), ומכאן בפרט שאין לנו תמיד נוסחה פשוטה עבור \( \mu \). מה כן יש לנו? ובכן, אם נציב את \( \zeta \) בתור \( f \) בנוסחאות הללו, נקבל ש-\( \mu \) מתוארת על ידי הנוסחאות הבאות:

\( \mu\left(x,x\right)=1 \) לכל \( x\in X \).

\( \mu\left(x,y\right)=-\sum_{x<z\le y}\mu\left(z,y\right)=-\sum_{x\le z<y}\mu\left(x,z\right) \) לכל \( x<y \).

את נוסחת ההיפוך עצמה ניתן לתאר עם סכומים באופן הבא: אם \( f\zeta=g \) זה אומר ש-\( g\left(x,y\right)=\sum_{x\le z\le y}f\left(x,z\right) \), ולכן \( f\left(x,y\right)=\sum_{x\le z\le y}g\left(x,z\right)\mu\left(z,y\right) \).

כזכור, נוסחת ההיפוך דיברה על פונקציות שמוגדרות לא על קטעים, אלא על איברים. היא אמרה שמתקיים

\( g\left(x\right)=\sum_{y\le x}f\left(y\right) \)

אם ורק אם

\( f\left(x\right)=\sum_{y\le x}g\left(y\right)\mu\left(y,x\right) \)

בניסוח הזה אנחנו חייבים שב-\( X \) כל אידאל סדר ראשי יהיה סופי פשוט כי אחרת הסכום \( \sum_{y\le x} \) (כאשר \( x \) קבוע - כלומר, הסכום הוא בדיוק על איברי אידאל הסדר שנוצר על ידי \( x \)) איננו סופי. למעשה, יש כאן נקודה עדינה למדי - אותן \( f,g \) שאני מדבר עליהן כאן מוגדרות על איברים של \( X \), לא על קטעים. אין בעיה של ממש לטפל בעניין הזה אבל אני חושב שהתעללתי בקוראים מספיק ואסיים כאן.


נהניתם? התעניינתם? אם תרצו, אתם מוזמנים לתת טיפ:

Buy Me a Coffee at ko-fi.com