משוואות לינאריות - הקרב האחרון
בפוסטים הקודמים שלי על אלגברה לינארית הסברתי קצת איך אפשר לפתור משוואות לינאריות על ידי הבאה שלהן לצורה פשוטה ככל האפשר, ואז הסברתי שבעזרת מטריצות אפשר לחשוב על ה”צורה הפשוטה ככל האפשר” הזו בתור סוג מיוחד של מטריצה, אבל זה עדיין לא סיים את הסיפור. בפוסט הזה אני רוצה לתת את התשובה הסופית והחד משמעית לשאלה - איך פותרים מערכת של משוואות לינאריות?
בסימונים שלנו, מערכת של \( n \) משוואות לינאריות עם \( m \) משתנים \( x_{1},\dots,x_{m} \) מתוארת על ידי מטריצה \( A \) מסדר \( n\times m \), כך ש-\( A_{ij} \) הוא המקדם של המשתנה \( x_{j} \) במשוואה ה-\( i \) (כלומר, השורות מייצגות משוואות והעמודות מייצגות מקדמים). את המערכת כולה אפשר לכתוב כ-\( A\overline{x}=\overline{c} \) כאשר \( \overline{x}=\left(x_{1},x_{2},\dots,x_{m}\right) \) הוא וקטור המשתנים, ו-\( \overline{c}=\left(c_{1},\dots,c_{n}\right) \) הוא וקטור של האגף הימני של המשוואה: כלומר, המשוואה ה-\( i \) היא מהצורה \( A_{i1}x_{1}+A_{i2}x_{2}+\dots A_{im}x_{m}=c_{i} \). אם רוצים להיות ממש ממש מדוייקים, אז \( \overline{x} \) ו-\( \overline{c} \) שניהם חייבים להיות וקטורי עמודה, כלומר \( \overline{x}=\left[\begin{array}{c}x_{1}\\\vdots\\x_{m}\end{array}\right] \) ו-\( \overline{c}=\left[\begin{array}{c}c_{1}\\\vdots\\c_{n}\end{array}\right] \).
הדבר הראשון שאני רוצה שנשים לב אליו הוא שלמשוואה מהצורה \( A\overline{x}=\overline{0} \), כלומר כזו שבה \( \overline{c} \) פשוט כולו אפסים, יש חשיבות מיוחדת. משוואה כזו נקראת משוואה הומוגנית (או מערכת משוואות הומוגנית - אני פשוט חושב כבר על מערכות של משוואות בתור משוואה מטריציונית אחת). הסיבה לחשיבות שלה היא זו: נניח שיש לנו משוואה כללית \( A\overline{x}=\overline{c} \) ונניח ש-\( v \) ו-\( u \) הם שני וקטורי פתרונות של המשוואה, כלומר \( Av=\overline{c} \) וגם \( Au=\overline{c} \) (למה אין קו מעל ה-\( u,v \)? כי \( u,v \) בדרך כלל מסמנים וקטורים, להבדיל מ-\( c \) שבדרך כלל מסמן מספר בודד; בקרוב אשמיט את הקו גם מעל \( \overline{0} \) כי מעצבן לכתוב אותו כל הזמן כשברור שהכוונה לוקטור). אז מתקיים ש-\( Au-Av=\overline{0} \) על פי ההגדרה שנתתי לחיבור (ולכן גם לחיסור) מטריצות; ומכיוון שכללי החיבור והכפל של מטריצות מקיימים את חוג הפילוג, נובע מכך ש-\( A\left(u-v\right)=0 \). במילים אחרות, אם \( u,v \) הם שניהם פתרונות למערכת משוואות כלשהי, לא בהכרח הומוגנית, עם מטריצת מקדמים \( A \), אז \( u-v \) הוא פתרון למערכת המשוואות ההומוגנית עם מטריצת המקדמים \( A \).
זה מוביל אותנו לאבחנת המחץ הבאה: אם \( v \) הוא פתרון של המשוואה \( A\overline{x}=\overline{c} \), אז כל פתרון של המשוואה הזו ניתן לכתיבה בתור \( v+w \) כאשר \( w \) הוא פתרון של המשוואה ההומוגנית \( A\overline{x}=\overline{0} \)! בואו נבהיר לעצמנו שוב למה: אם \( v \) הוא הפתרון הנתון שלנו, ו-\( u \) הוא פתרון כלשהו של המשוואה \( A\overline{x}=\overline{c} \) אז אפשר להגדיר וקטור חדש \( w=u-v \). כפי שראינו, \( w \) יהיה פתרון של המשוואה ההומוגנית, ומכיוון ש-\( w=u-v \) אז על ידי העברת אגפים נקבל ש-\( u=v+w \), כפי שהבטחתי. גם ההפך נכון: אם \( v \) הוא פתרון של \( A\overline{x}=\overline{c} \) ו-\( w \) הוא פתרון של המשוואה ההומוגנית המתאימה, אז \( v+w \) גם הוא פתרון של \( A\overline{x}=\overline{c} \): זאת מכיוון ש-\( A\left(v+w\right)=Av+Aw=\overline{c}+\overline{0}=\overline{c} \).
במילים אחרות, אם אנחנו רוצים לדעת מהם כל הפתרונות של \( A\overline{x}=\overline{c} \), מספיק לנו למצוא פתרון פרטי יחיד למשוואה הזו, ולמצוא את כל הפתרונות למשוואה ההומוגנית \( A\overline{x}=\overline{0} \). בלשון ציורית יותר (שיש לה משמעות גאומטרית קונקרטית), אוסף הפתרונות של \( A\overline{x}=\overline{c} \) הוא בדיוק אוסף הפתרונות של \( A\overline{x}=\overline{0} \) כשהוא מוזז על ידי חיבור עם פתרון פרטי כלשהו.
בואו נקדיש אם כן כמה דקות להבנה איך מוצאים פתרון פרטי יחיד למשוואה \( A\overline{x}=\overline{c} \), ולאחר מכן נוכל לשכוח לנצח מקיומה ולעבור לדבר רק על משוואות הומוגניות, שכפי שיתברר בקרוב הן מרתקות פי כמה וכמה.
הצעד הראשון בדרך לפתרון משוואה היא לדרג את \( A \) ולתקן את \( \overline{c} \) בהתאם, אז בואו נניח שכבר עשיתי זאת: נותר להבין איך מוצאים פתרון למשוואה \( A\overline{x}=\overline{c} \) כאשר \( A \) היא מטריצה מצומצמת. כמה דוגמאות יקלו מאוד על ההבנה של מה שהולך כאן. נתחיל ממערכת ממש פשוטה:
\( \left[\begin{array}{ccc}1 & 0 & 0\\0 & 1 & 0\\0 & 0 & 1\end{array}\right]\left[\begin{array}{c}x_{1}\\x_{2}\\x_{3}\end{array}\right]=\left[\begin{array}{c}5\\2\\7\end{array}\right] \)
כאן המטריצה המצומצמת היא פשוט מטריצה אלכסונית, והפתרון נובע מאליו: \( x_{1}=5 \) ו-\( x_{2}=2 \) ו-\( x_{3}=7 \) - אלו פשוט שלוש המשוואות שמיוצגת על ידי המערכת.
נסכם את כלל האצבע שקיבלנו כאן: אם במטריצה שלנו יש שורה שכולה אפסים פרט ל-1 בודד, אז המשתנה שמתאים לעמודה שבה מופיע ה-1 שווה בדיוק לערך המספרי שבאגף ימין של המשוואה.
כעת נעבור למערכת קצת יותר בעייתית:
\( \left[\begin{array}{ccc}1 & 0 & 0\\0 & 1 & 0\\0 & 0 & 0\end{array}\right]\left[\begin{array}{c}x_{1}\\x_{2}\\x_{3}\end{array}\right]=\left[\begin{array}{c}5\\2\\7\end{array}\right] \)
זו אותה מערכת כמו קודם רק שעכשיו השורה האחרונה במטריצה המצומצמת כולה אפסים - זה בהחלט עשוי לקרות. במקרה הזו למערכת פשוט אין פתרון: המשוואה השלישית שמיוצגת על ידי המטריצה היא המשוואה \( 0=7 \) שאין לה פתרון. למי שעדיין מוזר לו שדברים כאלו עשויים להתרחש, תסתכלו על המערכת הבאה של שתי משוואות בשני נעלמים:
\( x_{1}+x_{2}=7 \)
\( x_{1}+x_{2}=0 \)
המערכת הזו היא פשוט דרך מסורבלת לכתוב \( 0=7 \) שוב, אבל הפעם עם משתנים. אם נדרג את מטריצת המקדמים של המשוואה נגיע אל \( \left[\begin{array}{cc}1 & 1\\0 & 0\end{array}\right]\left[\begin{array}{c}x_{1}\\x_{2}\end{array}\right]=\left[\begin{array}{c}7\\-7\end{array}\right] \) שבבירור אין לה פתרון.
אם כן, נסכם את כלל האצבע: אם במטריצה המדורגת שלנו יש שורת אפסים שבה באגף ימין של המשוואה יש מספר שאינו אפס, למערכת כולה אין פתרון. אם יש שורת אפסים במטריצה כך שגם באגף ימין יש אפס, זה לא אומר כלום; השורה הזו לא אומרת שאין פתרון למשוואה, אבל היא גם לא מסייעת לנו במציאת הפתרון. סיטואציה כזו מתארת מצב שבו יש לנו “עודף אינפורמציה” במערכת המקורית - משוואות שאומרות את אותו הדבר, אולי בצורה קצת שונה. למשל, המערכת הזו:
\( x_{1}+x_{2}=2 \)
\( 4x_{1}+4x_{2}=8 \)
אלו שתי משוואות שהן למעשה אותו דבר, ובדירוג של המטריצה המתאימה נקבל שורת אפסים ששווה לאפס.
סיטואציה עוד יותר מורכבת שעלולים להיתקל בה היא זו:
\( \left[\begin{array}{cccc}1 & & & 2\\ & 1 & & 0\\ & & 1 & 3\end{array}\right]\left[\begin{array}{c}x_{1}\\x_{2}\\x_{3}\\x_{4}\end{array}\right]=\left[\begin{array}{c}5\\3\\8\end{array}\right] \)
(כשאני מתעצל ולא כותב תוכן של תא במטריצה הכוונה היא תמיד לכך שהוא 0)
מה הולך כאן? המטריצה היא מצומצמת, אבל לא אלכסונית, ויש עמודה “מכוערת” שנותרה בחיים גם אחרי הצמצום - העמודה שמתאימה למשתנה \( x_{4} \). סיטואציה כמו זו מתאימה למצב שבו יש יותר משתנים ממשוואות, ולכן יש אינסוף פתרונות. מה שעושים כאן הוא לחשוב על המשתנה הרביעי \( x_{4} \) בתור “פרמטר” - אנחנו שואלים את עצמנו - אם \( x_{4}=t \), מה חייבים להיות הערכים ששאר המשתנים מקבלים?
מהמשוואה הראשונה נקבל ש-\( x_{1}+2x_{4}=5 \), כלומר אם \( x_{4}=t \) אז \( x_{1}=5-2t \). בדומה, מהמשוואה השלישית נקבל ש-\( x_{3}=8-3t \). המשוואה השניה נותנת לנו \( x_{2}=3 \) בלי קשר לערכו של \( x_{4} \). כמו כן, אם היו עוד עמודות במטריצה, היינו מקבלים עוד משתנים שצריך לחשוב עליהם כפרמטרים. הנקודה היא שלכל הצבת ערכים במשתנים שהם פרמטרים, אנחנו מקבלים באופן חד ערכי את הערכים של \( x_{1},x_{2},x_{3} \) בפתרון המתאים; ובפרט אם אנחנו רק רוצים פתרון פרטי של המערכת אפשר לבחור להציב 0 בכל המשתנים הפרמטריים. במקרה שלנו הצבה כזו תיתן לנו את הפתרון הפרטי \( x_{1}=5,x_{2}=3,x_{3}=8 \) ו-\( x_{4}=0 \).
באופן כללי, כל פתרון של המשוואה הזו הוא מהצורה \( \left(5-2t,3,8-3t,t\right) \). שימו לב שאפשר לכתוב את זה גם כ-\( \left(5,3,8,0\right)+\left(-2t,0,-3t,t\right) \), וש-\( \left(-2t,0,-3t,t\right) \) הוא פתרון כללי למשוואה ההומוגנית \( \left[\begin{array}{cccc}1 & & & 2\\ & 1 & & 0\\ & & 1 & 3\end{array}\right]\left[\begin{array}{c}x_{1}\\x_{2}\\x_{3}\\x_{4}\end{array}\right]=\left[\begin{array}{c}0\\0\\0\end{array}\right] \); כך בפועל אנחנו רואים איך פתרונות למשוואה הלא הומוגנית נכתבים כסכום של פתרון פרטי של המשוואה הלא הומוגנית ופתרון עבור המשוואה ההומוגנית.
לפעמים קצת פחות ברור מי המשתנים התלויים ומי המשתנים הפרמטריים, למשל כאן:
\( \left[\begin{array}{cccc}1 & 1 & 0 & 0\\0 & 0 & 1 & 0\\0 & 0 & 0 & 1\end{array}\right]\left[\begin{array}{c}x_{1}\\x_{2}\\x_{3}\\x_{4}\end{array}\right]=\left[\begin{array}{c}5\\3\\8\end{array}\right] \)
זוהי מטריצה מצומצמת, אבל כאן \( x_{2} \) הוא משתנה פרמטרי, לא משתנה תלוי (אם כי זו הבדלה קצת קלושה במקרה הזה כי באותה מידה אפשר לחשוב על \( x_{1} \) בתור המשתנה הפרמטרי). אם תזכרו, ההגדרה של מטריצה מצומצמת כללה דרישה לפיה בכל שורה, הכניסה הראשונה שאיננה אפס תהיה 1, ושהעמודה שבה שוכנת כניסה זו תכיל אפסים בכל מקום מלבד השורה שבה היא 1. הכניסה הזו מתאימה למשתנה תלוי; החשיבות כאן היא בכך שמובטח לנו שאותו משתנה לא יופיע שוב באף אחת מהמשוואות האחרות.
אם כן, כלל האצבע הוא כזה: בהינתן המטריצה המצומצמת, בכל שורה שאיננה שורת אפסים, מצא מיהו המשתנה שמתאים לכניסה הראשונה שאיננה 0. לאחר שמצאת את כל המשתנים הללו, הצב 0 בכל המשתנים האחרים, ו”קרא” את הפתרון עבור המשתנים התלויים מתוך המשוואות שהתקבלו לאחר ההצבה הזו. זה הכל.
זה סוגר את השאלה איך פותרים משוואות לינאריות לחלוטין, אבל כל העניין הזה עם “משתנים תלויים” ובלתי תלויים ופרמטרים כנראה עדיין נראה מוזר למדי למי שלא מכיר אותו. בואו נעבור לדבר עליו קצת יותר ברצינות, ולשם כך נדבר מכאן והלאה רק על משוואות הומוגניות.
מה שנחמד במשוואות הומוגניות, להבדיל ממשוואות כלליות, הוא שקל לבנות פתרונות חדשים מתוך פתרונות קיימים. אם \( Av=0 \) ו-\( c \) הוא מספר כלשהו, אז גם \( A\left(cv\right)=0 \), כאשר \( cv \) מייצג הכפלה של כל כניסה של \( v \) במספר \( c \) - לפעולה כזו קוראים כפל של וקטור בסקלר. הוקטור הוא \( v \) והסקלר הוא \( c \); מכאן ואילך אשתמש במילה “סקלר” כדי לתאר מספר, כשהמטרה בשימוש ב”סקלר” היא לחדד את ההבדל שבינו ובין וקטור.
כמו כן, אם \( v,u \) שניהם פתרונות של המערכת ההומוגנית ש-\( A \) מתאר, אז גם סכומם הוא פתרון כי \( A\left(v+u\right)=Av+Au=0+0=0 \). במילים: קבוצת הפתרונות של משוואה הומוגנית סגורה לפעולות של חיבור וכפל בסקלר. בסוד אגלה כבר עכשיו ששתי התכונות הללו הופכות את קבוצות הפתרונות הזו למרחב וקטורי, שהוא האובייקט המרכזי באלגברה לינארית.
כעת, למערכת משוואות הומוגנית תמיד יש פתרון אחד לפחות: \( \overline{0} \). כשכופלים מטריצה כלשהי בוקטור האפס, תמיד מקבלים וקטור שכולו אפסים. אבל שימו לב שזה לא חייב להיות וקטור מאותו האורך! למשל, \( \left[\begin{array}{ccc}1 & 0 & 1\\0 & 1 & 1\end{array}\right]\left[\begin{array}{c}0\\0\\0\end{array}\right]=\left[\begin{array}{c}0\\0\end{array}\right] \). זכרו - וקטור העמודה משמאל מתאים למשתנים, וזה שמימין מתאים למשוואות.
לפתרון 0 הזה קוראים “הפתרון הטריוויאלי”. השאלה שלנו כשאנחנו מתעסקים במערכת משוואות היא אם קיימים פתרונות שאינם טריוויאליים. אם קיים ולו פתרון אחד שאינו טריוויאלי למערכת הומוגנית, אז יש לה אינסוף פתרונות, כי אפשר לכפול את הפתרון בכל אחד מאינסוף הסקלרים האפשריים ולקבל פתרון חדש, להבדיל מהפתרון הטריוויאלי שאם כופלים אותו בסקלר מקבלים שוב אותו עצמו (כדאי להעיר כאן שאפשר לדבר על משוואות לינאריות גם בעולמות שבהם הסקלרים נלקחים מתוך קבוצה סופית - “שדה סופי” - אבל לעת עתה לא נדבר עליהם; במקרים הללו אוסף הפתרונות אכן יהיה סופי). אם כן, מה שאנחנו מחפשים אינו רשימה של כל הפתרונות כי כזו תהיה גדולה מדי מכדי שניתן יהיה לכתוב אותה; אנחנו מחפשים ייצוג פשוט לקבוצת כל הפתרונות.
למשל: נניח שהתמזל מזלנו וגילינו ש-\( \left(3,2,1\right) \) הוא פתרון למשוואה הומוגנית כלשהי. אנחנו יודעים שכל כפולה שלו בסקלר \( t \) גם היא תהיה פתרון, אז \( \left\{ \left(3t,2t,t\right)|t\in\mathbb{R}\right\} \) הוא ייצוג קומפקטי יחסית לקבוצת חלק מהפתרונות של המשוואה; אולי יש עוד פתרונות שאינם רק כפולה של \( \left(3,2,1\right) \). אם, למשל, גם \( \left(6,6,6\right) \) הוא פתרון, אז גם כל וקטור מהצורה \( \left(6s,6s,6s\right) \) כאשר \( s\in\mathbb{R} \) הוא פתרון, ואז גם סכום של כל וקטור מהצורה \( \left(3t,2t,t\right) \) עם וקטור מהצורה \( \left(6s,6s,6s\right) \) יהיה פתרון - קיבלנו ש-\( \left\{ \left(3t+6s,2t+6s,t+6s\right)|t,s\in\mathbb{R}\right\} \) גם הוא ייצוג קומפקטי (יחסית!) לקבוצת חלק מהפתרונות. אבל אולי יש עוד פתרון שטרם תפסנו…
זה מוביל אותנו להגדרה הבאה: אם \( v_{1},v_{2},\dots,v_{n} \) היא קבוצה של וקטורים ו-\( \lambda_{1},\lambda_{2},\dots,\lambda_{n} \) הם סקלרים, אז הביטוי \( \lambda_{1}v_{1}+\lambda_{2}v_{2}+\dots+\lambda_{n}v_{n} \) (או בקיצור, \( \sum_{i=1}^{n}\lambda_{i}v_{i} \)) נקרא צירוף לינארי של הוקטורים \( v_{1},\dots,v_{n} \) עם המקדמים \( \lambda_{1},\dots,\lambda_{n} \). אם \( v_{1},\dots,v_{n} \) הם פתרונות של משוואה הומוגנית, אז גם כל צירוף לינארי שלהם הוא פתרון. לא קשה לראות שעבור כל קבוצת וקטורים, אוסף כל הצירופים הלינאריים שלה מקיים את התכונות של “סגור לכפל בסקלר ולחיבור” ולכן הוא מרחב וקטורי - המרחב שנפרש על ידי \( v_{1},\dots,v_{n} \). האתגר שלנו עם מערכת המשוואות הלינאריות הוא למצוא קבוצת פתרונות שפורשת את כל מרחב הפתרונות; ויותר מכך - קבוצה מינימלית של פתרונות שפורשת את כל מרחב הפתרונות. קבוצה כזו נקראת בסיס למרחב הפתרונות. תכף ומייד עולה השאלה מי מבטיח לנו בכלל שיש מספר סופי של פתרונות שפורשים את כל היתר. זו שאלה מצויינת ולא טריוויאלית בכלל; העובדה שזה אכן המצב - שלמרות שיכולים להיות למשוואה הומוגנית אינסוף פתרונות, תמיד תהיה קבוצת סופית של פתרונות שפורשים את כל היתר - היא תוצאה מקסימה וחזקה.
טוב, אז למה זה נכון? ואיך מוצאים את הבסיס הזה? את זה כבר ראינו, בערך: משתמשים במטריצה המצומצמת. אם \( Ax=0 \) היא מערכת משוואות הומוגנית כלשהי, אז גם אחרי שנדרג את \( A \) נקבל מערכת משוואות הומוגנית (עם אותם פתרונות בדיוק). כעת, כבר הסברתי כיצד ניתן למצוא מהם המשתנים התלויים והמשתנים הבלתי תלויים (המשתנים התלויים הם בדיוק אלו שיש שורה שבה הכניסה שלהם היא הראשונה שאינה 0). בואו נניח שמבין \( m \) משתנים, בדיוק \( r \) הראשונים הם המשתנים התלויים. זה אומר שיש לנו \( m-r \) פתרונות שונים למערכת שהם מהצורה \( v_{1}=\left(x_{1},\dots,x_{r},1,0,0,\dots,0\right) \), \( v_{2}=\left(x_{1},\dots,x_{r},0,1,0,\dots,0\right) \), וכו’ עד \( v_{m-r}=\left(x_{1},\dots,x_{r},0,0,0,\dots,1\right) \), כאשר בכל וקטור שכזה ה-\( x_{1},\dots,x_{r} \) לא זהים אלא נקבעים בכל פעם מחדש על פי מה שקורה כשמציבים 0 בכל המשתנים הבלתי תלויים חוץ מאחד מהם שבו מציבים 1.
בואו נבין למה כל פתרון אפשרי של המשוואה ניתן לכתיבה כצירוף לינארי של הפתרונות הללו. התשובה פשוטה: אם \( v=\left(a_{1},a_{2},\dots,a_{r},b_{1},b_{2},\dots,b_{m-r}\right) \) הוא פתרון כלשהו של המשוואה (בכוונה אני מפריד בין הערכים במקומות של המשתנים התלויים והערכים במקומות של המשתנים הבלתי תלויים), אז \( v=b_{1}v_{1}+b_{2}v_{2}+\dots+b_{m-r}v_{m-r} \). השאלה היא רק למה. ראשית, שימו לב ש-\( b_{1}v_{1}=\left(b_{1}x_{1},\dots,b_{1}x_{r},b_{1},0,0,\dots,0\right) \), ושהקוארדינטה שבה מופיע \( b_{1} \) לבד היא כזו שבשאר הוקטורים בסכום היא אפס, ולכן גם בסכום הכולל הקוארדינטה הזו תהיה \( b_{1} \) כפי שצריך, וכנ”ל לכל הקוארדינטות שאחריה. השאלה היא רק למה הקוארדינטות הראשונות, של המשתנים התלויים, “יוצאות בסדר”. וכאן יש לי טיעון מחץ שעשוי להיות מבלבל קצת במבט ראשון, אבל חוסך לי את החשבונאות שנראה שצריך להיכנס אליה בכדי להבין מה קורה בקוארדינטות של המשתנים התלויים.
ראשית, בואו ותסכימו איתי ש-\( v^{\prime}=b_{1}v_{1}+b_{2}v_{2}+\dots+b_{m-r}v_{m-r} \) הוא פתרון של המשוואה ההומוגנית \( Ax=0 \) - הוא חייב להיות כזה, כי הוא צירוף לינארי של פתרונות של המערכת. בנוסף, אותו וקטור \( v \) שניסיתי לכתוב הוא כמובן פתרון של המשוואה ההומוגנית כי מזה התחלתי. אני מאוד מקווה ש-\( v^{\prime}=v \), אבל טרם שכנעתי אתכם בכך: בינתיים אנחנו יודעים רק שהם שווים ב-\( m-r \) הקוארדינטות האחרונות. אבל, מכיוון ששניהם פתרונות של המשוואה ההומוגנית כך גם \( v^{\prime}-v \), וקטור ההפרש שלהם. אם \( v^{\prime}=v \) אז וקטור ההפרש הזה הוא וקטור האפס; אם הם לא שווים אז כל קוארדינטה שבה הם נבדלים תהיה שונה מאפס. אם כן, אנחנו יודעים בודאות ש-\( v^{\prime}-v \) הוא אפס לפחות בקוארדינטות שמתאימות למשתנים הבלתי תלוים, כלומר \( m-r \) האחרונות, ושהוא פתרון למשוואה ההומוגנית. אבל מה זה אומר? זה אומר שהוא פתרון למשוואה ההומוגנית שבו מציבים 0 בכל המשתנים הבלתי תלויים, וזה מכריח את המשתנים התלויים להיות 0 גם כן. מדוע? כי כל שורה במערכת המצומצמת היא מהצורה \( x_{i}+\lambda_{1}y_{1}+\dots+\lambda_{m-r}y_{m-r}=0 \) כאשר \( x_{i} \) הוא המשתנה התלוי היחיד שמופיע בשורה הזו, ו-\( y_{1},\dots,y_{m-r} \) הם המשתנים הבלתי תלויים עם המקדמים שלהם שמתאימים לשורה הזו (חלק מהמקדמים יכולים להיות אפסים). אם נציב 0 בכל המשתנים הבלתי תלויים נקבל \( x_{i}=0 \).
אם לחזור על הטיעון בקצרה לטובת מי שאיבדו אותי: למשוואה \( Ax=0 \) יש רק פתרון אחד שבו כל המשתנים הבלתי תלויים הם 0, וזה הפתרון הטריוויאלי שבו כל המשתנים הם 0. לכן, מכיוון ש-\( v^{\prime}-v \) הוא פתרון שבו כל המשתנים הבלתי תלויים הם 0 הוא חייב להיות וקטור האפס ולכן \( v^{\prime}=v \). זה אומר שכדי לבנות את \( v \) הספיק לי לבנות את הצירוף הלינארי של אותם \( v_{1},\dots,v_{m-r} \) באופן כזה שהכניסות של \( v^{\prime} \) שמתאימות למשתנים הבלתי תלויים “יצאו בסדר” כדי להבטיח שגם הכניסות של המשתנים התלויים יהיו בסדר. זו המחשה מוצלחת לטעמי של האופן שבו אלגברה לינארית היא פשוטה והכל בה מסתדר היטב.
זה סוף הסיפור מבחינת משוואות לינאריות; ראינו איך באמצעות דירוג המטריצה אנחנו יכולים לקבל בקלי קלות קבוצה לא גדולה של פתרונות למערכת המשוואות שממנה אפשר לבנות בקלות כל פתרון אחר (לא הסברתי עדיין למה זו הקבוצה המינימלית, כי זה מצריך דיון קצת יותר מורכב על מושג הבסיס שאני מעדיף לדחות להמשך). אבל מבחינת האלגברה הלינארית זו רק ההתחלה. בפוסט הזה צצו מאליהם מושגים רבים שהם מרכזיים באלגברה לינארית: מרחב וקטורי, צירוף לינארי, פרישה, בסיס. את הרעיונות הללו אפשר לתאר בהקשרים רחבים הרבה יותר מאשר פתרון משוואות לינאריות, ודווקא הגישה הכללית יותר הופכת אותם לפשוטים יותר להבנה. בפוסט הבא אתאר פורמלית את המושגים המרכזיים באלגברה לינארית - שדה ומרחב וקטורי - ואז נוכל להתחיל לבצע את הדיבור הכללי הזה.
נהניתם? התעניינתם? אם תרצו, אתם מוזמנים לתת טיפ: