Від дій над матрицями до розуміння їх суті...

Дуже поважаю людей, які мають сміливість заявити, що вони що-не розуміють. Сам такий. Те, що не розумію, — обов'язково повинен вивчити, осмислити, зрозуміти. Стаття "Математика на пальцях", і особливо матрична запис формул, змусили мене поділитися своїм невеликим, але, здається, важливим досвідом роботи з матрицями.

Років так 20 тому довелося мені вивчати вищу математику у вузі, і починали ми з матриць (мабуть, як і всі студенти того часу). Чомусь вважається, що матриці — найлегша тема в курсі вищої математики. Можливо тому, що всі дії з матрицями зводяться до знання способів розрахунку визначника і декількох формул, побудованих — знову ж таки, на визначнику. Здавалося б, все просто. Але… Спробуйте відповісти на елементарне запитання — що таке визначник, що означає число, яке ви отримуєте при його розрахунку? (підказка: варіант типу «визначник — це число, яке знаходиться за певними правилами» не є правильною відповіддю, оскільки говорить про метод отримання, а не про саму суть визначника). Здаєтесь? — тоді читаємо далі…

Відразу хочу сказати, що я не математик ні за освітою, ні за посадою. Хіба що мені цікава суть речей, і я іноді намагаюся до них «докопатися». Так само було і з визначником: потрібно було розібратися з множинною регресією, а в цьому розділі економетрики практично все робиться через… матриці, будь вони неладні. Ось і довелося мені самому провести невелике дослідження, оскільки жоден із знайомих математиків не дав чіткої відповіді на поставлене запитання, спочатку звучав як «що таке визначник». Всі стверджували, що визначник — це таке число, яке особливим чином пораховано, і якщо воно дорівнює нулю, то… В загальному, як в будь-якому підручнику з лінійної алгебри. Спасибі, проходили.

Якщо якусь ідею придумав один чоловік, то інший чоловік повинен бути в змозі її зрозуміти (правда, для цього часом доводиться озброюватися додатковими знаннями). Звернення до «великому і могутньому» пошукачеві показав, що "площа паралелограма дорівнює модулю визначника матриці, утвореної векторами сторонами паралелограма". Говорячи простою мовою, якщо матриця — це спосіб запису системи рівнянь, кожне рівняння окремо описує вектор. Побудувавши з точки початку координат вектори, задані в матриці, таким чином, ми задамо в просторі деяку фігуру. Якщо наш простір одномірне, то фігура — це відрізок; якщо двовимірне — то фігура — паралелограм, і так далі.

Виходить, що для одновимірного простору визначник — це довжина відрізка, для площини — площа фігури, для тривимірної фігури — її обсяг… далі йдуть n-вимірні простори, уявити які нам не дано. Якщо обсяг фігури (тобто визначник для матриці 3*3) дорівнює нулю, то це означає, що сама фігура не є тривимірної (вона може бути при цьому двомірної, одномірної або взагалі представляти собою точку). Ранг матриці — це справжня (максимальна) — розмірність простору, для якого визначник не дорівнює нулю.

Так, з визначником майже все зрозуміло: він визначає «об'ємність» фігури, утвореної описаними системою рівнянь векторами (хоча незрозуміло, чому його значення не залежить від того, маємо ми справу з вихідною матрицею, або з транспонованою — можливо, транспонування — це вид афінного перетворення?). Тепер потрібно розібратися з діями над матрицями…

Якщо матриця — це система рівнянь (а інакше навіщо нам таблиця якихось цифр, які не мають до реальності ніякого відношення?), то ми можемо з нею робити різні речі. Наприклад, можемо скласти два рядки однієї і тієї ж матриці, або рядок помножити на число (тобто кожен коефіцієнт рядка, множимо на одне і те ж число). Якщо у нас є дві матриці з однаковими розмірності, то ми їх можемо скласти (головне, щоб при цьому ми не склали бульдога з носорогом — але хіба математики, розробляючи теорію матриць, думали про такий варіант розвитку подій?). Інтуїтивно зрозуміло, тим більше, що в лінійній алгебрі ілюстраціями подібних операцій є системи рівнянь.

Однак у чому сенс множення матриць? Як я можу помножити одну систему рівнянь на іншу? Який сенс буде мати те, що я отримаю в цьому випадку? Чому для множення матриць незастосовне переместительное правило (тобто добуток матриць В*А не то що не дорівнює добутку А*В, але і не завжди можливо)? Чому, якщо ми перемножимо матрицю на вектор-стовпець, отримаємо вектор-стовпець, а якщо перемножимо вектор-рядок матриці, то одержимо вектор-рядок?

Ну, тут вже не те що Вікіпедія, — тут навіть сучасні підручники з лінійної алгебри безсилі дати якесь виразне пояснення. Оскільки вивчення чого-небудь за принципом «ви спочатку повірте — а потім зрозумієте» — не для мене, копаю в глиб століть (точніше — читаю підручники першої половини XX століття) і знаходжу цікаву фразу…
Якщо сукупність звичайних векторів, тобто спрямованих геометричних відрізків, є тривимірним простором, то частина цього простору, що складається з векторів, паралельні деякій площині, є двовимірним простором, а всі вектори, паралельні деякій прямій, утворюють одномірне векторний простір.
У книгах про це прямо не говориться, але виходить, що векторах, паралельний деякій площині, необов'язково лежати на цій площині. Тобто вони можуть перебувати в тривимірному просторі де завгодно, але якщо вони паралельні саме цій площині, то вони утворюють двовимірний простір… З тих, що приходять мені на ум аналогій — фотографія: тривимірний світ представлений на площині, при цьому вектору, паралельному матриці (чи плівці) фотоапарата, буде відповідати такий же вектор на картинці (за умови дотримання масштабу 1:1). Відображення тривимірного світу на площині «прибирає» один вимір («глибину» картинки). Якщо я правильно зрозумів складні математичні концепції, перемноження двох матриць як раз і являє собою подібне відображення одного простору в інше. Тому, якщо відображення простору А в просторі можливо, то допустимість відображення простору в просторі, А не гарантується.

Будь-яка стаття закінчується в той момент, коли автору набридає її пість. Оскільки я не ставив перед собою мети осягнути неосяжне, а виключно хотів зрозуміти суть описаних операцій над матрицями і те, як саме матриці пов'язані з розв'язуваними мною системами рівнянь, я не поліз в подальші нетрі лінійної алгебри, а повернувся до економетрики та множинної регресії, але зробив це вже більш усвідомлено. Розуміючи, що і навіщо я роблю і чому тільки так, а не інакше. Те, що у мене вийшло в цьому матеріалі, можна озаглавити як «глава про суті основних операцій лінійної алгебри, яку чомусь забули надрукувати в підручниках». Але адже ми ж не читаємо підручників, правда? Якщо чесно, коли я вчився в університеті, мені дуже не вистачало саме розуміння порушених тут питань, тому я сподіваюся, що, виклавши цей непростий матеріал по можливості простими словами, я роблю добру справу і допомагаю комусь вникнути в саму суть матричної алгебри, перевівши операції над матрицями з розділу «камлання з бубном» в розділ «практичні інструменти, що застосовуються свідомо».

Джерело: Хабрахабр

0 коментарів

Тільки зареєстровані та авторизовані користувачі можуть залишати коментарі.