Лінійна алгебра

Розділ присвячено питанням дисципліни "Лінійна алгебра" [math] \pmatrix{ a_{1} \\ a_{2} \\ \ldots \\ a_{n} } [/math]

Інварінтні та циклічні підпростори

Означення 1. Підпростір [math] W[/math] векторного простору [math]V[/math] називається інваріантним відносно оператора [math]f : V \to V[/math] , якщо [math]f(x) \in W[/math] для будь-якого вектора [math]x \in W[/math] .

Нехай [math]f : V \to V, \enspace dim V = n, \enspace W[/math] - інваріантний підпростір простору [math]V[/math] відносно [math]f[/math] і [math]dim W = m[/math] . Якщо у підпросторі [math]W[/math] вибрати базис, а потім доповнити його до базису [math]\cal B[/math] всього простору [math]V[/math] , то матриця оператора [math]f[/math] відносно базису [math]\cal B[/math] буде мати вигляд : [math]\pmatrix{ A & B \\   0 & C}[/math] , де [math]A[/math] - квадратна матриця порядку [math]m[/math] .

Якщо простір розкладено у пряму суму двох або більше інваріантних підпросторів, то існує базис, в якому матриця лінійного оператора є блочно-діагональною.

Нехай у векторному просторі діє лінійний оператор [math]f[/math]. Фіксуємо деякий вектор [math] x_{0}[/math] і розглянемо сукупність векторів [math] x_{0}, f(x_{0}), \ldots , f^{m-1}(x_{0}), \ldots , [/math] із якої залишимо максимальну кількість перших лінійно незалежних векторів.

Будемо вважати, що кількість таких векторів [math]m[/math]. Лінійна оболонка [math] Z [/math] векторів [math] x_{0}, f(x_{0}), \ldots , f^{m-1}(x_{0}) [/math] є інваріантний підпростір.

Далі, якщо [math] Y [/math] - деякий інваріантний підпростір, який містить вектор [math] x_{0}[/math] , то, відповідно означенню, він містить і вектори [math]f(x_{0}),\ldots , f^{m-1}(x_{0})[/math] , так що [math]Y \supset Z[/math] .

Таким чином, [math]Z[/math] - мінімальний інваріантний підпростір, який містить вектор [math]x_{0}[/math]. Побудованний простір [math]Z[/math] називають  циклічним підпростором породженим вектором [math] x_{0}[/math].

Білінійні та квадратичні форми

Означення 1. Білінійною формою на векторному просторі [math] V [/math] над полем [math] K [/math]називається функція [math] f [/math] від двох аргументів-векторів із значеннями в полі [math] K [/math], лінійна відносно кожного аргументу при фіксованому
другому.

Нехай в просторі вибрано деякий базис [math]e_{1}, e_{2}, \ldots , e_{n}[/math].

Нехай вектор [math]x[/math] має координати [math]x_{i}[/math], а вектор [math]y[/math] має координати [math]y_{k}[/math] відносно вибранного базису. Тоді [display] f(x,y) = f(\sum_{i=1}^{n} x_{i}e_{i}, \sum_{k=1}^{n} y_{k}e_{k}) = \sum_{i,k=1}^{n} f(e_{i},e_{k}) x_{i} y_{k} = \sum_{i,k=1}^{n} a_{ik} x_{i}y_{k}.[/display]

Числа [math]f(e_{i},e_{k}) = a_{ij} \in K [/math] залежать від базису, але не залежать від вибору векторів. Матриця [math]A =
(a_{ij})[/math] називається {\em матрицею білінійної форми} (в базисі [math]e_{1}, e_{2}, \ldots , e_{n}[/math]).

Означення 2.  Білінійна форма [math]f[/math] називається симетричною, якщо [math]f(x, y) = f(y, x)[/math] для довільних векторів [math]x, y[/math] простору [math]V[/math].

Означення 3.  Симетрична білінійна форма [math]f(x, y)[/math] при [math]x = y[/math] називається квадратичною формою і позначається [math]f(x)[/math].

При фіксованому базисі квадратична форма має вигляд: [display] f(x) = \sum_{i,j=1}^{n} a_{ij} x_{i} x_{j},[/display] де [math]A = (a_{ij})[/math] - (симетрична) матриця квадратичної форми.

Таким чином, квадратична форма є однорідний многочлен другого степеня від змінних [math]x_{1}, x_{2}, \ldots , x_{n}[/math].
Скорочений матричний запис квадратичної форми:
[display] f(x_{1},x_{2},..., x_{n}) = X^{T} A X.[/display]

Нагадаємо, що при переході до нового базису за допомогою матриці переходу [math]C[/math] координати пов'язані слідуючим чином: [math]X = C X'[/math]. Матриця [math]A'[/math] квадратичної форми [math]f(x)[/math] від нових координат буде: [math]A'= C^{T} A C[/math].

Кажуть, що квадратична форма має канонічний вигляд, якщо вона складається тільки із квадратів координат з деякими коефіцієнтами, які називають {\em канонічними}. Зрозуміло, що матриця квадратичної форми у канонічному вигляді діагональна.

Теорема 4. У дійсному векторному просторі існує базис, у якому квадратична форма має канонічний вигляд.

Означення 5.  Головними мінорами матриці [math]A = (a_{ij})[/math] порядку [math]n[/math] називають такі визначники:[math]
\Delta_{1}= a_{11}, \enspace
\Delta_{2} =\left| \matrix{
a_{11}&  a_{12}\\
a_{21} & a_{22} \\}
, \cdots ,
\Delta_{k} = det(a_{ij}) \enspace i,j = 1, \ldots , k, \cdots ,
\Delta_{n} = det A_{n}.[/math]

Лема 6. Для того, щоб невироджена матриця зображалась у вигляді добутку лівої унітрикутної, діагональної та правої унітрикутної матриць, необхідно і достатньо, щоб головні мінори матриці були відмінні від нуля.

Теорема 7. Нехай матриця квадратичної форми невироджена. Для того, щоб форма була перетворена до канонічного вигляду за допомогою правої унітрикутної матриці, необхідно і достатньо, щоб головні мінори матриці квадратичної форми були відмінні від нуля. При цьому, канонічні коефіцієнти визначаються через головні мінори:
[display] f = \Delta_{1} x_{1}^{'2} + \frac{\Delta_{2}}{\Delta_{1}} x_{2}^{'2} + \cdots + \frac{\Delta_{n}}{\Delta_{n-1}} x_{n}^{'2}.[/display]

Опишемо метод ортогонального перетворення квадратичної форми до канонічного вигляду. Будемо розглядати квадратичну форму [math]f(x)[/math] в евклідовому просторі [math]V[/math]. В деякому ортонормованому базисі евклідового простору [math]V[/math] симетричну матрицю [math]A[/math] квадратичої форми [math]f(x)[/math] можна вважати матрицею самоспряженого оператора [math]\varphi(x)[/math]. Відомо, що для самоспряженого оператора існує ортонормований базис з власних векторів оператора , в якому матриця оператора буде діагональною. Отже матриця переходу [math]C[/math] до власного базису ортогональна, тобто [math]C^{-1}= C^{T}[/math]. Це означає, що при переході до ортонормованного базису з власних векторів самоспряженого оператора [math]\varphi(x)[/math], заданого симетричною матрицею квадратичної форми [math]f(x)[/math], закони перетворення матриці оператора і матриці квадратичної форми збігаются, причому канонічними коефіцієнтами квадратичної форми є власні числа матриці квадратичної форми.
 

Визначники та їх властивості

Кажуть, що пара елементів [math] (k_{i}, k_{j})[/math] в перестановці [math] k_{1}, k_{2}, \ldots , k_{n}[/math] елементів [math] 1, 2, \ldots , n[/math] утворює інверсію, якщо [math] k_{i} > k_{j} [/math] при [math]i < j[/math]. Кількість усіх інверсій перестановки позначають [math] inv (k_{1}k_{2}...k_{n})[/math].

Означення 1.  Визначником (детермінантом) квадратної матриці [math]A = ( a_{ij})[/math] називається алгебраїчна сума всіх можливих добутків [math] a_{1k_{1}}a_{2k_{2}}...a_{nk_{n}}[/math] елементів матриці, взятих по одному з кожного рядка і кожного стовпця з знаком [math] (-1)^{inv(k_{1}k_{2} \ldots k_{n})} [/math].

Детермінант матриці [math] A[/math] такий:
[display] \Delta = det A = | A | = det ( a_{ij} ) = \left |  \matrix{
 a_{11} &a_{12} &  \ldots& a_{1n} \\
a_{21} &a_{22} & \ldots & a_{2n} \\
\ldots & \ldots & \ldots & \ldots \\
 a_{n1} &a_{n2} & \ldots & a_{nn} } \right | [/display]

Отже, [display]\Delta = \sum_{k_{1}k_{2} \ldots k_{n}} (-1)^{inv(k_{1}k_{2} \ldots k_{n}} a_{1k_{1}}a_{2k_{2}} \ldots a_{nk_{n}}.[/display]

Властивості визначників довільного порядку:

1. При транспонуванні матриці її визначник не змінюється.

Властивість 1 називають  властивістю рівноправності рядків і стовпців. Це означає, що всяка властивість визначника для рядків
правильна і для стовців.

2. Якщо всі елементи деякого рядка визначника дорівнюють нулю, то такий визначник дорівнює нулю.

3. Якщо елементи [math]i[/math]-го рядка матриці [math]A[/math] записані як сума двох доданків, то визначник цієї матриці дорівнює сумі двох визначників, матриці які відрізняються від [math]A[/math] тільки [math]i[/math]-тим рядком, причому елементи [math]i[/math]-го рядка першого визначника складені з відповідних перших доданків [math]i[/math]-го рядка матриці [math]A[/math], а елементи [math]i[/math]-го рядка другого визначника - з відповідних других доданків.

4. Якщо визначник має два однакових рядка, то він дорівнює нулю.

5. Якщо в матриці поміняти місцями два рядка, то її визначник змінить знак на протилежний.

6. Якщо всі елементи деякого рядка визначника мають спільний множник, то цей множник можна винести за знак визначника.

7. Визначник, в якого відповідні елементи двох рядків пропорційні, дорівнює нулю.

8. Визначник не змінюється, якщо до елементів одного рядка додати відповідні елементи другого рядка, помножені на одне й те самечисло.

 Алгебраїчним доповненням елемента матриці називатимемо визначник, одержаний з матриці заміною цього елемента на 1, а елементів рядка та стовпця, в яких знаходився елемент, на нулі. Алгебраїчне доповнення елемента [math] a_{ij} [/math] матриці
[math]A = ( a_{ij})[/math] позначають [math]A_{ij}[/math].

9. Визначник дорівнює сумі добутків елементів рядка на відповідні алгебраїчні доповнення. [math] \Delta = a_{i1}A_{i1} + \cdots + a_{ik}A_{ik} + \cdots + a_{in}A_{in}[/math].

 Мінором елемента квадратної матриці називають детермінант матриці, утвореної після викреслювання рядка та стовпця, в
якому знаходився елемент. Мінор елемента [math]a_{ij}[/math] позначають [math]M_{ij}[/math].

Теорема 2. [math]A_{ij} = (-1)^{i+j} M_{ij}.[/math]

Теорема 3. Детермінант добутку двох квадратних матриць дорівнює добутку детермінантів цих матриць.

Теорема 4.  Сума добутків елементів будь-якого рядка матриці на алгебраїчні доповнення відповідних елементів іншого рядка цієї матриці дорівнює нулю.

 

Власні та кореневі вектори оператора

Означення 1.  Ненульовий вектор [math] x [/math] простору [math] V [/math] називається власним вектором лінійного оператора [math] f : V \to V [/math], якщо [math] f(x) = \lambda x [/math], де [math] \lambda [/math] - число, яке називають власним числом оператора.

Твердження 2. Множина всіх власних векторів оператора [math]f : V \to V [/math] відносно власного числа [math] \lambda [/math] утворює інваріантний підпростір простору [math] V [/math] відносно цього оператора.

Теорема 3. Власні числа оператора являються коренями характеристичного рівняння цього оператора.

Теорема 4.  Власні вектори, які належать до різних власних чисел, лінійно незалежні.

Теорема 5.  Для того, щоб матриця лінійного оператора у данному базисі була діагональною, необхідно і достатньо, щоб вектори базиса були власними векторами оператора.

Теорема 6. Для того, щоб існував базис, в якому матриця оператора була діагональною, необхідно і достатньо, щоб розмірності підпросторів власних векторів дорівнювали кратностям відповідних власних чисел як коренів характеристичного многочлена.

Означення 7.  Вектор [math] v \in V [/math] називається кореневим оператора [math] f : V \ to V [/math], якщо для деякого числа
 [math] \lambda [/math] виконується рівність [math] (f - \lambda \cal E)^{m} v = 0 [/math] (найменший показник [math] m [/math] називається висотою кореневого вектора).

Число [math] \lambda [/math] в означенні кореневого вектора є власним числом.

Власний вектор - це кореневий вектор висоти 1.

Твердження 8. Множина кореневих векторів оператора [math] f [/math] , які відповідають одному власному числу, утворює інваріантний підпростір відносно оператора [math] f [/math].

Підпростір кореневих векторів називають  кореневим підпростором.

Теорема 9. Векторний простір над полем комплексних чисел, розкладується у пряму суму кореневих підпросторів.

 

Евклідові та унітарні простори

Означення 1. Скалярним добутком двох векторів [math]x, y[/math]дійсного лінійного простору [math]V[/math] називається функція від [math]x, y[/math] з значеннями в полі дійсних чисел, яка позначається [math](x, y)[/math]і задовільняє вимогам:
1.  лінійності по першому аргументу, тобто [math](\alpha_{1}x_{1} +\alpha_{2}x_{2}, y) = \alpha_{1}(x_{1}, y) + \alpha_{2}(x_{2}, y); \enspace \alpha_{1}, \alpha_{2} \in R; x_{1}, x_{2}, y \in V[/math];

2. симетрії, тобто [math](x, y) = (y, x)[/math];

3. додатньої означенності, тобто [math](x, x) > 0[/math], при [math]x \not =0[/math].

З вимог 1) та 2) слідує лінійність по другому аргументу.

Скалярний добуток [math](x, x)[/math]називають скалярним квадратом вектора.

Означення 2. Дійсний скінченновимірний векторний простір з означеним в ньому скалярним добутком називається евклідовим простором.

Приклад. У просторі рядків [math]R^{n}[/math] для будь-яких векторів скалярний добуток означимо як суму добутків відповідних координат.

Означення 3.  Довжиною вектора називають число [math]\mid x \mid =\sqrt{x,x}[/math].

Твердження 4. Для будь-яких векторів [math]x[/math] та [math]y[/math] евклідового простору виконується нерівність [display](x, y)^{2} < (x, x)(y, y).[/display]

Твердження 5. Довжина суми будь-яких двох векторів не більша за суму довжини доданків (знак рівності виконується тоді і лише тоді, коли вектори пропорційні).

Означення 6.  Вектори називаються ортогональними, якщо їх скалярний добуток дорівнює нулю.

Твердження 7. Якщо вектори оргогональні, то квадрат довжини їх суми дорівнює сумі квадратів їх довжин.

Означення 8.  Система ненульових векторів називається ортогональною, якщо вони попарно ортогональні.

Твердження 9. Кожна ортогональна система векторів лінійно незалежна.

Теорема 10. З лінійно незалежної системи векторів можна побудувати ортогональну систему.

Означення 11.  Вектор називається нормованим, якщо його довжина дорчвнює 1.

Означення 12.  Базис евклідового простору називається ортонормованим, якщо вектори базису нормовані і попарно ортогональні.

В кожному евклідовому просторі існує ортонормований базис.

Нехай [math]a_{1}, a_{2}, \ldots , a_{n}[/math] - деякий базис евклідового простору. Тоді [display] (x, y) = (\sum_{i=1}^{n} x_{i}a_{i}, \sum_{k=1}^{n} y_{k}a_{k}) = \sum_{i,k=1}^{n} x_{i}y_{k}(a_{i}, a_{k}) = \sum_{i,k=1}^{n} g_{ik} x_{i} y_{k} ,
[/display] де [math] g_{ik} = (a_{i}, a_{k})[/math].

Матриця [math](g_{ik})[/math] називається  матрицею Грама (для системи векторів [math]a_{1}, \ldots , a_{n}[/math]). Матриця Грама симетрична.

В ортонормованму базисі матриця Грама є одиничною, а скалярний добуток дорівнює сумі добутків відповідних координат векторів.

Теорема 13. Визначник матриці Грама для деякої системи векторів дорівнює нулю тоді і тільки тоді, коли вектори лінійно залежні. Визначник Грама для лінійно незалежних векторів додатний.

Означення 14.  Скалярним добутком [math](x, y)[/math] двох векторів [math]x, y[/math] комплексного лінійного простору [math]V[/math] називається функція від [math]x, y[/math], яка приймає комплексні значення і задовільняє вимогам:
1. лінійності по першому аргументу;

2.  спряженої симетрії, тобто [math](x, y) = \overline{(y, x)}[/math];

3.  додатньої означенності, тобто [math](x, x) > 0[/math], при [math]x \not =0[/math].
З вимог 1) та 2) слідує інволюційна лінійність по другому аргументу, тобто [display] (x, \beta_{1}y_{1} + \beta_{2}y_{2}) =
\overline{\beta_{1}}(x, y_{1}) + \overline{\beta_{2}}(x,y_{2}),[/display] де [math]\beta_{1},\beta_{2}\in C; \enspace x, y_{1}, y_{2} \in V[/math].

Означення 15.  Скінченновимірний комплексний простір з означеним в ньому скалярним добутком називається унітарним простором.

 

Елементарні перетворення матриць і ранг матриці

Означення 1.  Елементарними перетвореннями матриці називатимемо операції над матрицею слідуючих типів :

тип 1 - переставлення двох рядків або стовпців

тип 2 - множення рядка або стовпця матриці на довільне число, відмінне від нуля.

тип 3 - додавання до якогось рядка (стовпця) матриці іншого рядка ( стовпця ), помноженого на деяке число, відмінне від нуля.

Означення 2.  Матрицю називатимемо матрицею східчастого виду, якщо вона задовольняє слідуючим умовам:
1. якщо [math]i[/math]-тий рядок складений з нулів, то [math](i + 1)[/math]-ший рядок також складений з нулів;

2.  якщо перші ненульові елементи [math]i[/math]-го та [math](i +1)[/math]-го рядків розташовано в стовпцях з номерами [math]k_{i}[/math] та [math]k_{i+1}[/math], відповідно, то [math]k_{i} < k_{i+1}[/math].

Теорема 3.  Усяку матрицю скінченим числом елементарних перетворень рядків можна звести до східчастого виду.

Означення 4.  Кажуть, що матриця [math]A[/math] еквівалентна матриці [math]B[/math] , якщо [math]B[/math] одержана з
[math]A[/math] за декілька елементарних перетворень.

Означення 5.  Через [math]E_{st}[/math] будемо позначати квадратну матрицю, в якій на перетині [math]s[/math]-го рядка та
[math]t[/math]-го стовпця стоїть 1, а всі інші елементи - нульові.
Такі матриці називатимемо матричними одиницями.

Означення 6. Елементарними матриці, які одержано з одиничної матриці за допомогою одного з елементарних перетворень.
[display] F_{st} = E - E_{ss} - E_{tt} + E_{st} + E_{ts},[/display]
[display] F_{s}( \lambda ) = E + (\lambda - 1)E_{ss},[/display]
[display] F_{st} ( \lambda ) = E + \lambda E_{st},[/display]
де [math]s \not= t, \enspace \lambda \not= 0[/math].

Елементарні матриці неособливі, причому
[display](F_{st})^{-1} = F_{st}; \enspace
(F_{s}(\lambda))^{-1} = F_{s}(\lambda^{-1}); \enspace
(F_{st}(\lambda))^{-1} = F_{st}(-\lambda).
[/display]
Означення 7.  Множення матриці [math]A[/math] на
а) матрицю [math]F_{st}[/math] зліва (справа) рівносильно переставленню [math]s[/math]-го та [math]t[/math]-го рядків (стовпців) матриці [math]A[/math];

б) матрицю [math]F_{s}( \lambda )[/math] зліва (справа) рівносильно множенню [math]s[/math]-го рядка (стовпця) матриці [math]A[/math] на число [math]\lambda[/math];

в) матрицю [math]F_{st}(\lambda)[/math] зліва (справа) рівносильно додаванню до [math]s[/math]-го рядка [math]t[/math]-го
рядка (до [math]t[/math]-го стовпця - [math]s[/math]-го стовпця) матриці [math]A[/math], помноженного на число [math]\lambda[/math].

Теорема 8.  Усяку матрицю [math]A[/math] за допомогою деяких матриць [math]S[/math] і [math]T[/math] (тобто, за допомогою елементарних перетворень рядків і стовпців) можна привести до виду
[display]SAT =\pmatrix {E_{r} & 0 \\ 0 & 0},[/display] де [math]r[/math] - порядок одиничної матриці.

Означення 9.  Мінором [math]k[/math]-го порядку матриці [math]A[/math] називатимемо детермінант підматриці, утвореної з елементів матриці [math]A[/math], які стоять на перетині вибраних [math]k[/math] рядків та [math]k[/math] стовпців, і розміщених в тому самому порядку, що і в матриці [math]A[/math].

Означення 10.  Рангом матриці називається найвищий порядок відмінних від нуля мінорів цієї матриці.

Ранг матриці [math]A[/math] позначають [math]rang A[/math] або [math]r (A)[/math].

Теорема 11.  Елементарні перетворення матриці не змінюють її ранга.

Твердження 12.  Ранг східчастої матриці дорівнює числу її ненульових рядків.

 

Канонічна форма Жордана

Означення 1.  Лінійний оператор [math]g[/math] називається нільпотентним, якщо деяка його степінь збігається з нульовим оператором.

Нільпотентний оператор має єдине власне число нуль.

Усі вектори простору, в якому діє нільпотентний оператор [math] g [/math], є кореневими векторами оператора [math] g [/math].

Твердення 2. Нехай [math]Q_{i}[/math] - підпростір кореневих векторів нільпотентного оператора [math]g[/math], висоти яких не перевищують [math]i[/math], тобто [math]Q_{i} = Ker(g^{i}), \enspace Q_{m} = V[/math]. Якщо вектори [math]v_{1}, \ldots , v_{k}[/math] належать підпростору [math]Q_{j}\enspace (j > 2)[/math] та лінійно незалежні відносно [math]Q_{j-1}[/math], то вектори[math]g(v_{1}), \ldots , g(v_{k})[/math] належать [math]Q_{j-1}[/math] і лінійно незалежні відносно [math]Q_{j-2}[/math].

Побудуємо базис простору [math]V[/math] , в якому діє нільпотентний оператор [math]g[/math] , слідуючим чином.

Нехай [math]v_{11}, \ldots , v_{1k_{1}}[/math] - базис підпростору [math]Q_{m}[/math] відносно [math]Q_{m-1}[/math]. Тоді
вектори [math]g(v_{11}), \ldots , g(v_{1k_{1}})[/math] належать [math]Q_{m-1}[/math] і лі\-ній\-но не\-за\-леж\-ні від\-нос\-но
[math]Q_{m-2}[/math]. Сукупність векторів [math]g(v_{11}), \ldots , g(v_{1k_{1}})[/math] доповнимо до базиса підпростору
[math]Q_{m-1}[/math] відносно [math]Q_{m-2}[/math] векторами [math]v_{21}, \ldots , v_{2k_{2}}[/math]. Тоді [math]g^{2}(v_{11}),\ldots , g^{2}(v_{1k_{1}}), g(v_{21}), \ldots , g(v_{2k_{2}})[/math] належать підпростору [math]Q_{m-2}[/math] і лінійно незалежні відносно [math]Q_{m-3}[/math]. Доповнимо вектори до базису простору [math]Q_{m-2}[/math] відносно [math]Q_{m-3}[/math]. Продовжуючи цей процес до побудови базису простору [math]Q_{1}[/math], одержимо слідуючу таблицю векторів: [display] Q_{m}: & v_{11},& \ldots , & v_{1k_{1}} & & & & \\
Q_{m-1}:& g(v_{11}),& \ldots , & g(v_{1k_{1}}),& v_{21},&
\ldots ,& v_{2k_{2}} & \\
Q_{m-2}: &g^{2}(v_{11}),& \ldots , & g^{2}(v_{1k_{1}}),&
g(v_{21}), & \ldots ,& g(v_{2k_{2}}),& \ldots \\
& \ldots & \ldots & \ldots & \ldots & \ldots & \ldots & \\
Q_{2}:& g^{m-2}(v_{11}),& \ldots ,& g^{m-2}(v_{1k_{1}}),&
g^{m-3}(v_{21}),& \ldots , & g^{m-3}(v_{2k_{2}}),& \ldots \\
Q_{1}:& g^{m-1}(v_{11}),& \ldots ,& g^{m-1}(v_{1k_{1}}),&
g^{m-2}(v_{21}),& \ldots , & g^{m-2}(v_{2k_{2}}),& \ldots \\
[/display]

Розглянемо побудовану таблицю для кожного фіксованого вектора [math]v^{*}[/math] таблиці як сукупність ланцюгів з векторів
[math]v^{*}, g(v^{*}), \ldots , g^{s-1}(v^{*})[/math], де [math]g^{s}(v^{*}) = 0[/math]. Кожен такий ланцюг утворює циклічний підпростір.

Твердження 3. Простір, в якому діє нільпотентний оператор, розкладається у пряму суму циклічних підпросторів.

Матриця оператора [math]g[/math] в циклічному просторі має вигляд:
[display]\pmatrix{
0 & 0 & \ldots & 0 & 0 \\
1 & 0 & \ldots & 0 & 0 \\
0 & 1 & \ldots & 0 & 0 \\
0 & 0 & \ldots & 0 & 0 \\
\ldots & \ldots & \ldots & \ldots & \ldots \\
0 & 0 & \ldots & 1 & 0 \\}
[/display] і називається нільпотентним жордановим блоком.

Кожному циклічному підпростору буде відповідати нільпотентний жордановий блок, порядок якого дорівнює довжині відповідного ланцюга. Тому матриця нільпотентного оператора [math]g[/math] в просторі [math]V[/math] буде блочно-діагональною, з нільпотентними жордановими блоками на діагоналі. Кількість блоків дорівнює кількості лінійно незалежних власних векторів нільпотентного оператора. Вектори таблиці утворюють базис, який називають  канонічним базисом простору [math]V[/math] відносно оператора [math]g[/math].

Нехай у векторному просторі [math]V[/math] над полем комплексних чисел діє лінійний оператор [math]f[/math]. Виберемо базис простору [math]V[/math] як сукупність базисів кореневих підпросторів відносно оператора [math]f[/math]. Тоді матриця оператора у такому базисі матиме блочно-діагональний вигляд. Діагональні блоки є матриці оператора в кореневих підпросторах. Розглянемо кореневий підпростір з власним числом [math]\lambda [/math]. Нехай [math]m[/math] - кратність числа [math]\lambda [/math] як кореня характеристичного многочлена. Тоді оператор [math](f - \lambda
E)^{m}[/math] анулює усі вектори кореневого підпростору, тобто оператор [math] g = f - \lambda E[/math] нільпотентний. Тепер
виберемо у кореневому підпросторі канонічний базис для оператора [math]g[/math]. Матриця оператора g буде блочно-діагональною з нільпотентними жордановими блоками на діагоналі. У цьому ж базисі оператору [math]f = g + \lambda E[/math] відповідає матриця, яка відрізняється від матриці оператора [math]g[/math] тим, що на головній діагоналі замість нуля буде [math]\lambda[/math]. Окремий жордановий блок має вигляд :[display]\pmatrix{
\lambda & 0 & \ldots & 0 & 0 \\
1 & \lambda & \ldots & 0 & 0 \\
0 & 1 & \ldots & 0 & 0 \\
0 & 0 & \ldots & 0 & 0 \\
\ldots & \ldots & \ldots & \ldots & \ldots \\
0 & 0 & \ldots & 1 & \lambda \\}
[/display]

Якщо у кожному кореневому підпросторі вибрати канонічний базис, то сукупність усіх канонічних базисів буде загальним канонічним базисом простору [math]V[/math] відносно оператора [math]f[/math]. У такому загальному канонічному базисі матриця оператора [math]f[/math] представляє канонічну форму Жордана.

 

Лінійні відображення і оператори

Означення 1.  Відображення одного векторного простору в другий називається лінійним, якщо воно зберігає операції, тобто
образ суми двох векторів є сума образів і образ добутку скаляра на вектор є добуток цього скаляра на образ вектора.

Зауважимо, що образ нуль-вектора при лінійному відображенні є нуль-вектор.

Відображення називають нульовим і позначають [math]\cal O[/math], якщо образ усякого вектора є нуль-вектор.

Відображення простору [math]V[/math] в себе називають  тотожним (одиничним) і позначають [math]\cal E[/math] або [math]id_{V}[/math], якщо образ усякого вектора сбігається з ним самим.

Відображення [math] f : V \to V[/math] називають гомотетією, якщо[math] f(x) = a x[/math] для всіх [math]x \in V[/math] , де [math]a[/math] - скаляр.

Позначимо через [math]\cal L(V,W)[/math] множину всіх лінійних відображень із простору [math]V[/math] в простір [math]W[/math]
над одним полем [math]K[/math].

Для [math] f, g \in \cal L(V,W) [/math] позначимо [math]f + g[/math] та [math] \alpha f [/math] ([math] \alpha \in K [/math]) так:
[display] (f + g)(x) = f(x) + g(x), \enspace (\alpha f)(x) = \alpha f(x) [/display]

Твердження 2. Нехай [math]f,g \in \cal L(V,W)[/math]. Тоді [math]f + g[/math] та [math]\alpha f[/math] - лінійні відображення.

Наслідок 3. Множина [math]\cal L(V, W)[/math] утворює лінійний простір над полем [math]P[/math].

Означення 4.  Простори [math]V[/math] і [math]W[/math] називають ізоморфними і позначають [math]V \simeq W[/math], якщо між ними існує ізоморфізм, тобто бієктивне лінійне відображення.

Теорема 5.  [math]V \simeq W \Longleftrightarrow dim V = dim W[/math].

Означення 6.  Ядром лінійного відображення називають сукупність векторів, що відображаються в нуль-вектор. Ядро відображення [math]f[/math] позначають [math]Ker f[/math].

Означення 7. Образом лінійного відображення [math]f : V \to W[/math] називають сукупність векторів [math]y \in W[/math], які є образами будь-яких векторів з простору [math]V[/math]. Образ відображення [math]f[/math] позначають через [math]Im f[/math].


Твердження 8. Ядро лінійного відображення [math]f : V \to W[/math] є підпростір простору [math]V[/math], а образ [math]Im f[/math] є підпростір простору [math]W[/math].

Нехай [math]f : V \to W[/math] - лінійне відображення, [math]dim V = n, \enspace dim W = m[/math]. В просторі [math]V[/math] виберемо деякий базис [math]\{e_{i}\}_{1}^{n}[/math]. Тоді для будь-якого вектора [math]x = x_{1}e_{1} + x_{2}e_{2} + \cdots + x_{n}e_{n}[/math] одержимо:[display] f(x) = f(\sum_{i=1}^{n} x_{i}e_{i}) = \sum_{i=1}^{n} x_{i}f(e_{i}).[/display]

Таким чином, лінійне відображення [math]f[/math] повністю визначено образами базисних векторів простору [math]V[/math].
Зрозуміло, що вектори [math]f(e_{i})[/math] розкладаються за деяким базисом [math]\{u_{k}\}_{1}^{m}[/math] простору [math]W[/math], причому цей розклад єдиний і залежить від вибору базису в просторі [math]W[/math]. Нехай [display] f(e_{i}) = \sum_{k=1}^{m} a_{ki}u_{k}, \enspace i = 1, \ldots, n.[/display]

Матриця [math]A = (a_{ki})[/math] розміру [math](m,n)[/math] називається  матрицею відображення [math]n[/math]-вимірного
лінійного простору в [math]m[/math]-вимірний лінійний простір відносно вибраних базисів.

Стовпці матриці відображення утворені з координат образів базисних векторів.

Координати образа y вектора [math]x[/math] знаходяться за допомогою матриці відображення. A саме, [math]y_{k} = \sum_{i=1}^{n} a_{ki}x_{i}[/math], або [display]\pmatrix {y_{1} \\ y_{2} \\ \ldots \\ y_{m}
\enspace} = \enspace
\pmatrix {a_{11} & a_{12} & \ldots & a_{1n} \\
a_{21} & a_{22} & \ldots & a_{2n} \\
\ldots & \ldots & \ldots & \ldots \\
a_{m1} & a_{m2} & \ldots & a_{mn} \\}
\pmatrix{x_{1} \\ x_{2} \\ \ldots \\ x_{n}}[/display]

Якщо матрицю лінійного відображення [math]f[/math] позначити через [math]A_{f}[/math], то [math]A_{\alpha f} = \alpha
A_{f}[/math], де [math]\alpha [/math]- число. Крім того, для будь-яких відображень [math]f,g \in \cal L (V,W)[/math] виконується:
[math]A_{f + g} = A_{f} + A_{g}[/math]. Отже, між простором лінійних відображень і простором матриць відповідного розміру існує ізоморфізм.

Покажемо зв'язок між матрицями лінійного відображення [math]f[/math] в різних базисах. Нехай в просторах [math]V[/math] і [math]W[/math] базиси [math]\{e_{i}\}[/math] і [math]\{u_{i}\}[/math] замінено на базиси [math]\{e'_{i}\}[/math] і [math]\{u'_{i}\}[/math]. Відповідно цим замінам, матриці переходу позначимо через [math]T [/math] і [math]C[/math], стовпці з координат векторів [math]x[/math] і [math]y = f(x)[/math] в нештрихованих базисах позначимо через [math]X[/math] і [math]Y[/math], в штрихованих - [math]X'[/math] і [math]Y'[/math]. Матриці відображення [math]f[/math] в штрихованих і нештрихованих базисах позначимо [math]A'_{f}[/math] і [math]A_{f}[/math], відповідно. Тоді [display] A'_{f}X'= Y' = C^{-1}Y = C^{-1}A_{f}X = C^{-1}A_{f}TX'.[/display] Отже,[display]  A'_{f} = C^{-1}A_{f}T. [/display]

Теорема 9.  Нехай [math]V[/math] - скінченновимірний лінійний простір, [math]f : V \to W[/math] - лінійне відображення. Тоді 
[display] dim \enspace Ker f + dim \enspace Im f = dim V.[/display]

Означення 10.  Лінійні відображення простору в себе називаються лінійними операторами.

Лінійному оператору відповідає квадратна матриця відносно деякого базису. Якщо в просторі [math]V[/math] перейти від базису
[math]\{e_{i}\}[/math] до базису [math]\{e'_{i}\}[/math] за допомогою матриці переходу[math]S[/math] , то матриця [math]A'[/math] оператора [math]f : V \to V[/math] в базисі [math]\{e'_{i}\}[/math] пов'язана з матрицею [math]A[/math] цього оператора в базисі[math]\{e_{i}\}[/math] так: [math]A' = S^{-1}A S[/math] .

Означення 11.  Матриця [math] B [/math] називається подібною матриці [math] A [/math] , якщо існує така неособлива матриця
[math] S [/math] , що [math]B = S^{-1}A S[/math] .

Відношення подібності є відношенням еквівалентності.

Твердження 12.  Визначники подібних матриць збігаються.

Таким чином, визначник матриці лінійного оператора не залежить від вибору базису. Отже, існує поняття визначника лінійного
оператора.

Означення 13.  Нехай [math]\lambda [/math] - деяка змінна. Матриця [math]\lambda E - A[/math] називається характеристичною матрицею матриці [math]A[/math] . Многочлен [math]det (\lambda E - A)[/math] відносно [math]\lambda[/math] називається характеристичним многочленом матриці [math]A[/math] . Рівняння [math]det (\lambda E - A) = 0[/math] називається характеристичним рівнянням матриці [math]A[/math] , а корені цього рівняння називаються характеристичними коренями цієї матриці.


Твердження 14. Характеристичні многочлени подібних матриць однакові.

Отже, характеристичний многочлен матриці лінійного оператора не залежить від вибору базису і тому називається характеристим многочленом оператора.

Наслідок 15. Подібні матриці мають однакові сліди.

Як бачимо, крім визначника оператора, існує ще одна величина, яка не змінюється при зміні базису простору, в якому діє оператор. Таким чином, слід матриці оператора назвемо слідом оператора і позначимо [math] tr f[/math] .

Визначник і слід оператора називають інваріантами оператора.

Теорема 16.  (Гамільтона - Келі). Усяка матриця є коренем свого характеристичного многочлена.

 

Лінійні простори

Означення 1. Множина [math] V [/math] елементів (далі, векторів) називається векторним ( або лінійним) простором над полем[math]K[/math], якщо в [math] V [/math] означено бінарну операцію [math]V \times V \to V [/math],  яку  позначають  як  додавання, ( a_{1}, a_{2}) \mapsto a_{1} + a_{2}[/math], і зовнішню бінарну операцію [math]K \times V \to V [/math], яку позначають як множення:[math](\lambda, a) \mapsto \lambda a [/math], причому ці операції задовільняють слідуючим аксіомам:
1. Відносно операції додавання множина [math] V [/math] утворює комутативну групу. Нейтральний елемент цієї групи називають нуль-вектором і позначають 0.

2.  Множення векторів на елементи поля [math]K[/math] унітарне, тобто [math]1a = a[/math] для всіх [math]a[/math], і асоціативне, тобто [math] \alpha (\beta a) = (\alpha \beta) a [/math] для всіх [math]\alpha[/math], [math]\beta \in K, \enspace a \in V[/math].

3. Операції додавання і множення пов'язані з законами дистрибутивності:[display] \lambda (a + b) = \lambda a + \lambda b, \enspace (\lambda + \mu)a = \lambda a + \mu a,[/display] для всіх [math]\lambda, \mu \in K; \enspace a,b \in V[/math].

Умови 1 - 3 називають аксіомами векторного простору.
Якщо [math] K [/math] - поле [math] R [/math] всіх дійсних чисел, то простір називають дійсним векторним простором; якщо
простір розглядається над полем [math] C [/math] всіх комплексних чисел, то його називають комплексним векторним простором.

Наслідки з аксіом векторного простору.

1. Нульовий вектор лінійного простору єдиний.

2. Для кожного вектора лінійного простору існує єдиний протилежний вектор.

3. Добуток будь-якого вектора на нуль-скаляр є нуль-вектор.

4. Добуток нуль-вектора на будь-який скаляр є нуль-вектор.

5. [math]-a = (-1)a[/math] для будь-якого [math]a \in V[/math].

6. Якщо [math]\lambda a = 0[/math], то або [math]\lambda = 0[/math], або [math]a = 0[/math].

Приклади векторних просторів:

1. Множина всіх упорядкованних сукупностей дійсних чисел довжини [math]n[/math] утворює дійсний лінійний простір, який позначають [math]R^{n}[/math] і називають простором рядків (або стовпців). Операції додавання і множення на скаляри елементів цього простору визначені в \S 1.

2. Множина всіх матриць одного розміру, елементи яких належать полю [math] K [/math], утворює лінійний простір [math] M( K )[/math] над полем [math] K[/math] відносно операції додаваня матриць і множення матриці на скаляр, означенних в \S 1.

3. Множина [math] R_{n}[x][/math] всіх многочленів степеня не вище [math]n[/math] з дійсними коефіцієнтами є дійсним лінійним простором з відомими діями додавання многочленів і множення на скаляри.

4. Множина всіх комплексних чисел [math] C [/math] відносно операції додавання комплексних чисел й операції множення комплексних чисел на дійсні числа є дійсний векторний простір.

5. Множина всіх комплексних чисел [math] C [/math] відносно означених в ньому операцій додавання і множення є комплексний
векторний простір.

Означення 2.  Система векторів [math]a_{1}, a_{2}, \ldots , a_{m}[/math] називається лінійно незалежною, якщо рівність[math]\lambda_{1}a_{1} + \lambda_{2}a_{2} +...+ \lambda_{m}a_{m} = 0[/math] можлива лише при всіх [math]\lambda_{i} = 0 \enspace (i = 1, 2, \ldots , m)[/math], тобто лише тривіальна лінійна комбінація цих векторів дорівнює нуль-вектору. Якщо існує
нетривіальна лінійна комбінація (тобто, не всі [math]\lambda_{i}[/math] одночасно дорівнюють нулю) векторів [math]a_{i}[/math], яка дорівнює нуль-вектору, то система векторів називається лінійно залежною.

Твердження 3.  Усяка система векторів, що містить нуль-вектор, або два однакових вектора, є лінійно залежною.

Означення 4.  Сукупність векторів [math]\{ a_{i}\}_{1}^{n}[/math] простору [math]V[/math] називають базисом простору  [math]V[/math], якщо кожний вектор [math]x[/math] простору [math]V[/math] однозначно зображається лінійною комбінацією векторів [math]\{ a_{i}\}_{1}^{n}[/math], тобто [math]x = x_{1}a_{1} + x_{2}a_{2} + ... + x_{n}a_{n}[/math]. Таке зображення називають розкладом вектора[math]x[/math] за базисом [math]\{ a_{i}\}_{1}^{n}[/math]. Скаляри [math]x_{i}[/math] лінійної комбінації називають координатами вектора [math]x[/math] відносно базису [math]\{ a_{i}\}_{1}^ {n}[/math].

Однозначність розкладу нуль-вектора вказує на важливу властивість базису, а саме: елементи базиса складають лінійно незалежну сукупність векторів.

Означення 5.  Лінійною оболонкою сукупності векторів називатимемо множину всіх можливих лінійних комбінацій векторів сукупності.

Означення 6.  Лінійний простір [math]V[/math] називається [math]n[/math]-вимірним, якщо кількість елементів базиса дорівнює [math]n[/math]. При цьому, число [math]n[/math] називають розмірністю простору і позначають [math]dim V[/math]. Взагалі, якщо
число [math]n[/math]скінчене, то простір [math]V[/math] називають скінченновимірним простором.

Теорема 7. У скінченновимірному просторі кількість елементів базиса не залежить від вибору базису.

Нехай в просторі розмірності [math]n[/math] вибрані два базиси [math]\{ e_{i}\}_{1}^{n}[/math] й [math]\{e'_{j}\}_{1}^{n}[/math]. Тоді існують розклади:[display] e'_{i} = \tau_{1i}e_{1} + \tau_{2i}e_{2} + \cdots + \tau_{ni}e_{n} = \sum_{k=1}^{n} [/display]

Матриця [math]T = (\tau_{ij})[/math] називається  матрицею переходу від базису [math]\{ e_{i}\}_{1}^{n}[/math] до базису [math]\{e_{j}^{'}\}_{1}^{n}[/math].

Координати вектора [math]x[/math] відносно базису [math]\{ e_{i}\}_{1}^{n}[/math] та базису [math]\{e'_{j}\}_{1}^{n}[/math] пов'язані матрицею переходу так:[display]\pmatrix{ x_{1} \\ x_{2} \\ \ldots \\ x_{n} \enspace} = \enspace \pmatrix{\tau_{11} & \tau_{12} & \ldots & \tau_{1n} \\
\tau_{21} & \tau_{22} & \ldots & \tau_{2n} \\
\ldots & \ldots & \ldots & \ldots \\
\tau_{n1} & \tau_{n2} & \ldots & \tau_{nn} \\}
\pmatrix{x'_{1} \\ x'_{2} \\ \ldots \\ x'_{n}}[/display]

 

Лінійні функціонали. Спряжені простори.

Означення 1.  Лінійним функціоналом, або лінійною формою, на векторному просторі [math]V[/math] над полем [math]K[/math] називається лінійне відображення [math]f[/math] простору [math]V[/math] в поле скалярів [math]K[/math], тобто для будь-яких векторів [math]x, y \in V[/math], та [math]\alpha \in K[/math] маємо [display] f(x + y) = f(x) + f(y), f(\alpha x) = \alpha f(x).[/display]

Нехай у просторі [math]V[/math] вибрано базис [math]e_{1}, e_{2},\ldots , e_{n}[/math].

Для будь-якого [math]x \in V, \enspace f(x) = f(x_{1}e_{1} + x_{2}e_{2} + \cdots + x_{n}e_{n}) = x_{1}f(e_{1}) + x_{2}f(e_{2}) + \cdots + x_{n}f(e_{n})[/math]. Позначимо [math]f(e_{i}) = a_{i} \in K, \enspace i = 1, 2, \ldots ,n[/math]; дістанемо [math]f(x) =
a_{1}x_{1} + a_{2}x_{2} + \cdots + a_{n}x_{n}[/math].

Таким чином, лінійний функціонал [math]f(x)[/math] означено сукупністю чисел [math] a_{1}, a_{2}, \ldots , a_{n} [/math] відносно вибраного базису.

Вираз [math]a_{1}x_{1} + a_{2}x_{2} + \cdots + a_{n}x_{n}[/math] називається  лінійною формою від координат [math]x_{1}, x_{2}, \cdots , x_{n}[/math].

Для лінійних функціоналів визначаються дії додавання та множення на скаляр з поля [math]K[/math]: [display] (f_{1} + f_{2})(x) = f_{1}(x) + f_{2}(x), \enspace (\alpha f)(x) = \alpha f(x), \alpha \in K.[/display]

Означення 2.  Множина всіх лінійних функціоналів простору [math]V[/math] над полем [math]K[/math], утворює векторний простір над полем [math]K[/math], який називається спряженим (дуальним) простором до простору [math]V[/math] і позначається [math]V^{*}[/math].

Позначимо через [math]f_{i}[/math] функціонал, який кожному вектору [math]x[/math] ставить у відповідність його [math]i[/math]-ту координату, тобто [math]f_{i}(x) = x_{i}[/math]. Тоді [math]f_{i}[/math] - лінійний функціонал, та [math]f_{i}(e_{i}) = 1; \enspace f_{i}(e_{j}) = 0[/math], якщо [math] i \neq j[/math].

Система функціоналів [math]f_{1}, f_{2}, \ldots , f_{n}[/math] утворює базис спряженого простору [math]V^{*}[/math], який називають  двоїстим, або  дуальним до базису [math]e_{1}, e_{2},\ldots , e_{n}[/math] простору [math]V[/math].

Нехай у просторі [math]V[/math] вибрано новий базис [math]e'_{1}, e'_{2}, \ldots , e'_{n}[/math].

Координати вектора [math]x[/math] у старому базисі пов'язані з координатами у новому базисі так:[display]\pmatrix{
x_{1} \\ x_{2} \\ \ldots \\ x_{n} \\
\enspace }= \enspace\pmatrix{
c_{11} & c_{12} & \ldots & c_{1n} \\
c_{21} & c_{22} & \ldots & c_{2n} \\
\ldots & \ldots & \ldots & \ldots \\
c_{n1} & c_{n2} & \ldots & c_{nn} \\}
\pmatrix {x'_{1} \\ x'_{2} \\ \ldots \\ x'_{n} \\}[/display] де матриця [math]C = (c_{ij})[/math] - матриця переходу від базису
[math]\{e_{i}\}[/math] до базису [math]\{e'_{i}\}[/math].
[display] f(x) =\sum_{i=1}^{n} a_{i}x_{i} =\sum_{i=1}^{n}a_{i} ((\sum_{k=1}^{n} c_{ik}x'_{k}) =\sum_{k=1}^{n}(\sum_{i=1}^{n} c_{ik}a_{i}) x'_{k}.[/display]

Отже, координати функціонала [math]f(x)[/math] у базисі, дуальному до базису [math]\{e'_{1},e'_{2}, \ldots ,e'_{n} \}[/math] будуть:
[math]a'_{k} =\sum_{i=1}^{n} c_{ik}a_{i}[/math], або  [display] \pmatrix{a_{1} \\ a_{2} \\ \ldots \\ a_{n} \\
\enspace} = \enspace\pmatrix{
c_{11} & c_{12} & \ldots & c_{1n} \\
c_{21} & c_{22} & \ldots & c_{2n} \\
\ldots & \ldots & \ldots & \ldots \\
c_{n1} & c_{n2} & \ldots & c_{nn} \\}
\pmatrix{ a'_{1} \\ a'_{2} \\ \ldots \\ a'_{n} \\}[/display]

При цьому кажуть, що координати функціонала змінюються контравараінтно з координатами вектора. Відповідно цьому, лінійні
функціонали на просторі [math]V[/math] називають ковекторами .

Матрицю [math](C^{T})^{-1}[/math] називають контраградієнтною  до матриці [math]C[/math].
 

Матриці та дії над ними

Означення 1.  Упорядковану сукупність елементів  поля [math]K [/math] ми розуміємо  поле  дійсних або комплексних чисел  назвемо вектором.   Елементи сукупності називають компонентами вектора.

Елементи поля  [math] K [/math]  називають  скалярами, або числами.

Рядком назвемо вектор, у якого  компоненти  записані слідуючим чином: [math]\pmatrix {a_{1} & a_{2}& \ldots & a_{n}}
[/math] .
Стовпець - це вектор, записаний у вигляді: [math]\pmatrix {a_{1} \\ a_{2}\\ \ldots \\ a_{n}}
[/math] .

Означення 2. Вектор, усі компоненти якого  дорівнюють  нулю,  називають нульовим.

Означення 3.  Кількість   компонента   вектора назвемо розміром  вектора.  Розмір  рядка  (стовпця)  іноді називають довжиною рядка (стовпця).

Над векторами одного розміру визначена покомпонентна операція додавання, тобто [math]( a_{j} ) + ( b_{j} ) = ( a_{j} + b_{j}
)[/math] , а також визначена операція  множення  на число: [math] \lambda( a_{j} ) = ( \lambda a_{j} )[/math] .

Означення 4. Сума добутків векторів на деякі скаляри називають лінійною комбінацією цих векторів.

Означення 5. Матриця - це прямокутна таблиця, яка складена з деякої кількості рядків ( або стовпців ) однакової довжини.

Матриці записують слідуючим чином :
[display]
A =
\pmatrix{
a_{11} & a_{12} & \ldots & a_{1n} \\
a_{21} & a_{22} & \ldots & a_{2n} \\
\ldots & \ldots & \ldots & \ldots \\
a_{m1} & a_{m2} & \ldots & a_{mn}}
= ( a_{ij} ) = ( a_{ij} )_{mn} = ( a^{i}_{j} )
[/display]

Кажуть, що матриця [math] A [/math]  є прямокутна матриця розміру [math] (m, n) [/math] .

Якщо [math]m = n[/math] , то [math]A [/math] називається квадратною матрицею порядку [math] n [/math] .

Числа [math]a_{ij}[/math] називають  елементами матриці, індекс [math]i[/math] вказує на номер рядка, [math] j [/math] на номер стовпця, на перетині яких розташований даний елемент.

Матриця, всі елементи якої дорівнюють нулю, називається  нульовою. Позначають нуль-матрицю просто 0 (нуль).

Елементи квадратної матриці, які розташовані на перетині рядків та стовпців з однаковими номерами, складають  головну діагональ квадратної матриці.

Слідуючі квадратні матриці мають назву:
Одинична, якщо елементи головної діагоналі дорівнюють одиниці, а усі інши елементи матриці дорівнюють нулю;
одиничну матрицю порядку [math] n [/math] позначають [math]E_{n}[/math] ( або просто [math] E [/math] );
 Діагональна, якщо [math] a_{ij} = 0[/math] при [math] i \not = j[/math];
Трикутна, якщо [math] a_{ij} = 0[/math] при [math]i < j[/math] (ліва трикутна);
Діагональна матриця, у якої елементи головної діагоналі однакові, називається  скалярною.
Трикутна матриця називається  унітрикутною, якщо всі елементиїї головної діагоналі дорівнюють [math]1[/math].

Нехай матриці [math]A[/math] і [math]B[/math] порядку [math]n[/math] і [math] m [/math] відповідно, матриця [math] C [/math] розміру [math] (m,n) [/math], а матриця [math] D [/math] розміру [math] (n,m)[/math]. Тоді матриця виду [math]\pmatrix{
A & D \\ C & B \\ }[/math] називають блочною матрицею.

Якщо в такій блочній матриці матриця [math] C [/math] або [math] D [/math] нульова, то таку матрицю назвемо  блочно-трикутною; якщо матриці [math] C [/math] і[math] D [/math] одночасно нульові, то - блочно-діагональною.

Означення 6. Якщо рядки матриці [math] A [/math] записати стовпцями (у порядку слідування рядків матриці [math] A [/math]), то таке перетворення називають транспонуванням матриці [math] A [/math] . Транспоновану матрицю позначають [math]A^{T}[/math].

Якщо довільна квадратна матриця [math] A [/math] задовільняє умові [math]A^{T} = A[/math], то така матриця називається 
симетричною, якщо ж [math]A^{T} = - A[/math], то - кососиметричною.

Означення 7.  Нехай [math]A = (a_{ij}), \enspace B = (b_{ij})[/math] - матриці однакового розміру. Сумою цих матриць називається матриця [math] A + B = C =(c_{ij}) [/math],  де [math] c_{ij} = a_{ij} + b_{ij} [/math], тобто, дія додавання матриць виконується поелементно.

Означення 8.  Добутком матриці [math] A = (a_{ij})[/math] на число [math] \lambda [/math] називається матриця [math]\lambda A = (\lambda a_{ij})[/math].

Означення 9.  Добутком рядка на стовпець однакової довжини є сума добутків відповідних компонент. [display] A =\pmatrix{ a_{1}, a_{2}, \ldots , a_{n} }, \enspace B =\pmatrix{
b_{1} \\ b_{2}\\ \ldots \\ b_{n}}[/display]

[display]A B = a_{1}b_{1} + a_{2}b_{2} +...+ a_{n}b_{n}[/display].

Означення 10. Добутком однієї матриці на другу є матриця, у якої елемент, розташований на перетині [math]i[/math]-го
рядка та [math] j [/math]-го стовпця, визначається як добуток [math] i [/math]-го рядка першої матриці на [math] j [/math]-тий стовпець другої.
[display] A = (a_{ik})_{mn}, \enspace B = (b_{kj})_{nr}, \enspace C =
(c_{ij})_{mr}[/display]
[display] c_{ij} = a_{i1}b_{1j} + a_{i2}b_{2j} + \cdots + a_{in}b_{nj} = \sum_{k=1}^{n} a_{ik}b_{kj}[/display].

Зауважимо, що добуток визначається лише в тому випадку, коли число стовпців першої матриці дорівнює числу рядків другої.
Основні властивості операцій додавання матриць і множення матриці на число:
1. [math] A + B = B + A[/math] (комутативність).

2.  [math] A + ( B + C ) = ( A + B ) + C [/math] (асоціативність).

3.  [math] A + 0 = A [/math], при будь-якій матриці [math] A [/math].

4.  Для будь-якої матриці [math] A [/math] існує протилежна матриця [math](-A)[/math], така, що [math] A + (-A) = 0[/math].

Властивості множення матриць:
1. [math](\alpha A)B = A(\alpha B) = \alpha A B[/math], де [math]\alpha [/math]- число.

2. [math] (A_{1}+A_{2})B = A_{1}B + A_{2}B, A(B_{1}+B_{2}) = AB_{1} + AB_{2}.[/math]

3.  [math] A( B C ) = ( A B )C[/math] (асоціативність).

Множення матриць є некомутативною операцією.

Властивості операції транспонування:
1.  [math] ( A^{T} )^{T} = A.[/math]

2.  [math] ( A + B )^{T} = A^{T} + B^{T}.[/math]

3.  [math] ( A B )^{T} = B^{T} A^{T}. [/math]

Означення 11.  Слідом квадратної матриці називається сума елементів головної діагоналі. Слід матриці [math] A [/math] позначають [math]tr(A)[/math].

 

Обернена матриця

Означення 1. Якщо для квадратної матриці [math]A [/math] існує така матриця [math]X[/math], що [math]A X = X A = E[/math] (одинична матриця), то матрицю [math]X[/math] називають оберненою матрицею до матриці [math]A[/math] і позначають [math]A^{-1}[/math].

Твердження 2. Обернена матриця для кожної матриці єдина.

Означення 3.  Матриця, детермінант якої дорівнює нулю, називається особливою (виродженою). В іншому випадку, матриця називається неособливою (невиродженою).

Теорема 4.  Щоб матриця мала обернену, необхідно і достатньо, щоб вона була неособливою.

Якщо [math] det A \not = 0[/math], то [display] A^{-1}=\frac{1}{det A} =\pmatrix{
A_{11} & A_{21} & \ldots & A_{n1} \\
A_{12} & A_{22} & \ldots & A_{n2} \\
\ldots & \ldots & \ldots& \ldots \\
A_{1n} & A_{2n} & \ldots & A_{nn} \\}
= \frac{1}{det A} \tilde A, [/display], де [math]A_{ij}[/math]- алгебраїчні доповнення. Матрицю [math]\tilde A[/math] називають  приєднанною до матриці [math]A[/math].

Властивості оберненої матриці:
1.  [math]det (A^{-1}) = (det A)^{-1}.[/math]

2.  [math](A B)^{-1}= B^{-1}A^{-1}.[/math]

3.  [math](A^{T})^{-1}= (A^{-1})^{T}.[/math]

 

Підпростори. Пряма сума підпросторів.

Означення 1.  Підпростором векторного простору називається непорожня підмножина векторів простору, яка сама утворює векторний простір.

Приклади. 1. У будь-якому просторі існують два тривіальних підпростори - сам простір й підпростір, складений тільки з нульового вектора.

2. У просторі [math] R_{n}[x][/math] підпросторами будуть, наприклад, всі [math]R_{k}[x][/math], де [math]k < n[/math].

3. Лінійна оболонка будь-якої сукупністі векторів простору утворює підпростір.

4. Сукупність усіх розв'язків однорідної системи лінійних рівнянь з [math]n[/math] невідомими утворює підпростір простору
рядків довжини [math]n[/math]. Розмірність цього підпростору дорівнює [math]n - r[/math] , де [math]r[/math] ранг заданої системи. Фундаментальна система розв'язків є базисом простору розв'язків.

Означення 2.  Нехай [math]V_{1}[/math] і [math]V_{2}[/math] - підпростори простору [math]V[/math]. Сумою підросторів [math]V_{1} + V_{2}[/math] називається множина [math]\{x_{1} + x_{2} \mid x_{1} \in V_{1}, x_{2} \in V_{2}\}[/math]. Перетином підпросторів [math]V_{1} \cap V_{2}[/math] називається множина векторів, які входять одночасно до [math]V_{1}[/math] і [math]V_{2}[/math].

Сума й перетин підпросторів є підпросторами простору [math]V[/math].

Означення 3.  Сума двох підпросторів [math]V_{1}[/math] і [math]V_{2}[/math]називається прямою сумою, якщо для кожного вектора з простору[math]V_{1} + V_{2}[/math] існує однозначне зображення у вигляді суми вектора з [math]V_{1}[/math] і вектора з [math]V_{2}[/math], теж саме, що з рівності [math]x + y = 0[/math] при [math]x \in V_{1}, y \in V_{2}[/math] слідує [math]x = 0, y = 0[/math]. Пряма сума позначається [math]V_{1} \oplus V_{2}[/math].

Твердження 4.  Сума підпросторів деякого простору є прямою, тоді і тільки тоді, коли їх перетин не мав інших векторів, крім нульового.

Наслідок 5. Розмірність прямої суми підпросторів дорівнює сумі розмірностей цих підпросторів.

Означення 6. Вектори [math]v_{1}, \ldots , v_{s}[/math] простору [math]V[/math]називаються лінійно незалежними відносно
його підпростору [math]W[/math], якщо з включення [math]\lambda_{1}v_{1} + \cdots + \lambda_{s}v_{s} \in W[/math] слідує, що [math]\lambda_{1} = \cdots = \lambda_{s} = 0[/math].

Тведження 7. Для того щоб сукупність векторів [math]v_{1}, \ldots , v_{s}[/math] була лінійно незалежною відносно підпростору
[math]W[/math], необхідно і достатньо, щоб сукупність [math]v_{1}, \ldots , v_{s}, e_{1}, \ldots , e_{m}[/math], де [math]e_{1},
\ldots , e_{m}[/math] - базис підпростору [math]W[/math], була лінійно незалежною.

Означення 8.  Вектори [math]v_{1}, \ldots , v_{s}[/math] утворюють базис [math]V[/math] відносно [math]W[/math] , якщо вони лінійно-незалежні відносно [math]W[/math] і будь-який вектор [math]x \in V[/math] зображається у виді їх лінійної комбінації з точністю до векторів із [math]W[/math]. Точніше, [math]x = \alpha_{1}v_{1} + \cdots + \alpha_{s}v_{s} + y[/math] , де [math]y \in W[/math].

Твердження 9. Для того щоб вектори [math]v_{1}, \ldots , v_{s}[/math] складали базис [math]V[/math] відносно [math]W[/math] , необхідно і достатньо , щоб вектори [math]v_{1}, \ldots , v_{s}, e_{1}, \ldots , e_{m},[/math] де [math]e_{1}, \ldots , e_{m}[/math] - базис підпростору [math]W[/math], складали базис [math]V[/math].

Наслідок 10. Будь-яка сукупність векторів, що доповнює базис [math]W[/math] до базису [math]V[/math] , є базис [math]V[/math] відносно [math]W[/math]. Будь-яка лінійно незалежна відносно [math]W[/math] сукупність векторів може бути доповнена до базису [math]V[/math] відносно [math]W[/math]. Кількість векторів, складаючих базис [math]V[/math] відносно [math]W[/math], дорівнює [math]dim V - dim W[/math].

 

Системи лінійних рівнянь

У загальному випадку система [math]m[/math] лінійних рівнянь з [math]n[/math] невідомими [math]x_{1}, x_{2}, \ldots , x_{n}[/math]
має слідуючий вигляд:
[display]\cases{
a_{11}x_{1} &+ &a_{12}x_{2} &+& \ldots &+& a_{1n}x_{n} &=& b_{1}\\
a_{21}x_{1} &+ &a_{22}x_{2} &+& \ldots &+& a_{2n}x_{n} &=& b_{2}\\
\ldots & & \ldots & & \ldots & & \ldots & & \\
a_{m1}x_{1} &+ &a_{m2}x_{2} &+& \ldots &+& a_{mn}x_{n}
&=& b_{m} \\}
[/display]

Числа [math]a_{ij}[/math] називають  коефіцієнтами системи, а числа [math] b_{i} [/math] --  вільними членами системи.

Означення 1.  Розв'язком системи лінійних рівнянь називається упорядкована сукупність чисел [math]\alpha_{1}, \alpha_{2}, \ldots ,\alpha_{n}[/math] (тобто, вектор), яка при підстановці замість невідомих перетворює кожне рівняння системи в тотожність.

Означення 2.  Система лінійних рівнянь, яка має хоч один розв'язок, називається сумісною. Якщо система не має розв'язків, то вона називається несумісною.

Означення 3.  Якщо сумісна система має лише один розв'язок, то її називають визначеною; в іншому випадку сумісну систему називають невизначеною.

Означення 4.  Дві системи називаються рівносильними або еквівалентними, якщо вони мають одну і ту ж множину розв'язків.

Означення 5.  Матрицю коефіцієнтів системи лінійних рівнянь називають основною матрицею або, просто, матрицею системи.

Систему лінійних рівнянь перепишемо у вигляді:
[display]\pmatrix{
a_{11} & a_{12} & \ldots & a_{1n} \\
a_{21} & a_{22} & \ldots & a_{2n} \\
\ldots & \ldots & \ldots & \ldots \\
a_{m1} & a_{m2} & \ldots & a_{mn} \\}
[/display]
[display]\pmatrix{x_{1} \\ x_{2} \\ \ldots \\ x_{n} \\} [/display]
[display]\pmatrix{ b_{1} \\ b_{2} \\ \ldots \\ b_{m} \\} [/display]
або скорочено: [math]A X = B[/math]. У такому випадку кажуть, що систему лінійних рівнянь записано у матричному вигляді.

Означення 6.  Матрицю складену з усіх коефіцієнтів при невідомих і вільних членах називають розширеною матрицею системи і позначають:
[display]
\overline{A} =\pmatrix{
a_{11} & a_{12} & \ldots & a_{1n} & b_{1}\\
a_{21} & a_{22}& \ldots  & a_{2n}] &b_{2}\\
\ldots & \ldots & \ldots  & \ldots & \ldots\\
a_{m1} & a_{m2} & \ldots & a_{mn} & b_{m}\\}
[/display]

Означення 7.  Елементарними перетвореннями системи лінійних рівнянь назвемо такі перетворення, які не змінюють її розв'язку.

Легко бачити, що слідуючі перетворення системи є елементарними:
(1) переставлення рівнянь місцями;

(2) множення рівняння на довільне число, відмінного від нуля;

(3) додавання до якогось рівняння іншого рівняння системи, помноженого на деяке число, відмінного від нуля.

Для розв'язку систем лінійних рівнянь застосовується метод Гаусса. Опишемо цей метод. Спочатку зведемо розширену матрицю системи до східчастого виду. Нехай у матриці східчастого виду [math]r[/math] ненульових рядків. Якщо в останньому ненульовому рядку всі елементи дорівнюють нулю, крім елемента з стовпця вільних членів, то система несумісна. Інакше, нехай перші ненульові коефіцієнти ненульових рядків матриці східчастого виду розташовані в стовпцях з номерами [math]k_{1}, \ldots , k_{r}[/math]. Тоді невідомі [math]x_{k_{1}}, \ldots , x_{k_{r}}[/math] називатимемо  головними, а усі інші -  вільними. Очевидно, кількість вільних невідомих дорівнює [math]n - r[/math]. З матриці східчастого виду одержимо систему [math]r[/math] рівняннь з [math] n[/math] невідомими. Дістанемо вирази головних невўіомих через вільні. Ці вирази називаються загальним розв'язком системи.

Надаючи вільним невідомим довільних числових значень, будемо одержувати  частинні розв'язки системи.

Теорема 8 (Критерій сумісності Кронекера - Капеллі).Для сумісності системи лінійних рівняннь необхідно і достатньо, щоб ранг основної матриці системи дорівнював рангу розширеної матриці.

Означення 9.  Спільне значення рангів основної і розширенної матриць називають рангом сумісної системи лінійних рівняннь.

Наслідок 10.  (Критерій визначенності). Якщо ранг системи дорівнює кількості невідомих, то система визначена, якщо меньше - невизначена.
  
Розглянемо випадок, коли кількість рівнянь сумісної системи [math]A X = B[/math] дорівнює кількості невідомих і дорівнює рангу системи. У цьому випадку [math]det A \neq 0[/math]. Тоді [display]A X = B \Rightarrow X = A^{-1}B [/display].

Означення 11.  Система лінійних рівнянь назив ається однорідною, якщо стовпець вільних членів складається з нулів (в іншому випадку -неоднорідною).

Легко бачити, що однорідна система завжди сумісна. Зауважимо, що нульовий вектор задовільняє рівняння усякої однорідної системи. Такий розв'язок однорідної системи називається  тривіальним.

Означення 12.  Фундаментальною системою розв'язків невизначенної однорідної системи лінійних рівнянь називається сукупність таких вектор-розв'язків, коли будь-який розв'язок однозначно зображається у вигляді лінійної комбінації вектор-розв'язків цієї сукупності.

Теорема 13.  Кількість вектор-розв'язків фундаментальною системою розв'язків однорідної системи лінійних рівнянь з [math]n[/math] невідомими дорівнює [math]n - r[/math], де [math]r[/math] - ранг системи.

Теорема 14.  Загальний розв'язок неоднорідної системи рівнянь дорівнює сумі частинного вектор-розв'язку цієї системи та загального вектор-розв'язку однорідної системи з тією ж матрицею коефіцієнтів.

 

Спряжені оператори в унітарному просторі

Означення 1. Спряженим оператором для оператора [math]\varphi[/math] в унітарному просторі [math]V[/math], називається такий оператор [math]\varphi^{*}[/math], що для будь-яких векторів [math]x[/math] і [math]y[/math] простору [math]V[/math] має місце рівність: [display] (\varphi(x), y) = (x, \varphi^{*}(y)).[/display]

Нехай в деякому ортонормованному базисі [math] \cal B [/math] простору [math] V [/math] оператор [math] \varphi [/math] задано матрицею [math] A = (a_{ij}) [/math]. Знайдемо матрицю [math] A^{*}[/math] спряженого оператора [math] \varphi^{*}[/math]. Нехай вектор [math] x [/math] має координати [math] x_{k}[/math], а вектор y має координати [math] y_{i} [/math] відносно базису [math] \cal B [/math]. Тоді [display] ( A x, y ) = \sum_{i=1}^{n} (\sum_{k=1}^{n} a_{ik}x_{k}) \overline{y_{i}} = \sum_{k=1}^{n} x_{k} (\sum_{i=1}^{n} a_{ik} \overline{y_{i}} = (x, \overline{A^{T}} y),[/display] де [math]\overline{A^{T}}[/math] -  транспонована та комплексно-спряжена з матрицею [math]A[/math]. Таким чином, [math]A^{*} = \overline{A^{T}}[/math].

Відзначимо деякі властивості спряженого оператора:
1.  [math](\varphi^{*})^{*} = \varphi[/math].

2.  [math](\varphi + \psi)^{*} = \varphi^{*} + \psi^{*}[/math].

3. [math](\alpha \varphi)^{*} = \overline{\alpha} \varphi^{*}[/math], де [math]\alpha [/math]- скаляр.

4.  [math](\varphi \psi)^{*} = \psi^{*} \varphi^{*}[/math].

5.  [math]\cal E^{*} = \cal E [/math](  \cal E [/math]- тотожній оператор ).

6.  [math](\varphi^{-1})^{*} = (\varphi^{*})^{-1}[/math], якщо [math]\varphi^{-1}[/math] існує.

Означення 2.  Лінійний оператор називається самоспряженим, якщо він збігається з своїм спряженим.

Самоспряжені оператори в унітарному просторі називають  ермітовими, а в евклідовому -  симетричними.

Матриця [math]A[/math] ермітового оператора в ортонормованому базисі задовольняє умові: [math]A = \overline{A^{T}}[/math].

Матриці, які мають таку властивість, називаються  ермітовими.

Матриця спряженого оператора в ортонормованому базисі евклідового простору симетрична.

Тотожний оператор є самоспряженим.

Сумма самоспряжених операторів є самоспряжений оператор.

Добуток самоспряжених операторів є самоспряженим оператором тоді і тільки тоді, коли оператори переставні між собою.

Оператор, обернений до неособливого самоспряженого оператора є самоспряженим оператором.

Теорема 3. Власні числа самоспряженого оператора дійсні.

 

Унітарні оператори

Означення 1.  Лінійний оператор [math] \varphi [/math] називається унітарним, якщо він для кожної пари векторів унітарного простору зберігає скалярний добуток, тобто [math] (\varphi(x), \varphi(y)) = (x, y)[/math]. Оператори евклідового простору з такою властивістю називаються ортогональними.

Ортогональний оператор зберігає довжину вектора.

Для унітарного оператора [math]\varphi[/math] має місце рівність: [math]\varphi^{-1} = \varphi^{*}[/math].

Теорема 2. Унітарний оператор переводить ортонормований базис в ортонормований базис. Навпаки, якщо лінійний оператор
переводить ортонормований базис в ортонормований базис, то це унітарний оператор.

Матриця [math]A[/math] унітарного оператора в ортонормованому базисі є ортогональною, тобто її стовпці нормовані і попарно
ортогональні (теж саме, що [math]\overline{A^{T}} = A^{-1}[/math]).

Визначник ортогональної матриці дорівнює 1 або -1.

Добуток двох унітарних (ортогональних) операторів є унітарним (ортогональним) оператором.

Оператор, який є оберненим до унітарного (ортогонального) оператора, є унітарним (ортогональним) оператором.

Власні числа унітарного оператора за модулем дорівнюють 1.

Означення 3. Існує ортонормований базис, в якому матриця ортогонального оператора має блочно-діагональний вид, причому ці блоки є числа 1, -1, або матриці другого порядку виду:[display]\pmatrix{
cos \varphi & -sin \varphi \\
sin \varphi & cos \varphi \\}[/display]