Gram-Schmidtův proces
podle Marco Taboga, PhD
Gram-Schmidtův proces (nebo postup) je posloupnost operací, které umožňují transformovat množinu lineárně nezávislých vektorů na množinu ortonormálních vektorů, které pokrývají stejný prostor, jaký pokrývá původní množina.
Předpoklady
Zopakujme si některé pojmy, které jsou nezbytné pro pochopení Gram-Schmidtova procesu.
Připomeňme si, že o dvou vektorech a
říkáme, že jsou ortogonální tehdy a jen tehdy, když je jejich vnitřní součin roven nule, to znamená,
Při daném vnitřním součinu můžeme definovat normu (délku) vektoru takto:
Množina vektorů se nazývá ortonormální tehdy a jen tehdy, když její prvky mají jednotkovou normu a jsou navzájem ortogonální. Jinými slovy, množina vektorů
je ortonormální tehdy a jen tehdy, když
Dokázali jsme, že vektory ortonormální množiny jsou lineárně nezávislé.
Je-li báze vektorového prostoru zároveň ortonormální množinou, nazývá se ortonormální báze.
Projekce na ortonormální množiny
Při Gramově-Schmidtově postupu opakovaně používáme následující větu, která ukazuje, že každý vektor lze rozložit na dvě části: 1) jeho projekci na ortonormální množinu a 2) reziduum, které je ortogonální k dané ortonormální množině.
Věta Nechť je vektorový prostor vybavený vnitřním součinem
. Nechť
je ortonormální množina. Pro libovolný
máme
kde
je ortogonální k
pro libovolné
DefinicePak pro každé
máme, že
kde: v krocích
a
jsme využili toho, že vnitřní součin je lineární ve svém prvním argumentu; v kroku
jsme použili fakt, že
pokud
, protože máme co do činění s ortonormální množinou; v kroku
jsme použili fakt, že norma
je rovna 1. Proto je
, jak je definován výše, ortogonální ke všem prvkům ortonormální množiny, což dokazuje větu.
Výraz se nazývá lineární projekce
na ortonormální množinu
, zatímco výraz
se nazývá reziduum lineární projekce.
Normalizace
Dalším snad zřejmým faktem, který budeme v Gram-Schmidtově postupu opakovaně používat, je, že vezmeme-li libovolný nenulový vektor a vydělíme jej jeho normou, pak výsledkem dělení je nový vektor, který má jednotkovou normu.
Jinými slovy, jestliže , pak podle vlastnosti definičnosti normy máme, že
V důsledku toho můžeme definovata podle pozitivity a absolutní homogenity normy, máme
Přehled postupu
Nyní, když víme, jak normalizovat vektor a jak jej rozložit na projekci na ortonormální množinu a reziduum, jsme připraveni vysvětlit Gramův-Schmidtův postup.
Uvedeme přehled postupu, poté jej vyjádříme formálně jako větu a všechny technické detaily probereme v důkazu věty.
Zde je přehled.
Máme danou množinu lineárně nezávislých vektorů .
Na začátku procesu normalizujeme první vektor, tj. definujeme
Ve druhém kroku promítneme na
:
kde
je reziduum projekce.
Poté reziduum normalizujeme:
Později dokážeme, že (aby bylo možné provést normalizaci), protože výchozí vektory jsou lineárně nezávislé.
Takto získané dva vektory a
jsou ortonormální.
Ve třetím kroku promítneme na
a
:
a vypočítáme reziduum projekce
.
Poté jej normalizujeme:
Takto postupujeme, dokud nedostaneme poslední normalizované reziduum .
Na konci procesu tvoří vektory ortonormální množinu, protože:
-
jsou výsledkem normalizace, a v důsledku toho mají jednotkovou normu;
-
každý
je získán z rezidua, které má vlastnost být ortogonální k
.
Pro doplnění tohoto přehledu připomeňme, že lineární rozpětí je množina všech vektorů, které lze zapsat jako lineární kombinace
; označujeme ji
a je to lineární prostor.
Protože vektory jsou lineárně nezávislé kombinace
, lze každý vektor, který lze zapsat jako lineární kombinaci
, zapsat také jako lineární kombinaci
. Proto se rozpětí obou množin vektorů shodují:
Formální tvrzení
Gramův-Schmidtův postup zde formalizujeme jako větu, jejíž důkaz obsahuje všechny technické podrobnosti postupu.
Věta Nechť je vektorový prostor vybavený vnitřním součinem
. Nechť
jsou lineárně nezávislé vektory. Pak existuje množina ortonormálních vektorů
taková, že
pro libovolný
.
Důkaz provedeme indukcí: nejprve dokážeme, že věta platí pro , a pak dokážeme, že platí pro obecný
, jestliže platí pro
. Když
, má vektor
jednotkovou normu a sám o sobě tvoří ortonormální množinu: žádné jiné vektory neexistují, takže podmínka ortogonality je triviálně splněna. Množina
je množina všech skalárních násobků
, které jsou zároveň skalárními násobky
(a naopak). Proto
Nyní předpokládejme, že věta je pravdivá pro
. Pak můžeme promítnout
na
:
kde reziduum
je ortogonální k
. Předpokládejme, že
. Pak,
protože podle předpokladu
pro libovolný
, máme, že
pro libovolný
, kde
jsou skaláry. Proto,
jinými slovy, předpoklad, že
vede k závěru, že
je lineární kombinací
. To však není možné, protože jedním z předpokladů věty je, že
jsou lineárně nezávislé. V důsledku toho musí platit, že
. Můžeme tedy reziduum normalizovat a definovat vektor
, který má jednotkovou normu. Již víme, že
je ortogonální k
. Z toho vyplývá, že také
je ortogonální k
. Tedy
je ortonormální množina. Nyní vezměme libovolný vektor
, který lze zapsat jako
kde
jsou skaláry. Protože podle předpokladu
máme, že rovnici (2) lze zapsat také jako
kde
jsou skaláry, a: v kroku
jsme použili rovnici (1); v kroku
jsme použili definici
. Tím jsme dokázali, že každý vektor, který lze zapsat jako lineární kombinaci
, lze také zapsat jako lineární kombinaci
. Předpoklad (3) umožňuje zcela analogicky dokázat i obrácený důkaz:
Jinými slovy, každá lineární kombinace
je také lineární kombinací
. To dokazuje, že
a uzavírá důkaz.
Každý prostor vnitřního součinu má ortonormální bázi
Následující věta představuje důležitý důsledek Gram-Schmidtova procesu.
Věta Nechť je vektorový prostor vybavený vnitřním součinem
. Jestliže
má konečnou dimenzi
, pak pro
existuje ortonormální báze
.
Protože má konečnou dimenzi, existuje pro
alespoň jedna báze tvořená
vektory
. Na tuto bázi můžeme aplikovat Gram-Schmidtův postup a získat ortonormální množinu
. Protože
je báze, zahrnuje
. Proto
Takže
je ortonormální báze
.
Řešená cvičení
Níže najdete několik cvičení s vysvětleným řešením.
Cvičení 1
Uvažujme prostor všech
vektorů s reálnými položkami a vnitřním součinem
kde
a
je transpozice
. Definujte vektor
Normalizujte .
Norma je
Takže, normalizace
je
Cvičení 2
Uvažujme prostor všech
vektorů s reálnými položkami a vnitřním součinem
kde
. Uvažujme dva lineárně nezávislé vektory
Transformujte je do ortonormální množiny pomocí Gram-Schmidtova postupu.
Norma je
Tedy, první ortonormální vektor je
Vnitřní součin
a
je
Projekce
na
je
Reziduál projekce je
Norma reziduálu je
a normovaný reziduál je
Takže, ortonormální množina, kterou jsme hledali, je
Jak citovat
Citujte prosím jako:
Taboga, Marco (2017). „Gram-Schmidtův proces“, Přednášky z maticové algebry. https://www.statlect.com/matrix-algebra/Gram-Schmidt-process.
Leave a Reply