Gram-Schmidtův proces
podle Marco Taboga, PhD
Gram-Schmidtův proces (nebo postup) je posloupnost operací, které umožňují transformovat množinu lineárně nezávislých vektorů na množinu ortonormálních vektorů, které pokrývají stejný prostor, jaký pokrývá původní množina.
Předpoklady
Zopakujme si některé pojmy, které jsou nezbytné pro pochopení Gram-Schmidtova procesu.
Připomeňme si, že o dvou vektorech a říkáme, že jsou ortogonální tehdy a jen tehdy, když je jejich vnitřní součin roven nule, to znamená,
Při daném vnitřním součinu můžeme definovat normu (délku) vektoru takto:
Množina vektorů se nazývá ortonormální tehdy a jen tehdy, když její prvky mají jednotkovou normu a jsou navzájem ortogonální. Jinými slovy, množina vektorů je ortonormální tehdy a jen tehdy, když
Dokázali jsme, že vektory ortonormální množiny jsou lineárně nezávislé.
Je-li báze vektorového prostoru zároveň ortonormální množinou, nazývá se ortonormální báze.
Projekce na ortonormální množiny
Při Gramově-Schmidtově postupu opakovaně používáme následující větu, která ukazuje, že každý vektor lze rozložit na dvě části: 1) jeho projekci na ortonormální množinu a 2) reziduum, které je ortogonální k dané ortonormální množině.
Věta Nechť je vektorový prostor vybavený vnitřním součinem . Nechť je ortonormální množina. Pro libovolný mámekde je ortogonální k pro libovolné
DefinicePak pro každé máme, žekde: v krocích a jsme využili toho, že vnitřní součin je lineární ve svém prvním argumentu; v kroku jsme použili fakt, že pokud , protože máme co do činění s ortonormální množinou; v kroku jsme použili fakt, že norma je rovna 1. Proto je , jak je definován výše, ortogonální ke všem prvkům ortonormální množiny, což dokazuje větu.
Výraz se nazývá lineární projekce na ortonormální množinu , zatímco výraz se nazývá reziduum lineární projekce.
Normalizace
Dalším snad zřejmým faktem, který budeme v Gram-Schmidtově postupu opakovaně používat, je, že vezmeme-li libovolný nenulový vektor a vydělíme jej jeho normou, pak výsledkem dělení je nový vektor, který má jednotkovou normu.
Jinými slovy, jestliže , pak podle vlastnosti definičnosti normy máme, že
V důsledku toho můžeme definovata podle pozitivity a absolutní homogenity normy, máme
Přehled postupu
Nyní, když víme, jak normalizovat vektor a jak jej rozložit na projekci na ortonormální množinu a reziduum, jsme připraveni vysvětlit Gramův-Schmidtův postup.
Uvedeme přehled postupu, poté jej vyjádříme formálně jako větu a všechny technické detaily probereme v důkazu věty.
Zde je přehled.
Máme danou množinu lineárně nezávislých vektorů .
Na začátku procesu normalizujeme první vektor, tj. definujeme
Ve druhém kroku promítneme na :kde je reziduum projekce.
Poté reziduum normalizujeme:
Později dokážeme, že (aby bylo možné provést normalizaci), protože výchozí vektory jsou lineárně nezávislé.
Takto získané dva vektory a jsou ortonormální.
Ve třetím kroku promítneme na a : a vypočítáme reziduum projekce .
Poté jej normalizujeme:
Takto postupujeme, dokud nedostaneme poslední normalizované reziduum .
Na konci procesu tvoří vektory ortonormální množinu, protože:
-
jsou výsledkem normalizace, a v důsledku toho mají jednotkovou normu;
-
každý je získán z rezidua, které má vlastnost být ortogonální k .
Pro doplnění tohoto přehledu připomeňme, že lineární rozpětí je množina všech vektorů, které lze zapsat jako lineární kombinace ; označujeme jia je to lineární prostor.
Protože vektory jsou lineárně nezávislé kombinace , lze každý vektor, který lze zapsat jako lineární kombinaci , zapsat také jako lineární kombinaci . Proto se rozpětí obou množin vektorů shodují:
Formální tvrzení
Gramův-Schmidtův postup zde formalizujeme jako větu, jejíž důkaz obsahuje všechny technické podrobnosti postupu.
Věta Nechť je vektorový prostor vybavený vnitřním součinem . Nechť jsou lineárně nezávislé vektory. Pak existuje množina ortonormálních vektorů taková, žepro libovolný .
Důkaz provedeme indukcí: nejprve dokážeme, že věta platí pro , a pak dokážeme, že platí pro obecný , jestliže platí pro . Když , má vektor jednotkovou normu a sám o sobě tvoří ortonormální množinu: žádné jiné vektory neexistují, takže podmínka ortogonality je triviálně splněna. Množina je množina všech skalárních násobků , které jsou zároveň skalárními násobky (a naopak). Proto Nyní předpokládejme, že věta je pravdivá pro . Pak můžeme promítnout na :kde reziduum je ortogonální k . Předpokládejme, že . Pak,protože podle předpokladu pro libovolný , máme, že pro libovolný , kde jsou skaláry. Proto,jinými slovy, předpoklad, že vede k závěru, že je lineární kombinací . To však není možné, protože jedním z předpokladů věty je, že jsou lineárně nezávislé. V důsledku toho musí platit, že . Můžeme tedy reziduum normalizovat a definovat vektor, který má jednotkovou normu. Již víme, že je ortogonální k . Z toho vyplývá, že také je ortogonální k . Tedy je ortonormální množina. Nyní vezměme libovolný vektor , který lze zapsat jakokde jsou skaláry. Protože podle předpokladu máme, že rovnici (2) lze zapsat také jakokde jsou skaláry, a: v kroku jsme použili rovnici (1); v kroku jsme použili definici . Tím jsme dokázali, že každý vektor, který lze zapsat jako lineární kombinaci , lze také zapsat jako lineární kombinaci . Předpoklad (3) umožňuje zcela analogicky dokázat i obrácený důkaz:Jinými slovy, každá lineární kombinace je také lineární kombinací . To dokazuje, že a uzavírá důkaz.
Každý prostor vnitřního součinu má ortonormální bázi
Následující věta představuje důležitý důsledek Gram-Schmidtova procesu.
Věta Nechť je vektorový prostor vybavený vnitřním součinem . Jestliže má konečnou dimenzi , pak pro existuje ortonormální báze .
Protože má konečnou dimenzi, existuje pro alespoň jedna báze tvořená vektory . Na tuto bázi můžeme aplikovat Gram-Schmidtův postup a získat ortonormální množinu . Protože je báze, zahrnuje . Proto Takže je ortonormální báze .
Řešená cvičení
Níže najdete několik cvičení s vysvětleným řešením.
Cvičení 1
Uvažujme prostor všech vektorů s reálnými položkami a vnitřním součinem kde a je transpozice . Definujte vektor
Normalizujte .
Norma jeTakže, normalizace je
Cvičení 2
Uvažujme prostor všech vektorů s reálnými položkami a vnitřním součinemkde . Uvažujme dva lineárně nezávislé vektory
Transformujte je do ortonormální množiny pomocí Gram-Schmidtova postupu.
Norma je Tedy, první ortonormální vektor jeVnitřní součin a jeProjekce na jeReziduál projekce jeNorma reziduálu jea normovaný reziduál jeTakže, ortonormální množina, kterou jsme hledali, je
Jak citovat
Citujte prosím jako:
Taboga, Marco (2017). „Gram-Schmidtův proces“, Přednášky z maticové algebry. https://www.statlect.com/matrix-algebra/Gram-Schmidt-process.
Leave a Reply