Gram-Schmidt-prosessi
by Marco Taboga, PhD
Gram-Schmidt-prosessi (tai -proseduuri) on operaatioiden sarja, jonka avulla lineaarisesti riippumattomien vektoreiden joukko voidaan muuttaa ortonormaalisten vektoreiden joukoksi, joka kattaa saman avaruuden, jonka alkuperäinen joukko kattaa.
Alkusanat
Käydään läpi joitakin käsitteitä, jotka ovat olennaisia Gram-Schmidt-prosessin ymmärtämiseksi.
Muistetaan, että kahden vektorin ja sanotaan olevan ortogonaalisia, jos ja vain jos niiden sisäinen tuote on yhtä suuri kuin nolla, eli
Sisäisen tuotteen ollessa kyseessä voimme määritellä vektorin normin (pituuden) seuraavasti:
Vektorijoukkoa kutsutaan ortonormaaliksi, jos ja vain jos sen alkioilla on yksikkönormi ja ne ovat kohtisuorassa toisiinsa nähden. Toisin sanoen vektorijoukko on ortonormaali, jos ja vain jos
Olemme todistaneet, että ortonormaalin joukon vektorit ovat lineaarisesti riippumattomia.
Kun vektoriavaruuden perusta on myös ortonormaali joukko, sitä sanotaan ortonormaaliksi perustaksi.
Projektiot ortonormaaleille joukoille
Gram-Schmidt-prosessissa käytämme toistuvasti seuraavaa lausetta, joka osoittaa, että jokainen vektori voidaan hajottaa kahteen osaan: 1) sen projektioon ortonormaalille joukolle ja 2) residuaaliin, joka on ortogonaalinen annetulle ortonormaalille joukolle.
Lauseke Olkoon vektoriavaruus, joka on varustettu sisäisellä tuotteella . Olkoon ortonormaali joukko. Kaikille on missä on ortogonaalinen kaikille
määritelmäTällöin jokaiselle on, ettämissä: vaiheissa ja olemme käyttäneet hyväksi sitä tosiasiaa, että sisäinen tuote on lineaarinen ensimmäisessä argumentissaan; askeleessa olemme käyttäneet sitä tosiasiaa, että jos , koska kyseessä on ortonormaali joukko; askeleessa olemme käyttäneet sitä tosiasiaa, että :n normi on 1. Näin ollen , kuten edellä on määritelty, on ortogonaalinen kaikille ortonormaalijoukon alkioille, mikä todistaa lauseen.
Termiä kutsutaan :n lineaariprojektioksi ortonormaalijoukkoon , kun taas termiä kutsutaan lineaariprojektion residuaaliksi.
Normalisointi
Toinen ehkä itsestään selvä tosiasia, jota tulemme toistuvasti käyttämään Gram-Schmidt-prosessissa, on se, että jos otamme minkä tahansa nollasta poikkeavan vektorin ja jaamme sen sen normilla, niin jaon tuloksena saadaan uusi vektori, jolla on yksikkönormi.
Toisin sanoen, jos , niin normin määrällisyysominaisuuden nojalla meillä on, että
Tämän seurauksena voimme määritelläja normin positiivisuuden ja absoluuttisen homogeenisuuden nojalla, meillä on
Yleiskatsaus menettelyyn
Nyt kun tiedämme, miten vektori normalisoidaan ja miten se hajotetaan projektioksi ortonormaalijoukkoon ja jäännökseksi, olemme valmiita selittämään Gram-Schmidt-menettelyn.
Annamme yleiskatsauksen prosessista, jonka jälkeen ilmaisemme sen muodollisesti lauseena ja käsittelemme kaikki tekniset yksityiskohdat lauseen todistuksessa.
Tässä on yleiskatsaus.
Annetaan joukko lineaarisesti riippumattomia vektoreita .
Aluksi normalisoimme ensimmäisen vektorin, eli määrittelemme
Toisessa vaiheessa projisoimme :: jossa on projisoinnin jäännös.
Sitten normalisoimme residuaalin:
Myöhemmin todistamme, että (jotta normalisointi voidaan suorittaa) koska lähtövektorit ovat lineaarisesti riippumattomia.
Näin saadut kaksi vektoria ja ovat ortonormaaleja.
Kolmannessa vaiheessa projisoimme vektoreihin ja : ja laskemme projisoinnin residuaalin .
Sitten normalisoimme sen:
Jatkamme näin, kunnes saamme viimeisen normalisoidun residuaalin .
Prosessin lopussa vektorit muodostavat ortonormaalin joukon, koska:
-
ne ovat normalisoinnin tulosta, ja näin ollen niillä on yksikkönormi;
-
jokainen saadaan residuaalista, jolla on se ominaisuus, että se on ortogonaalinen :lle.
Tämän yleiskatsauksen täydentämiseksi muistutetaan, että :n lineaariväli on kaikkien niiden vektoreiden joukko, jotka voidaan kirjoittaa :n lineaarikombinaatioina; sitä merkitään ja se on lineaarinen avaruus.
Koska vektorit ovat :n lineaarisesti riippumattomia kombinaatioita, mikä tahansa vektori, joka voidaan kirjoittaa :n lineaarikombinaatioksi, voidaan kirjoittaa myös :n lineaarikombinaatioksi. Näin ollen näiden kahden vektorijoukon välit ovat yhtenevät:
Formaali lausuma
Formalisoimme tässä Gram-Schmidt-prosessin lauseeksi, jonka todistus sisältää kaikki menettelyn tekniset yksityiskohdat.
Asema Olkoon vektoriavaruus, joka on varustettu sisäisellä tuotteella . Olkoon lineaarisesti riippumattomia vektoreita. Silloin on olemassa joukko ortonormaaleja vektoreita siten, ettäjokaiselle .
Todistus tapahtuu induktiolla: ensin todistetaan, että lause on tosi :lle, ja sitten todistetaan, että se on tosi geneeriselle :lle, jos se pätee :lle. Kun , vektorilla on yksikkönormi ja se muodostaa itsessään ortonormaalin joukon: muita vektoreita ei ole, joten ortogonaalisuusehto täyttyy triviaalisti. Joukkoon kaikkien niiden :n skalaarikertojen joukko, jotka ovat myös :n skalaarikertoja (ja päinvastoin). Näin ollen, Ja nyt oletetaan, että lause on tosi :lle. Silloin voimme projisoida kohtaan :, jossa jäännös on ortogonaalinen :lle. Oletetaan, että . Silloin,Jos oletuksen mukaan mille tahansa , on mille tahansa , missä ovat skalaareja. Näin ollen,Muilla sanoilla, oletus, että johtaa johtopäätökseen, että on lineaarikombinaatio . Mutta tämä on mahdotonta, koska yksi lauseen oletuksista on, että ovat lineaarisesti riippumattomia. Tästä seuraa, että on oltava, että . Voimme siis normalisoida residuaalin ja määritellä vektorin, jolla on yksikkönormi. Tiedämme jo, että on ortogonaalinen :lle. Tästä seuraa, että myös on ortogonaalinen :lle. Näin ollen on ortonormaali joukko. Otetaan nyt mikä tahansa vektori , joka voidaan kirjoittaa muodossa, jossa ovat skalaareja. Koska oletuksen mukaan yhtälö (2) voidaan kirjoittaa myös muodossajossa ovat skalaareja, ja: askeleessa olemme käyttäneet yhtälöä (1); askeleessa olemme käyttäneet määritelmää . Näin olemme todistaneet, että jokainen vektori, joka voidaan kirjoittaa :n lineaarikombinaatioksi, voidaan kirjoittaa myös :n lineaarikombinaatioksi. Oletus (3) mahdollistaa käänteisen todistamisen täysin analogisella tavalla: Toisin sanoen jokainen :n lineaarikombinaatio on myös :n lineaarikombinaatio. Tämä todistaa, että ja päättää todistuksen.
Jokaisella sisäisen tuotteen avaruudella on ortonormaali perusta
Seuraava propositio esittää tärkeän seurauksen Gram-Schmidt-prosessista.
Propositio Olkoon vektoriavaruus, joka on varustettu sisäisellä tuotteella . Jos :llä on äärellinen ulottuvuus , niin :lle on olemassa ortonormaali perusta .
Sen vuoksi, että on äärellisulotteinen, :lle on olemassa vähintään yksi perusta, joka koostuu vektoreista . Voimme soveltaa Gram-Schmidt-menettelyä perustaan ja saada ortonormaalijoukon . Koska on perusta, se kattaa . Näin ollen Siten on :n ortonormaali perusta.
Ratkaistuja harjoituksia
Alla on muutamia harjoituksia selitettyine ratkaisuineen.
Harjoitus 1
Tarkastellaan avaruutta kaikista vektoreista, joilla on reaaliset merkinnät ja sisäinen tuote, jossa ja on transponointi. Määritellään vektori
Normalisoidaan .
Normin normi onSiten, :n normi on
Harjoitus 2
Tarkastellaan avaruutta kaikista vektoreista, joilla on reaaliset merkinnät ja sisäinen tuote, jossa . Tarkastellaan kahta lineaarisesti riippumatonta vektoria
Muunnetaan ne ortonormaalijoukoksi Gram-Schmidtin prosessin avulla.
Normin normi on Siten, ensimmäinen ortonormaali vektori on :n ja :n sisäinen tulo on :n projektio :lle onProjektion jäännös onJäännöksen normisto onja normalisoitu jäännös onTässä, etsimämme ortonormaali joukko on
How to cite
Please cite as:
Taboga, Marco (2017). ”Gram-Schmidtin prosessi”, Luentoja matriisialgebrasta. https://www.statlect.com/matrix-algebra/Gram-Schmidt-process.
Leave a Reply