Proces Grama-Schmidta
by Marco Taboga, PhD
Proces (lub procedura) Grama-Schmidta jest sekwencją operacji, które pozwalają na przekształcenie zbioru wektorów liniowo niezależnych w zbiór wektorów ortonormalnych, które obejmują tę samą przestrzeń, w której znajduje się zbiór oryginalny.
Preliminaria
Dokonajmy przeglądu kilku pojęć, które są niezbędne do zrozumienia procesu Grama-Schmidta.
Przypomnijmy, że o dwóch wektorach i
mówi się, że są ortogonalne wtedy i tylko wtedy, gdy ich iloczyn wewnętrzny jest równy zeru, czyli,
Biorąc pod uwagę iloczyn wewnętrzny, możemy zdefiniować normę (długość) wektora w następujący sposób:
Zbiór wektorów nazywamy ortonormalnym wtedy i tylko wtedy, gdy jego elementy mają normę jednostkową i są względem siebie ortogonalne. Innymi słowy, zbiór wektorów
jest ortonormalny wtedy i tylko wtedy, gdy
Udowodniliśmy, że wektory zbioru ortonormalnego są liniowo niezależne.
Gdy podstawa przestrzeni wektorowej jest jednocześnie zbiorem ortonormalnym, to nazywamy ją podstawą ortonormalną.
Projekcje na zbiorach ortonormalnych
W procesie Grama-Schmidta wielokrotnie korzystamy z następnej propozycji, z której wynika, że każdy wektor można rozłożyć na dwie części: 1) jego projekcję na zbiór ortonormalny oraz 2) resztę, która jest ortogonalna do danego zbioru ortonormalnego.
Propozycja Niech będzie przestrzenią wektorową wyposażoną w iloczyn wewnętrzny
. Niech
będzie zbiorem ortonormalnym. Dla dowolnego
, mamy
gdzie
jest ortogonalny do
dla dowolnego
DefineThen, for each
, we have that
where: w krokach
i
wykorzystaliśmy fakt, że iloczyn wewnętrzny jest liniowy w swoim pierwszym argumencie; w kroku
wykorzystaliśmy fakt, że
jeśli
, ponieważ mamy do czynienia ze zbiorem ortonormalnym; w kroku
wykorzystaliśmy fakt, że norma
jest równa 1. Zatem
, zgodnie z powyższą definicją, jest ortogonalny do wszystkich elementów zbioru ortonormalnego, co dowodzi prawdziwości tezy.
Wyraz nazywamy rzutem liniowym
na zbiór ortonormalny
, zaś wyraz
nazywamy residuami rzutu liniowego.
Normalizacja
Innym, być może oczywistym faktem, który będziemy wielokrotnie wykorzystywać w procesie Grama-Schmidta jest to, że jeśli weźmiemy dowolny niezerowy wektor i podzielimy go przez jego normę, to wynikiem podziału jest nowy wektor, który ma normę jednostkową.
Innymi słowy, jeśli to, na mocy własności definitywności normy, mamy, że
W konsekwencji możemy zdefiniować i, na mocy pozytywności i absolutnej jednorodności normy, mamy
Przegląd procedury
Teraz, gdy wiemy jak znormalizować wektor i jak rozłożyć go na rzut na zbiór ortonormalny i resztę, jesteśmy gotowi do wyjaśnienia procedury Grama-Schmidta.
Zamierzamy przedstawić ogólny zarys procesu, po czym wyrazimy go formalnie jako tezę, a wszystkie szczegóły techniczne omówimy w dowodzie tej tezy.
Oto zarys.
Dany jest zbiór liniowo niezależnych wektorów .
Aby rozpocząć proces, normalizujemy pierwszy wektor, czyli definiujemy
W drugim kroku rzutujemy na
:
gdzie
jest resztą z rzutowania.
Następnie normalizujemy resztę:
Później udowodnimy, że (aby można było przeprowadzić normalizację), ponieważ wektory początkowe są liniowo niezależne.
Otrzymane w ten sposób dwa wektory i
są ortonormalne.
W trzecim kroku rzutujemy na
i
:
i obliczamy resztę projekcji
.
Następnie normalizujemy ją:
Postępujemy w ten sposób, aż otrzymamy ostatnią znormalizowaną resztę .
Na końcu procesu wektory tworzą zbiór ortonormalny, ponieważ:
-
są one wynikiem normalizacji, a w konsekwencji mają normę jednostkową;
-
każda
jest otrzymana z reszt, które mają własność bycia ortogonalnymi do
.
Aby uzupełnić ten przegląd, pamiętajmy, że rozpiętość liniowa to zbiór wszystkich wektorów, które można zapisać jako kombinacje liniowe
; oznaczamy ją przez
i jest to przestrzeń liniowa.
Ponieważ wektory są liniowo niezależnymi kombinacjami
, każdy wektor, który można zapisać jako kombinację liniową
, można również zapisać jako kombinację liniową
. Zatem rozpiętości tych dwóch zbiorów wektorów pokrywają się:
Stwierdzenie formalne
Sformalizujemy tu proces Grama-Schmidta w postaci propozycji, której dowód zawiera wszystkie szczegóły techniczne procedury.
Propozycja Niech będzie przestrzenią wektorową wyposażoną w iloczyn wewnętrzny
. Niech
będą wektorami liniowo niezależnymi. Wówczas istnieje zbiór wektorów ortonormalnych
takich, że
dla dowolnego
.
Dowód jest przez indukcję: najpierw dowodzimy, że teza jest prawdziwa dla , a następnie dowodzimy, że jest prawdziwa dla ogólnego
, jeśli zachodzi dla
. Gdy
, wektor
ma normę jednostkową i sam w sobie stanowi zbiór ortonormalny: nie ma innych wektorów, więc warunek ortogonalności jest trywialnie spełniony. Zbiór
jest zbiorem wszystkich skalarnych wielokrotności
, które są jednocześnie skalarnymi wielokrotnościami
(i odwrotnie). Wobec tego
Załóżmy teraz, że teza jest prawdziwa dla
. Wtedy możemy rzutować
na
:
gdzie reszta
jest ortogonalna do
. Załóżmy, że
. Wtedy,
Ponieważ, z założenia,
dla dowolnego
, mamy, że
dla dowolnego
, gdzie
są skalarami. Zatem,
Innymi słowy, założenie, że
prowadzi do wniosku, że
jest kombinacją liniową
. Jest to jednak niemożliwe, gdyż jednym z założeń tej tezy jest to, że
są liniowo niezależne. W konsekwencji musi być tak, że
. Możemy zatem znormalizować resztę i zdefiniować wektor
, który ma normę jednostkową. Wiemy już, że
jest ortogonalny do
. Wynika z tego, że również
jest ortogonalny do
. Zatem
jest zbiorem ortonormalnym. Weźmy teraz dowolny wektor
, który można zapisać jako
, gdzie
są skalarami. Ponieważ, z założenia,
mamy, że równanie (2) można też zapisać jako
gdzie
są skalarami, oraz: w kroku
wykorzystaliśmy równanie (1); w kroku
wykorzystaliśmy definicję
. Udowodniliśmy zatem, że każdy wektor, który można zapisać jako kombinację liniową
można również zapisać jako kombinację liniową
. Założenie (3) pozwala w całkowicie analogiczny sposób udowodnić, że jest odwrotnie:
Innymi słowy, każda kombinacja liniowa
jest również kombinacją liniową
. Dowodzi to, że
i kończy dowód.
Każda przestrzeń produktu wewnętrznego ma ortonormalną podstawę
Następująca propozycja przedstawia ważną konsekwencję procesu Grama-Schmidta.
Propozycja Niech będzie przestrzenią wektorową wyposażoną w iloczyn wewnętrzny
. Jeśli
ma skończony wymiar
, to istnieje ortonormalna podstawa
dla
.
Ponieważ jest skończenie wymiarowy, istnieje co najmniej jedna podstawa dla
, składająca się z
wektorów
. Do tej podstawy możemy zastosować procedurę Grama-Schmidta i otrzymać zbiór ortonormalny
. Ponieważ
jest bazą, to rozciąga się na
. Zatem
jest ortonormalną bazą
.
Rozwiązane ćwiczenia
Poniżej znajdziesz kilka ćwiczeń z objaśnionymi rozwiązaniami.
Ćwiczenie 1
Rozważmy przestrzeń wszystkich
wektorów mających rzeczywiste wpisy i iloczyn wewnętrzny
gdzie
oraz
jest transpozycją
. Zdefiniuj wektor
Normalizuj .
Norma wektora wynosi
Dlatego, normalizacja
wynosi
Ćwiczenie 2
Rozważmy przestrzeń wszystkich
wektorów o rzeczywistych pozycjach i iloczynie wewnętrznym
gdzie
. Rozważmy dwa liniowo niezależne wektory
Przekształćmy je w zbiór ortonormalny za pomocą procesu Grama-Schmidta.
Norma wynosi
Więc, pierwszy wektor ortonormalny to
Iloczyn wewnętrzny
i
to
Rzut
na
to
Reszta z rzutu to
Norma tej reszty to
a znormalizowana reszta to
Tak więc, zbiór ortonormalny, którego szukaliśmy to
Jak cytować
Please cite as:
Taboga, Marco (2017). „Proces Grama-Schmidta”, Wykłady z algebry macierzy. https://www.statlect.com/matrix-algebra/Gram-Schmidt-process.
Leave a Reply