Procesul Gram-Schmidt
de Marco Taboga, PhD
Procesul (sau procedura) Gram-Schmidt este o secvență de operații care permite transformarea unui set de vectori liniar independenți într-un set de vectori ortonormali care acoperă același spațiu acoperit de setul inițial.
Preliminarii
Să trecem în revistă câteva noțiuni esențiale pentru înțelegerea procedeului Gram-Schmidt.
Amintim că doi vectori și
se spune că sunt ortogonali dacă și numai dacă produsul lor interior este egal cu zero, adică,
Dat fiind un produs interior, putem defini norma (lungimea) unui vector după cum urmează:
:
Un ansamblu de vectori se numește ortonormal dacă și numai dacă elementele sale au normă unitară și sunt ortogonale între ele. Cu alte cuvinte, un ansamblu de vectori
este ortonormal dacă și numai dacă
Am demonstrat că vectorii unui ansamblu ortonormal sunt liniar independenți.
Atunci când o bază pentru un spațiu vectorial este de asemenea un ansamblu ortonormal, se numește bază ortonormală.
Proiecții pe seturi ortonormale
În procesul Gram-Schmidt, folosim în mod repetat următoarea propoziție, care arată că fiecare vector poate fi descompus în două părți: 1) proiecția sa pe un set ortonormal și 2) un reziduu care este ortogonal la setul ortonormal dat.
Propoziție Fie un spațiu vectorial echipat cu un produs intern
. Fie
un ansamblu ortonormal. Pentru orice
, avem
unde
este ortogonal cu
pentru orice
DefineAtunci, pentru fiecare
, avem că
unde: în etapele
și
am folosit faptul că produsul interior este liniar în primul său argument; în etapa $cadru{C}$ am folosit faptul că
dacă
deoarece avem de-a face cu un ansamblu ortonormal; în etapa
am folosit faptul că norma lui
este egală cu 1. Prin urmare,
, așa cum a fost definit mai sus, este ortogonal la toate elementele ansamblului ortonormal, ceea ce dovedește propoziția.
Termenulse numește proiecția liniară a lui
pe ansamblul ortonormal
, în timp ce termenul
se numește reziduu al proiecției liniare.
Normalizare
Un alt fapt, poate evident, pe care îl vom folosi în mod repetat în procesul Gram-Schmidt este că, dacă luăm orice vector diferit de zero și îl împărțim cu norma sa, atunci rezultatul împărțirii este un nou vector care are normă unitară.
Cu alte cuvinte, dacă atunci, prin proprietatea de definiție a normei, avem că
În consecință, putem definiși, prin pozitivitatea și omogenitatea absolută a normei, avem
Vizualizare generală a procedurii
Acum că știm cum să normalizăm un vector și cum să îl descompunem într-o proiecție pe un ansamblu ortonormal și un reziduu, suntem gata să explicăm procedura Gram-Schmidt.
Vom oferi o prezentare generală a procedeului, după care îl vom exprima formal sub forma unei propoziții și vom discuta toate detaliile tehnice în demonstrația propoziției.
Iată prezentarea generală.
Ni se dă un set de vectori liniar independenți .
Pentru a începe procesul, normalizăm primul vector, adică definim
În al doilea pas, proiectăm pe
:
unde
este reziduul proiecției.
Apoi, normalizăm reziduul:
Vom dovedi ulterior că (pentru ca normalizarea să poată fi efectuată) deoarece vectorii de pornire sunt liniar independenți.
Cei doi vectori și
astfel obținuți sunt ortonormali.
În etapa a treia, proiectăm pe
și
:
și calculăm reziduul proiecției
.
Îl normalizăm apoi:
Procedăm în acest fel până când obținem ultimul reziduu normalizat .
La sfârșitul procesului, vectorii formează un ansamblu ortonormal deoarece:
-
ei sunt rezultatul unei normalizări și, în consecință, au normă unitară;
-
fiecare
se obține dintr-un reziduu care are proprietatea de a fi ortogonal cu
.
Pentru a completa această prezentare generală, să ne amintim că intervalul liniar al lui este ansamblul tuturor vectorilor care pot fi scriși ca combinații liniare ale lui
; se notează cu
și este un spațiu liniar.
Deoarece vectorii sunt combinații liniar independente ale lui
, orice vector care poate fi scris ca o combinație liniară a lui
poate fi scris și ca o combinație liniară a lui
. Prin urmare, intervalele celor două seturi de vectori coincid:
Enunț formal
Formalizăm aici procedeul Gram-Schmidt sub forma unei propoziții, a cărei demonstrație conține toate detaliile tehnice ale procedurii.
Propoziție Fie un spațiu vectorial echipat cu un produs interior
. Fie
vectori liniar independenți. Atunci, există un ansamblu de vectori ortonormali
astfel încât
pentru orice
.
Demonstrarea se face prin inducție: mai întâi dovedim că propoziția este adevărată pentru , iar apoi dovedim că este adevărată pentru un
generic dacă este adevărată pentru
. Când
, vectorul
are normă unitară și constituie prin el însuși un ansamblu ortonormal: nu există alți vectori, deci condiția de ortogonalitate este satisfăcută în mod trivial. Ansamblul
este ansamblul tuturor multiplii scalari ai lui
, care sunt, de asemenea, multipli scalari ai lui
(și viceversa). Prin urmare,
Acum, să presupunem că propoziția este adevărată pentru
. Atunci, putem proiecta
pe
:
unde reziduul
este ortogonal la
. Să presupunem că
. Atunci,
Din moment ce, prin ipoteză,
pentru orice
, avem că
pentru orice
, unde
sunt scalari. Prin urmare,
Cu alte cuvinte, ipoteza că
conduce la concluzia că
este o combinație liniară de
. Dar acest lucru este imposibil deoarece una dintre ipotezele propoziției este că
sunt liniar independente. În consecință, trebuie să fie că
. Prin urmare, putem să normalizăm reziduul și să definim vectorul
care are normă unitară. Știm deja că
este ortogonal la
. Aceasta implică faptul că și
este ortogonal la
. Astfel,
este un ansamblu ortonormal. Acum, să luăm orice vector
care poate fi scris ca
unde
sunt scalari. Deoarece, prin ipoteză,
avem că ecuația (2) poate fi scrisă și sub forma
unde
sunt scalari, și: în pasul
am folosit ecuația (1); în pasul
am folosit definiția lui
. Astfel, am demonstrat că orice vector care poate fi scris ca o combinație liniară a
poate fi scris și ca o combinație liniară a
. Ipoteza (3) permite demonstrarea inversului într-o manieră complet analogă:
Cu alte cuvinte, orice combinație liniară a lui
este, de asemenea, o combinație liniară a lui
. Aceasta dovedește că
și încheie demonstrația.
Care spațiu cu produs interior are o bază ortonormală
Următoarea propoziție prezintă o consecință importantă a procesului Gram-Schmidt.
Propoziție Fie un spațiu vectorial echipat cu un produs interior
. Dacă
are dimensiunea finită
, atunci există o bază ortonormală
pentru
.
Din moment ce este de dimensiune finită, există cel puțin o bază pentru
, formată din
vectori
. Putem aplica procedura Gram-Schmidt bazei și putem obține un set ortonormal
. Deoarece
este o bază, aceasta se întinde pe
. Prin urmare,
Atunci,
este o bază ortonormală a lui
.
Exerciții rezolvate
Mai jos găsiți câteva exerciții cu soluții explicate.
Exercițiu 1
Se consideră spațiul al tuturor vectorilor
cu intrări reale și produsul interior
unde
și
este transpunerea lui
. Se definește vectorul
Normalizează .
Norma lui este
Deci, normarea lui
este
Exercițiu 2
Considerăm spațiul al tuturor vectorilor
cu intrări reale și produsul interior
unde
. Se consideră cei doi vectori liniar independenți
Transformați-i într-un ansamblu ortonormal folosind procedeul Gram-Schmidt.
Norma lui este
Deci, primul vector ortonormal este
Produsul intern al lui
și
este
Proiecția lui
pe
este
Reziduul proiecției este
Norma reziduului este
și reziduul normalizat este
Deci, setul ortonormal pe care îl căutam este
Cum se citește
Citează ca:
Taboga, Marco (2017). „Gram-Schmidt process”, Lectures on matrix algebra. https://www.statlect.com/matrix-algebra/Gram-Schmidt-process.
Leave a Reply