Gram-Schmidt-Verfahren
von Marco Taboga, PhD
Das Gram-Schmidt-Verfahren (oder Verfahren) ist eine Folge von Operationen, die es ermöglichen, eine Menge linear unabhängiger Vektoren in eine Menge orthonormaler Vektoren umzuwandeln, die denselben Raum aufspannen wie die ursprüngliche Menge.
Vorüberlegungen
Wir wollen einige Begriffe wiederholen, die für das Verständnis des Gram-Schmidt-Verfahrens wesentlich sind.
Erinnern wir uns daran, dass zwei Vektoren und dann und nur dann orthogonal sind, wenn ihr inneres Produkt gleich Null ist, d.h.
Bei einem inneren Produkt können wir die Norm (Länge) eines Vektors wie folgt definieren:
Eine Menge von Vektoren heißt dann und nur dann orthonormal, wenn ihre Elemente eine Einheitsnorm haben und orthogonal zueinander sind. Mit anderen Worten, eine Menge von Vektoren ist orthonormal, wenn und nur wenn
Wir haben bewiesen, dass die Vektoren einer orthonormalen Menge linear unabhängig sind.
Wenn eine Basis für einen Vektorraum auch eine orthonormale Menge ist, nennt man sie eine orthonormale Basis.
Projektionen auf orthonormale Mengen
Im Gram-Schmidt-Verfahren verwenden wir immer wieder den folgenden Satz, der zeigt, dass jeder Vektor in zwei Teile zerlegt werden kann: 1) seine Projektion auf eine orthonormale Menge und 2) einen Rest, der orthogonal zu der gegebenen orthonormalen Menge ist.
Vermutung Sei ein Vektorraum mit einem inneren Produkt . Sei eine orthonormale Menge. Für jedes haben wir, wobei orthogonal zu für jedes
DefineDann haben wir für jedes , dasswo: In den Schritten und haben wir die Tatsache benutzt, dass das innere Produkt in seinem ersten Argument linear ist; im Schritt haben wir die Tatsache benutzt, dass wenn , da wir es mit einer orthonormalen Menge zu tun haben; im Schritt haben wir die Tatsache benutzt, dass die Norm von gleich 1 ist. Daher ist , wie oben definiert, orthogonal zu allen Elementen der orthonormalen Menge, was den Satz beweist.
Der Term wird die lineare Projektion von auf die orthonormale Menge genannt, während der Term das Residuum der linearen Projektion heißt.
Normalisierung
Eine weitere vielleicht offensichtliche Tatsache, die wir im Gram-Schmidt-Verfahren immer wieder verwenden werden, ist, dass, wenn wir einen beliebigen Nicht-Null-Vektor nehmen und ihn durch seine Norm dividieren, das Ergebnis der Division ein neuer Vektor ist, der eine Einheitsnorm hat.
Mit anderen Worten, wenn , dann haben wir durch die Definitheitseigenschaft der Norm, dass
Als Konsequenz können wir definieren und durch die Positivität und absolute Homogenität der Norm, haben wir
Überblick über das Verfahren
Nachdem wir nun wissen, wie man einen Vektor normalisiert und wie man ihn in eine Projektion auf eine orthonormale Menge und einen Rest zerlegt, können wir das Gram-Schmidt-Verfahren erklären.
Wir werden einen Überblick über das Verfahren geben, danach werden wir es formal als Satz ausdrücken und wir werden alle technischen Details im Beweis des Satzes diskutieren.
Hier ist der Überblick.
Wir haben eine Menge linear unabhängiger Vektoren .
Um den Prozess zu beginnen, normalisieren wir den ersten Vektor, d.h. wir definieren
Im zweiten Schritt projizieren wir auf :wobei das Residuum der Projektion ist.
Dann normalisieren wir das Residuum:
Wir werden später beweisen, dass (damit die Normalisierung durchgeführt werden kann), weil die Ausgangsvektoren linear unabhängig sind.
Die beiden so erhaltenen Vektoren und sind orthonormal.
Im dritten Schritt projizieren wir auf und :und wir berechnen das Residuum der Projektion .
Dann normalisieren wir es:
Wir fahren auf diese Weise fort, bis wir das letzte normalisierte Residuum erhalten.
Am Ende des Prozesses bilden die Vektoren eine orthonormale Menge, weil:
-
sie das Ergebnis einer Normalisierung sind und folglich eine Einheitsnorm haben;
-
jedes wird aus einem Rest erhalten, der die Eigenschaft hat, orthogonal zu zu sein.
Um diesen Überblick zu vervollständigen, sei daran erinnert, dass die lineare Spannweite von die Menge aller Vektoren ist, die als Linearkombinationen von geschrieben werden können; sie wird mit bezeichnet und ist ein linearer Raum.
Da die Vektoren linear unabhängige Kombinationen von sind, kann jeder Vektor, der als Linearkombination von geschrieben werden kann, auch als Linearkombination von geschrieben werden. Daher stimmen die Spannweiten der beiden Vektormengen überein:
Formale Aussage
Wir formalisieren hier das Gram-Schmidt-Verfahren als einen Satz, dessen Beweis alle technischen Details des Verfahrens enthält.
Vorstellung Sei ein Vektorraum mit einem inneren Produkt . Seien linear unabhängige Vektoren. Dann gibt es eine Menge von orthonormalen Vektoren , so dassfür jede .
Der Beweis erfolgt durch Induktion: Zuerst beweisen wir, dass der Satz für wahr ist, und dann beweisen wir, dass er für ein allgemeines wahr ist, wenn er für gilt. Wenn , hat der Vektor eine Einheitsnorm und bildet für sich selbst eine orthonormale Menge: Es gibt keine anderen Vektoren, so dass die Orthogonalitätsbedingung trivialerweise erfüllt ist. Die Mengeist die Menge aller skalaren Vielfachen von , die auch skalare Vielfache von sind (und umgekehrt). Daher Nehmen wir nun an, dass der Satz für wahr ist. Dann können wir auf : projizieren, wobei der Rest orthogonal zu ist. Nehmen wir an, dass . Dann,Da durch die Annahme für jede , haben wir, dass für jede , wobei Skalare sind. Deshalb,mit anderen Worten, die Annahme, dass ist, führt zu dem Schluss, dass eine Linearkombination von ist. Das ist aber unmöglich, weil eine der Annahmen des Satzes ist, dass linear unabhängig sind. Daraus folgt, dass sein muss. Wir können also das Residuum normalisieren und den Vektor definieren, der eine Einheitsnorm hat. Wir wissen bereits, dass orthogonal zu ist. Dies impliziert, dass auch orthogonal zu ist. Somit ist eine orthonormale Menge. Nehmen wir nun einen beliebigen Vektor , der als geschrieben werden kann, wobei Skalare sind. Da wir durch die Annahme haben, dass Gleichung (2) auch alsgeschrieben werden kann, wobei Skalare sind, und: im Schritt haben wir Gleichung (1) verwendet; im Schritt haben wir die Definition von verwendet. Damit haben wir bewiesen, dass jeder Vektor, der als Linearkombination von geschrieben werden kann, auch als Linearkombination von geschrieben werden kann. Die Annahme (3) erlaubt es, die Umkehrung in völlig analoger Weise zu beweisen:Mit anderen Worten: Jede Linearkombination von ist auch eine Linearkombination von . Dies beweist, dass und schließt den Beweis ab.
Jeder Raum mit innerem Produkt hat eine orthonormale Basis
Der folgende Satz stellt eine wichtige Konsequenz des Gram-Schmidt-Verfahrens dar.
Vorschlag Sei ein Vektorraum mit einem inneren Produkt . Wenn endliche Dimension hat, dann gibt es eine Orthonormalbasis für .
Da endlich-dimensional ist, gibt es mindestens eine Basis für , bestehend aus Vektoren . Wir können das Gram-Schmidt-Verfahren auf die Basis anwenden und erhalten eine orthonormale Menge . Da eine Basis ist, erstreckt sie sich über . Daher ist eine Orthonormalbasis von .
Gelöste Aufgaben
Nachfolgend finden Sie einige Aufgaben mit erklärten Lösungen.
Übung 1
Betrachten Sie den Raum aller Vektoren mit reellen Einträgen und dem inneren Produktwobei und die Transponierte von ist. Definiere den Vektor
Normalisiere .
Die Norm von istDaher, ist die Normierung von
Übung 2
Betrachten Sie den Raum aller Vektoren mit reellen Einträgen und dem inneren Produktwobei . Betrachte die beiden linear unabhängigen Vektoren
Transformiere sie mit Hilfe des Gram-Schmidt-Verfahrens in eine orthonormale Menge.
Die Norm von ist Daher, ist der erste orthonormale VektorDas innere Produkt von und istDie Projektion von auf istDas Residuum der Projektion istDie Norm des Residuums istund das normierte Residuum istDas heißt, ist die gesuchte orthonormale Menge
Zitierweise
Bitte zitieren als:
Taboga, Marco (2017). „Gram-Schmidt-Prozess“, Vorlesungen zur Matrixalgebra. https://www.statlect.com/matrix-algebra/Gram-Schmidt-process.
Leave a Reply