Model grafowy

Generalnie, probabilistyczne modele graficzne wykorzystują grafową reprezentację jako podstawę kodowania rozkładu w przestrzeni wielowymiarowej oraz graf, który jest zwartą lub faktoryzowaną reprezentacją zbioru niezależności występujących w danym rozkładzie. Powszechnie stosowane są dwie gałęzie grafowych reprezentacji rozkładów, a mianowicie sieci bayesowskie i pola losowe Markowa. Obie rodziny obejmują własności faktoryzacji i niezależności, ale różnią się zestawem niezależności, które mogą kodować i faktoryzacją rozkładu, którą indukują.

Sieć bayesowskaEdit

Main article: Bayesian network

Jeśli struktura sieciowa modelu jest skierowanym grafem acyklicznym, to model reprezentuje faktoryzację wspólnego prawdopodobieństwa wszystkich zmiennych losowych. Dokładniej, jeśli zdarzeniami są X 1 , … , X n {{displaystyle X_{1}},{{ldots ,X_{n}}

X_{1},ldots ,X_{n}

to wspólne prawdopodobieństwo spełnia P = ∏ i = 1 n P {displaystyle P=prod _{i=1}^{n}P}

{displaystyle P=prod _{i=1}^{n}P}

gdzie pa ( X i ) {{displaystyle {text{pa}}(X_{i})}

{displaystyle {text{pa}}(X_{i})}

jest zbiorem rodziców węzła X i {displaystyle X_{i}}

X_{i}

(węzły z krawędziami skierowanymi do X i {{displaystyle X_{i}}

X_{i}

). Innymi słowy, wspólny rozkład rozkład rozkłada się na iloczyn rozkładów warunkowych. Przykładowo, model grafowy na przedstawionym powyżej rysunku (który w rzeczywistości nie jest skierowanym grafem acyklicznym, lecz grafem przodków) składa się ze zmiennych losowych A , B , C , D { {\i0}

A,B,C,D}

A,B,C,D

o wspólnej gęstości prawdopodobieństwa, która współczynniki jako P = P ⋅ P ⋅ P {displaystyle P=P ⋅ P ⋅ P}

{displaystyle P=Pcdot P}

Dwa dowolne węzły są warunkowo niezależne biorąc pod uwagę wartości ich rodziców. W ogólności, dowolne dwa zestawy węzłów są warunkowo niezależne z uwagi na trzeci zestaw, jeśli w grafie zachodzi kryterium zwane d-separacją. Lokalne niezależności i globalne niezależności są równoważne w sieciach bayesowskich.

Ten typ modelu graficznego jest znany jako skierowany model graficzny, sieć bayesowska lub sieć przekonań. Klasyczne modele uczenia maszynowego, takie jak ukryte modele Markowa, sieci neuronowe i nowsze modele, takie jak modele Markowa zmiennego rzędu, mogą być uważane za specjalne przypadki sieci Bayesa.

Inne typyEdit

  • Klasyfikator Naive Bayes, gdzie używamy drzewa z pojedynczym korzeniem
  • Sieć zależności, gdzie cykle są dozwolone
  • Klasyfikator rozszerzony o drzewo lub model TAN
  • Graf czynnikowy jest nieskierowanym grafem dwudzielnym łączącym zmienne i czynniki. Każdy czynnik reprezentuje funkcję nad zmiennymi, z którymi jest połączony. Jest to reprezentacja pomocna w zrozumieniu i implementacji propagacji przekonań.
  • Drzewo klikowe lub drzewo połączeń to drzewo klikowe, używane w algorytmie drzewa połączeń.
  • Graf łańcuchowy to graf, który może mieć zarówno skierowane, jak i nieskierowane krawędzie, ale bez skierowanych cykli (tzn. jeśli zaczynamy od dowolnego wierzchołka i poruszamy się wzdłuż grafu, respektując kierunki strzałek, nie możemy wrócić do wierzchołka, od którego zaczęliśmy, jeśli minęliśmy strzałkę). Zarówno skierowane grafy acykliczne, jak i grafy nieskierowane są szczególnymi przypadkami grafów łańcuchowych, które mogą zatem stanowić sposób unifikacji i uogólnienia sieci bayesowskich i markowskich.
  • Graf rodowy jest kolejnym rozszerzeniem, posiadającym krawędzie skierowane, dwukierunkowe i nieskierowane.
  • Techniki pola losowego
    • Pole losowe Markowa, znane również jako sieć Markowa, jest modelem nad grafem nieskierowanym. Model grafowy z wieloma powtarzającymi się podjednostkami może być reprezentowany za pomocą notacji tablicowej.
    • Warunkowe pole losowe jest modelem dyskryminacyjnym określonym nad grafem nieskierowanym.
  • Zastrzeżona maszyna Boltzmanna jest dwudzielnym modelem generatywnym określonym nad grafem nieskierowanym.

.

Leave a Reply