Grafisk modell

Som regel använder probabilistiska grafiska modeller en grafbaserad representation som grund för att koda en fördelning över ett flerdimensionellt utrymme och en graf som är en kompakt eller faktoriserad representation av en uppsättning oberoende faktorer som gäller i den specifika fördelningen. Två grenar av grafiska representationer av fördelningar används vanligen, nämligen Bayesianska nätverk och Markov slumpmässiga fält. Båda familjerna omfattar egenskaperna faktorisering och oberoende, men de skiljer sig åt i den uppsättning oberoende som de kan koda och den faktorisering av fördelningen som de inducerar.

Bayesianska nätverkRedigera

Huvudartikel: Bayesianskt nätverk

Om modellens nätverksstruktur är en riktad acyklisk graf representerar modellen en faktorisering av den gemensamma sannolikheten för alla slumpvariabler. Mer exakt, om händelserna är X 1 , … , X n {\displaystyle X_{1},\ldots ,X_{n}}

X_{1},\ldots ,X_{n}

så uppfyller den gemensamma sannolikheten P = ∏ i = 1 n P {\displaystyle P=\prod _{i=1}^{n}P}

{\displaystyle P=\prod _{i=1}^{n}P}

där pa ( X i ) {\displaystyle {\text{pa}}(X_{i})}

{\displaystyle {\text{pa}}(X_{i})}

är mängden föräldrar till noden X i {\displaystyle X_{i}}

X_{i}

(noder med kanter riktade mot X i {\displaystyle X_{i}}

X_{i}

). Med andra ord är den gemensamma fördelningen en produkt av villkorliga fördelningar. Den grafiska modellen i figuren ovan (som egentligen inte är en riktad acyklisk graf utan en anhöriggraf) består till exempel av de slumpmässiga variablerna A , B , C , D {\displaystyle A,B,C,D}

A,B,C,D

med en gemensam sannolikhetstäthet som fungerar som P = P ⋅ P ⋅ P ⋅ P {\displaystyle P=P\cdot P\cdot P\cdot P}

{\displaystyle P=P\cdot P\cdot P}

Alla två noder är villkorligt oberoende givet värdena på deras föräldrar. I allmänhet är två uppsättningar av noder villkorligt oberoende givet en tredje uppsättning om ett kriterium som kallas d-separation gäller i grafen. Lokala oberoende och globala oberoende är likvärdiga i Bayesianska nätverk.

Denna typ av grafisk modell är känd som en riktad grafisk modell, Bayesianskt nätverk eller trosnätverk. Klassiska modeller för maskininlärning som dolda Markovmodeller, neurala nätverk och nyare modeller som Markovmodeller med variabel ordning kan betraktas som specialfall av Bayesianska nätverk.

Andra typerRedigera

  • Naive Bayes-klassificator där vi använder ett träd med en enda rot
  • Beroendenätverk där cykler är tillåtna
  • Tree-augmented classifier eller TAN-modell
  • En faktorgraft är en oriktad tvådelad graf som kopplar samman variabler och faktorer. Varje faktor representerar en funktion över de variabler den är kopplad till. Detta är en användbar representation för att förstå och genomföra trosförökning.
  • Ett clique tree eller junction tree är ett träd av cliques som används i junction tree-algoritmen.
  • En chain graph är en graf som kan ha både riktade och odirigerade kanter, men som inte har några riktade cykler (dvs. om vi börjar vid någon topp och förflyttar oss längs grafen med respekt för riktningarna för eventuella pilar, kan vi inte återvända till den topp som vi startade från om vi har passerat en pil). Både riktade acykliska grafer och oriktade grafer är specialfall av kedjegrafer, som därför kan utgöra ett sätt att förenhetliga och generalisera Bayesianska och Markov-nätverk.
  • En anhöriggraf är en ytterligare utvidgning och har riktade, dubbelriktade och oriktade kanter.
  • Teknik för slumpmässiga fält
    • Ett Markov slumpmässigt fält, även känt som ett Markov-nätverk, är en modell över en odirigerad graf. En grafisk modell med många upprepade underenheter kan representeras med platta notation.
    • Ett villkorligt slumpmässigt fält är en diskriminerande modell specificerad över en odirigerad graf.
  • En begränsad Boltzmann-maskin är en tvådelad generativ modell specificerad över en odirigerad graf.

Leave a Reply