Grafisk model

Sædvanligvis bruger probabilistiske grafiske modeller en grafbaseret repræsentation som grundlag for kodning af en fordeling over et flerdimensionalt rum og en graf, der er en kompakt eller faktoriseret repræsentation af et sæt af uafhængigheder, der gælder i den specifikke fordeling. To grene af grafiske repræsentationer af fordelinger er almindeligt anvendt, nemlig Bayesianske netværk og Markov tilfældige felter. Begge familier omfatter egenskaberne ved faktorisering og uafhængigheder, men de adskiller sig fra hinanden i det sæt af uafhængigheder, de kan kode og den faktorisering af fordelingen, som de inducerer.

Bayesiansk netværkRediger

Hovedartikel: Bayesiansk netværk

Hvis modellens netværksstruktur er en rettet acyklisk graf, repræsenterer modellen en faktorisering af den fælles sandsynlighed for alle tilfældige variabler. Mere præcist, hvis begivenhederne er X 1 , … , X n {\displaystyle X_{1},\ldots ,X_{n}}

X_{1},\ldots ,X_{n}

så opfylder den fælles sandsynlighed P = ∏ i = 1 n P {\displaystyle P=\prod _{i=1}^{n}P}

{\displaystyle P=\prod _{i=1}^{n}P}

hvor pa ( X i ) {\displaystyle {\displaystyle {\text{pa}}}(X_{i}})}

{\displaystyle {\text{pa}}(X_{i}})}

er mængden af forældre til node X i {\displaystyle X_{i}}

X_{i}

(knuder med kanter, der er rettet mod X i {\displaystyle X_{i}}

X_{i}

). Med andre ord er den fælles fordeling faktorer til et produkt af betingede fordelinger. F.eks. består den grafiske model i figuren ovenfor (som faktisk ikke er en rettet acyklisk graf, men en ancestral graf) af de tilfældige variabler A , B , C , D {\displaystyle A,B,C,D}

A,B,C,D

med en fælles sandsynlighedstæthed, der faktoriserer som P = P ⋅ P ⋅ P ⋅ P {\displaystyle P=P\cdot P\cdot P\cdot P}

{\displaystyle P=P\cdot P\cdot P\cdot P}

Alle to knuder er betinget uafhængige, når værdierne af deres forældre er givet. Generelt er to sæt af knuder betinget uafhængige givet et tredje sæt, hvis et kriterium kaldet d-separation gælder i grafen. Lokale uafhængigheder og globale uafhængigheder er ækvivalente i bayesianske netværk.

Denne type grafisk model er kendt som en rettet grafisk model, bayesiansk netværk eller trosnetværk. Klassiske maskinlæringsmodeller som skjulte Markov-modeller, neurale netværk og nyere modeller som f.eks. variable-order Markov-modeller kan betragtes som specialtilfælde af Bayesianske netværk.

Andre typerRediger

  • Naive Bayes-klassifikator, hvor vi bruger et træ med en enkelt rod
  • Afhængighedsnetværk, hvor cyklusser er tilladt
  • Tree-augmented klassifikator eller TAN-model
  • En faktorgraf er en udirigeret bipartite graf, der forbinder variabler og faktorer. Hver faktor repræsenterer en funktion over de variabler, den er forbundet med. Dette er en nyttig repræsentation til forståelse og implementering af belief propagation.
  • Et clique tree eller junction tree er et træ af cliques, der anvendes i junction tree-algoritmen.
  • En chain graph er en graf, der kan have både dirigerede og udirigerede kanter, men uden nogen dirigerede cyklusser (dvs. hvis vi starter ved et vilkårligt toppunkt og bevæger os langs grafen med respekt for retningerne af eventuelle pile, kan vi ikke vende tilbage til det toppunkt, vi startede fra, hvis vi har passeret en pil). Både rettede acykliske grafer og ikke-retningsbestemte grafer er specialtilfælde af kædegrafer, som derfor kan være en måde at forene og generalisere bayesianske og Markov-netværk på.
  • En ancestral graf er en yderligere udvidelse, der har både dirigerede, bidirekte og udirigerede kanter.
  • Tilfældige feltteknikker
    • Et Markov tilfældigt felt, også kendt som et Markov-netværk, er en model over en udirigeret graf. En grafisk model med mange gentagne underenheder kan repræsenteres med pladenotation.
    • Et betinget tilfældigt felt er en diskriminativ model specificeret over en udirigeret graf.
  • En begrænset Boltzmann-maskine er en bipartite generativ model specificeret over en udirigeret graf.

Leave a Reply