Modello grafico

Generalmente, i modelli grafici probabilistici usano una rappresentazione a grafo come base per codificare una distribuzione su uno spazio multidimensionale e un grafo che è una rappresentazione compatta o fattorizzata di un insieme di indipendenti che tengono nella distribuzione specifica. Due rami di rappresentazioni grafiche delle distribuzioni sono comunemente usati, vale a dire le reti bayesiane e i campi casuali di Markov. Entrambe le famiglie comprendono le proprietà di fattorizzazione e di indipendenza, ma differiscono nell’insieme di indipendenza che possono codificare e nella fattorizzazione della distribuzione che inducono.

Rete bayesianaModifica

Articolo principale: Rete bayesiana

Se la struttura della rete del modello è un grafo aciclico diretto, il modello rappresenta una fattorizzazione della probabilità congiunta di tutte le variabili casuali. Più precisamente, se gli eventi sono X 1 , … , X n {\displaystyle X_{1},\ldots ,X_{n}}

X_{1},\ldots ,X_{n}

allora la probabilità congiunta soddisfa P = ∏ i = 1 n P {\displaystyle P=\prod _{i=1}^{n}P}

{displaystyle P=\prod _{i=1}^{n}P}

dove pa ( X i ) {displaystyle {\text{pa}}(X_{i})}

{{displaystyle {\text{pa}(X_{i})}

è l’insieme dei genitori del nodo X i {\displaystyle X_{i}}

X_{i}

(nodi con bordi diretti verso X i {\displaystyle X_{i}}

X_{i}

). In altre parole, la distribuzione congiunta si trasforma in un prodotto di distribuzioni condizionali. Per esempio, il modello grafico nella figura mostrata sopra (che in realtà non è un grafo aciclico diretto, ma un grafo ancestrale) consiste nelle variabili casuali A , B , C , D {\displaystyle A,B,C,D}

A,B,C,D

con una densità di probabilità congiunta che fattorizza come P = P ⋅ P ⋅ P {\displaystyle P=P\cdot P\cdot P}

{displaystyle P=P\cdot P\cdot P}

Qualsiasi due nodi sono condizionatamente indipendenti dati i valori dei loro genitori. In generale, qualsiasi due insiemi di nodi sono condizionatamente indipendenti dato un terzo insieme se un criterio chiamato d-separazione è valido nel grafico. Le indipendenze locali e le indipendenze globali sono equivalenti nelle reti bayesiane.

Questo tipo di modello grafico è noto come modello grafico diretto, rete bayesiana o rete di credenze. I modelli classici di apprendimento automatico come i modelli di Markov nascosti, le reti neurali e i modelli più recenti come i modelli di Markov ad ordine variabile possono essere considerati casi speciali di reti bayesiane.

Altri tipiModifica

  • Classificatore di Naive Bayes dove usiamo un albero con una sola radice
  • Rete di dipendenza dove i cicli sono permessi
  • Classificatore ad albero o modello TAN
  • Un grafico a fattori è un grafico bipartito non diretto che collega variabili e fattori. Ogni fattore rappresenta una funzione sulle variabili a cui è collegato. Questa è una rappresentazione utile per capire e implementare la propagazione delle credenze.
  • Un albero di cricche o albero di giunzione è un albero di cricche, usato nell’algoritmo dell’albero di giunzione.
  • Un grafico a catena è un grafico che può avere sia bordi diretti che indiretti, ma senza cicli diretti (cioè se iniziamo da un qualsiasi vertice e ci muoviamo lungo il grafico rispettando le direzioni di qualsiasi freccia, non possiamo tornare al vertice da cui siamo partiti se abbiamo passato una freccia). Sia i grafi aciclici diretti che i grafi indiretti sono casi speciali dei grafi a catena, che possono quindi fornire un modo per unificare e generalizzare le reti bayesiane e di Markov.
  • Un grafo ancestrale è un’ulteriore estensione, con bordi diretti, bidiretti e indiretti.
  • Tecniche di campo casuale
    • Un campo casuale di Markov, noto anche come rete di Markov, è un modello su un grafo indiretto. Un modello grafico con molte subunità ripetute può essere rappresentato con la notazione a piatti.
    • Un campo casuale condizionale è un modello discriminativo specificato su un grafo indiretto.
  • Una macchina di Boltzmann limitata è un modello generativo bipartito specificato su un grafo indiretto.

Leave a Reply