Modèle graphique

Généralement, les modèles graphiques probabilistes utilisent une représentation graphique comme base pour coder une distribution sur un espace multidimensionnel et un graphe qui est une représentation compacte ou factorisée d’un ensemble d’indépendances qui tiennent dans la distribution spécifique. Deux branches de représentations graphiques de distributions sont couramment utilisées, à savoir les réseaux bayésiens et les champs aléatoires de Markov. Ces deux familles englobent les propriétés de factorisation et d’indépendances, mais elles diffèrent par l’ensemble des indépendances qu’elles peuvent coder et par la factorisation de la distribution qu’elles induisent.

Réseau bayésienEdit

Article principal : Réseau bayésien

Si la structure du réseau du modèle est un graphe acyclique dirigé, le modèle représente une factorisation de la probabilité conjointe de toutes les variables aléatoires. Plus précisément, si les événements sont X 1 , … , X n {\displaystyle X_{1},\ldots ,X_{n}}.

X_{1},\ldots ,X_{n}

alors la probabilité conjointe satisfait P = ∏ i = 1 n P {\displaystyle P=\prod _{i=1}^{n}P}

{{displaystyle P=\prod _{i=1}^{n}P}

where pa ( X i ) {\displaystyle {\text{pa}}(X_{i})}

{\displaystyle {\text{pa}}(X_{i})}

est l’ensemble des parents du nœud X i {\displaystyle X_{i}}.

X_{i}

(nœuds dont les arêtes sont dirigées vers X i {\displaystyle X_{i}}.

X_{i}

). En d’autres termes, la distribution conjointe se transforme en un produit de distributions conditionnelles. Par exemple, le modèle graphique de la figure présentée ci-dessus (qui n’est en fait pas un graphe acyclique dirigé, mais un graphe ancestral) est constitué des variables aléatoires A , B , C , D {\displaystyle A,B,C,D}

A,B,C,D

avec une densité de probabilité conjointe qui se factorise comme P = P ⋅ P ⋅ P {\displaystyle P=P\cdot P\cdot P}

{\displaystyle P=P\cdot P\cdot P}

Tous deux nœuds sont conditionnellement indépendants étant donné les valeurs de leurs parents. En général, deux ensembles quelconques de nœuds sont conditionnellement indépendants étant donné un troisième ensemble si un critère appelé d-séparation tient dans le graphe. Les indépendances locales et les indépendances globales sont équivalentes dans les réseaux bayésiens.

Ce type de modèle graphique est connu comme un modèle graphique dirigé, un réseau bayésien ou un réseau de croyance. Les modèles classiques d’apprentissage automatique comme les modèles de Markov cachés, les réseaux neuronaux et les modèles plus récents comme les modèles de Markov d’ordre variable peuvent être considérés comme des cas particuliers de réseaux bayésiens.

Autres typesEdit

  • Classificateur de Bayes naïf où l’on utilise un arbre avec une seule racine
  • Réseau de dépendance où les cycles sont autorisés
  • Classificateur tri-augmenté ou modèle TAN
  • Un graphe factoriel est un graphe biparti non dirigé reliant des variables et des facteurs. Chaque facteur représente une fonction sur les variables auxquelles il est connecté. C’est une représentation utile pour comprendre et mettre en œuvre la propagation de croyances.
  • Un arbre de cliques ou arbre de jonction est un arbre de cliques, utilisé dans l’algorithme de l’arbre de jonction.
  • Un graphe en chaîne est un graphe qui peut avoir des arêtes dirigées et non dirigées, mais sans aucun cycle dirigé (c’est-à-dire que si nous commençons à un sommet quelconque et que nous nous déplaçons le long du graphe en respectant les directions des éventuelles flèches, nous ne pouvons pas revenir au sommet d’où nous sommes partis si nous avons dépassé une flèche). Les graphes acycliques dirigés et les graphes non dirigés sont des cas particuliers des graphes en chaîne, qui peuvent donc fournir un moyen d’unifier et de généraliser les réseaux bayésiens et de Markov.
  • Un graphe ancestral est une autre extension, ayant des arêtes dirigées, bidirigées et non dirigées.
  • Techniques de champs aléatoires
    • Un champ aléatoire de Markov, aussi appelé réseau de Markov, est un modèle sur un graphe non dirigé. Un modèle graphique avec de nombreuses sous-unités répétées peut être représenté avec la notation de plaque.
    • Un champ aléatoire conditionnel est un modèle discriminant spécifié sur un graphe non dirigé.
  • Une machine de Boltzmann restreinte est un modèle génératif biparti spécifié sur un graphe non dirigé.

.

Leave a Reply