La distribution de Dirichlet est une distribution de probabilité multivariée qui décrit variables , telles que chaque et , qui est paramétré par un vecteur de paramètres à valeur positive . Les paramètres ne doivent pas nécessairement être des nombres entiers, ils doivent uniquement être des nombres réels positifs. Ils ne sont en aucun cas "normalisés", ce sont des paramètres de cette distribution.X 1 , … , X k x i ∈ ( 0 , 1 ) ∑ N i = 1 x i = 1k≥2X1,…,Xkxi∈(0,1)∑Ni=1xi=1α=(α1,…,αk)
La distribution Dirichlet est une généralisation de la distribution bêta en plusieurs dimensions, vous pouvez donc commencer par vous renseigner sur la distribution bêta. Beta est une distribution univariée d'une variable aléatoire paramétrée par les paramètres et . La bonne intuition à ce sujet vient si vous vous souvenez qu'il s'agit d'un a priori conjugué pour la distribution binomiale et si nous supposons un a priori bêta paramétré par et pour le paramètre de probabilité de la distribution binomiale , alors la distribution a posteriori de est aussi un distribution bêta paramétrée parα β α β p p α ′ = α + nombre de succès β ′ = β + nombre d'échecs α βX∈(0,1)αβαβppα′=α+number of successes et . Vous pouvez donc penser à et comme à des pseudocomptes (ils n'ont pas besoin d'être des entiers) de succès et d'échecs (vérifiez également ce fil ).β′=β+number of failuresαβ
Dans le cas de la distribution de Dirichlet, il s'agit d'un a priori conjugué pour la distribution multinomiale . Si dans le cas de la distribution binomiale nous pouvons penser en termes de dessin de boules blanches et noires avec remplacement de l'urne, alors dans le cas de la distribution multinomiale nous dessinons avec remplacement de boules apparaissant en couleurs, où chacune des couleurs des boules peuvent être tirées avec les probabilités . La distribution de Dirichlet est un a priori conjugué pour probabilités et paramètres peuvent être considérés comme des pseudocomptes de boules de chaque couleur supposés a priorik p 1 , … , p k p 1 , … , p k α 1 , … , α k α 1 , … , α k α 1 + n 1 , … , α k + n kNkp1,…,pkp1,…,pkα1,…,αk(mais vous devriez également lire les pièges d'un tel raisonnement ). Dans le modèle Dirichlet-multinomial sont mis à jour en les additionnant avec les observés dans chaque catégorie: de la même manière que dans le cas du modèle bêta-binomial.α1,…,αkα1+n1,…,αk+nk
La valeur la plus élevée de , le plus grand "poids" de et la plus grande quantité de la "masse" totale lui sont assignées (rappelez-vous qu'au total elle doit être ). Si tous les sont égaux, la distribution est symétrique. Si , il peut être considéré comme un anti-poids qui repousse vers les extrêmes, tandis que lorsqu'il est élevé, il attire vers une valeur centrale (centrale dans le sens où tous les points sont concentrés autour de lui, pas dans le sens qu'il est symétriquement central). Si , alors les points sont uniformément distribués.X i x 1 + ⋯ + x k = 1 α i α i < 1 x i x i α 1 = ⋯ = α k = 1αiXix1+⋯+xk=1αiαi<1xixiα1=⋯=αk=1
Cela peut être vu sur les graphiques ci-dessous, où vous pouvez voir des distributions de Dirichlet trivariées (malheureusement nous ne pouvons produire des graphiques raisonnables que jusqu'à trois dimensions) paramétrés par (a) , (b) , (c) , (d) .α 1 = α 2 = α 3 = 10 α 1 = 1 , α 2 = 10 , α 3 = 5 α 1 = α 2 = α 3 = 0,2α1=α2=α3=1α1=α2=α3=10α1=1,α2=10,α3=5α1=α2=α3=0.2
La distribution de Dirichlet est parfois appelée «distribution sur distributions» , car elle peut être considérée comme une distribution de probabilités elle-même. Notez que puisque chaque et , alors les sont cohérents avec les premier et deuxième axiomes de probabilité . Vous pouvez donc utiliser la distribution de Dirichlet comme une distribution de probabilités pour des événements discrets décrits par des distributions telles que catégoriques ou multinomiales . Ce n'est pasxi∈(0,1)x i k∑ki=1xi=1xivrai qu'il s'agit d'une distribution sur toutes les distributions, par exemple, elle n'est pas liée aux probabilités de variables aléatoires continues, ni même à certaines variables discrètes (par exemple, une variable aléatoire distribuée de Poisson décrit les probabilités d'observer des valeurs qui sont des nombres naturels, donc pour utiliser un Distribution de Dirichlet sur leurs probabilités, vous auriez besoin d'un nombre infini de variables aléatoires ).k