Une distribution de Dirichlet est souvent utilisée pour catégoriser de manière probabiliste les événements parmi plusieurs catégories. Supposons que les événements météorologiques prennent une distribution de Dirichlet. On pourrait alors penser que la météo de demain a une probabilité d'ensoleillement égale à 0,25, une probabilité de pluie égale à 0,5 et une probabilité de neige égale à 0,25. La collecte de ces valeurs dans un vecteur crée un vecteur de probabilités.
Une autre façon de penser à une distribution Dirichlet est le processus de casser un bâton. Imaginez un bâton de longueur unitaire. Cassez ce bâton n'importe où et conservez l'un des deux morceaux. Ensuite, divisez le morceau restant en deux et continuez aussi longtemps que vous le souhaitez. Tous les morceaux ensemble doivent correspondre à la longueur unitaire, et l'allocation de morceaux de longueurs différentes à différents événements représente la probabilité de cet événement.
Si vous connaissez la distribution bêta, la distribution Dirichlet pourrait devenir encore plus claire. Une distribution bêta est souvent utilisée pour décrire une distribution de probabilités d'événements dichotomiques, elle est donc limitée à l'intervalle unitaire. Par exemple, pour un essai de Bernoulli, il n'y a qu'un paramètreθdécrivant la probabilité d'un «succès». Souvent on penseθ comme étant fixe, mais si nous ne sommes pas certains de la "vraie" valeur de θ, on pourrait penser à une distribution de tous les θs, avec une plus grande probabilité pour ceux que nous considérons plus plausibles, donc peut-être θ ∼ B ( α , β), où α > β concentre plus de la masse près de 1 et β> α concentre plus de la masse près de 0.
On pourrait objecter que la distribution bêta ne décrit que la probabilité d'une seule probabilité, c'est-à-dire, par exemple, que P( θ < 0,25 ) = 0,5, qui est un nombre scalaire. Mais gardez à l'esprit que la distribution bêta décrit des résultats dichotomiques . Donc, en appliquant le deuxième axiome de Kolmogorov, nous savons également queP( θ ≥ 0,25 ) = 0,5ainsi que. La collecte de ces résultats dans un vecteur nous donne un vecteur de probabilités.
L'extension de la distribution bêta en trois catégories ou plus nous donne la distribution de Dirichlet; en effet, le PDF du Dirichlet pour deux groupes est exactement le même que la distribution bêta.