Pourquoi le PDF de Dirichlet Distribution ne semble-t-il pas s'intégrer à 1?


8

J'ai essayé de trouver la valeur attendue d'une fonction d'une variable aléatoire avec une distribution de Dirichlet en intégrant son produit avec la fonction de densité de Dirichlet sur un simplex en R.

Pour vérifier que j'appliquais la fonction correcte dans R, j'ai essayé d'intégrer la fonction de densité sur tout le simplexe, en espérant obtenir 1, mais j'ai continué à obtenir la fonction de densité pour une distribution de Dirichlet avec n catégories intégrées à sqrt (n) (en utilisant Package R SimplicialCubature).

J'ai supposé que cela devait être faux, mais j'ai ensuite examiné la fonction de densité pour 2 catégories, considérons le cas où les alphas = (1,1). Ensuite, la fonction de densité est uniformément 1 (en prenant la fonction de densité de https://en.wikipedia.org/wiki/Dirichlet_distribution ). Donc l'intégrale de la fonction de densité sur le 1-simplex donne juste la longueur du 1-simplex. Mais c'est sqrt (2), comme je l'ai trouvé avec le code R.

Qu'est-ce que j'oublie ici?

Réponses:


12

Avec deux variables, vous définissez un segment de ligne dans , comme vous l'avez souligné. Cependant, en raison de la contrainte simplex, l'une de ces deux variables est redondante en termes de spécification de la densité, car il existe une relation un à un entre et . Par conséquent, la densité est spécifiée sur les variables libres (c'est-à-dire dans )R2x1x2K1R

Ceci est en fait souligné dans la première ligne de cette section de l'article Wikipedia, bien que très subtilement.

Par conséquent, votre fonction de densité devient:.

Dir1,1(x1,1x1)=Γ(2)Γ(1)2(x1)0(1x1)0=1

Donc,

01Dir1,1(x1,1x1)dx1=1

Réponse au commentaire du PO

En raison des contraintes du simplexe, la densité de Dirichlet à deux variables est en fait dégénérée dans , comme le montre ma construction ci-dessus (elle ne nécessite qu'une seule variable). S'il est vrai qu'il a une densité de , il n'a pas de densité de sur le segment de ligne reliant à . Ce que la construction ci-dessus montre, c'est que la densité marginale a une valeur de . Votre confusion vient du fait de considérer comme une variable libre, auquel cas le support de Dirichlet surR211(1,0)(0,1)1x2R2aurait une zone non nulle. Cette intuition est bonne dans des cas comme le gaussien bivarié, où les deux variables ne sont pas parfaitement corrélées, mais pas dans ce cas.

Nous pouvons en déduire formellement ceci:

Soit un certain nombre dans spécifiant la distance de à long du segment de ligne de connexion. Ainsi, chaque valeur de identifie une paire unique . En utilisant cette notation, votre hypothèse selon laquelle la densité est de long de cette ligne se résume à:L[0,2](1,0)(0,1)L(x1,x2)1

P(L[a,b])=ba

Cependant, nous pouvons montrer que ce n'est pas le cas à travers un traitement formel de la densité conjointe de :x1,x2

PL(L[a,b])=PX1,X2[(x1,x2)A[a,b]]

A[a,b]:={(u,v):u[1b2,1a2],v=1u]

Maintenant, calculons :PL(L[a,b])

PL(L[a,b])=A[a,b]dPX1,X2=A[a,b]dPX1dPX2|X1=A[a,b]1dPX1=1b21a21du=

(1a2)(1b2)=12(ba)

Où la troisième égalité se produit parce que pour (c'est dire que ce n'est pas une densité, mais une masse de probabilité ponctuelle à )dPX2|X1=1X2=1X11X1

Comme vous pouvez le voir, nous avons récupéré la constante de normalisation pour la densité le long du segment de ligne dans . En effet, cette densité (dégénérée) des articulations n'est qu'une transformation linéaire de l'un des deux marginaux (l'un ou l'autre fonctionnera). Il en résulte que le domaine de la densité de probabilité passe de à , donc la densité doit diminuer pour compenser.12R212


1
Merci beaucoup, je suis d'accord avec la logique de ce que vous avez écrit, mais je ne peux pas cadrer cela dans mon esprit avec le fait que la fonction a une valeur constante 1 et que la ligne a une longueur sqrt (2). Alors pourquoi l'intégrale ne devrait-elle pas donner sqrt (2) ??
EBartrum

@EBartrum J'ajouterai des éclaircissements vers 7h30 HAE

3
@EBartrum a ajouté plus de détails pour compléter le post (je sais que vous avez déjà accepté, mais d'autres voudront peut-être les détails supplémentaires)
En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.