Désolé pour la réponse tardive, mais cela m'a aussi dérangé et j'ai trouvé la réponse. La distribution est en effet Dirichlet-Multinomial et le neg individuel. les distributions binomiales n'ont même pas besoin d'être identiques, tant que leur facteur Fano (rapport de variance à la moyenne) est identique.
Longue réponse:
Si vous paramétrez NB comme:
p(X=x|λ,θ)=NB(x|λ,θ)=(θ−1λ+x−1x)(11+θ−1)x(θ−11+θ−1)θ−1λ
Alors et etE(X)=λVar(X)=λ(1+θ)
∀i:Xi∼NB(λi,θ) implique
∑Xi∼NB(∑λi,θ)
Puis en prenant la probabilité compte tenu de la somme:
∏NB(xi|λi,θ)NB(∑xi|∑λi,θ)=(11+θ−1)∑xi(θ−11+θ−1)θ−1∑λi∏(θ−1λi+xi−1xi)(11+θ−1)∑xi(θ−11+θ−1)θ−1∑λi(θ−1∑λi+∑xi−1∑xi)==Γ(∑xi+1)Γ(θ−1∑λi)Γ(θ−1∑λi+∑xi)∏Γ(θ−1λi+xi)Γ(xi+1)Γ(θ−1λi)=DM(x1,...,xn|θ−1λ1,...,θ−1λn)
où est la vraisemblance Dirichlet-Multinomiale. Cela résulte simplement du fait que, à l'exception des coefficients multinomiaux, de nombreux termes de la fraction sur le côté gauche s'annulent, vous laissant uniquement avec les termes de la fonction gamma qui se trouvent être les mêmes que dans la probabilité DM.DM
Notez également que les paramètres de ce modèle ne sont pas identifiables car une augmentation de avec une diminution simultanée de tous les résultats de exactement la même probabilité.θλi
La meilleure référence que j'ai pour cela est les sections 2 à 3.1 de Guimarães & Lindrooth (2007): Contrôle de la surdispersion dans les modèles logit conditionnels groupés: Une application simple de calcul de la régression multiromiale Dirichlet - elle est malheureusement payée, mais je n'ai pas pu trouver une référence non paywalled.