La question que vous posez est différente des "diagnostics de convergence". Disons que vous avez exécuté tous les diagnostics de convergence (choisissez vos favoris) et que vous êtes maintenant prêt à commencer l'échantillonnage à partir de la partie postérieure.
Il existe deux options en termes de taille d'échantillon effective (ESS), vous pouvez choisir un ESS univarié ou un ESS multivarié. Un ESS univarié fournira une taille d'échantillon efficace pour chaque paramètre séparément, et des méthodes conservatrices dictent que vous choisissez la plus petite estimation. Cette méthode ignore toutes les corrélations croisées entre les composants. C'est probablement ce que la plupart des gens utilisent depuis un certain temps
Récemment, une définition multivariée de l'ESS a été introduite. L'ESS multivarié renvoie un nombre pour la taille réelle de l'échantillon pour les quantités que vous souhaitez estimer; et il le fait en tenant compte de toutes les corrélations croisées dans le processus. Personnellement, je préfère de loin l'ESS multivarié. Supposons que vous vous intéressez au vecteur des moyens de la distribution postérieure. Le mESS est défini comme suit
mESS = n ( | Λ |p
Ici
mESS=n(|Λ||Σ|)1/p.
- est la structure de covariance du postérieur (également la covariance asymptotique dans le CLT si vous aviez des échantillons indépendants)Λ
- est la matrice de covariance asymptotique dans la chaîne de Markov CLT (différente de Λ car les échantillons sont corrélés.ΣΛ
- est le nombre de quantités à estimer (ou dans ce cas, la dimension du postérieur.p
- est le déterminant.|⋅|
mESS peut être estimé en utilisant l'échantillon de matrice de covariance pour estimer et le lot signifie la matrice de covariance pour estimer Σ . Cela a été codé dans la fonction du package R mcmcse .ΛΣmultiESS
Cet article récent fournit une limite inférieure théoriquement valide du nombre d'échantillons efficaces requis. Avant la simulation, vous devez décider
- ϵϵ
- α
- p
mESS≥22/pπ(pΓ(p/2))2/pχ21−α,pϵ2,
Γ(⋅)minESS
p=2095%ϵ=.05
> minESS(p = 20, alpha = .05, eps = .05)
[1] 8716
Cela est vrai pour tout problème (dans des conditions de régularité). La façon dont cette méthode s'adapte d'un problème à l'autre est que le mélange lent des chaînes de Markov prend plus de temps pour atteindre cette limite inférieure, car mESS sera plus petit. Alors maintenant, vous pouvez vérifier plusieurs fois en utilisant multiESS
si votre chaîne de Markov a atteint cette limite; sinon allez chercher plus d'échantillons.