Quelles distributions antérieures pourraient / devraient être utilisées pour la variance dans un modèle bayésien hiérarchique lorsque la variance moyenne présente un intérêt?

16

Dans son article largement cité Prior distributions for variance parameters in hierarchical models (916 citation à ce jour sur Google Scholar) Gelman propose que de bonnes distributions a priori non informatives pour la variance dans un modèle bayésien hiérarchique soient la distribution uniforme et la distribution demi-t. Si je comprends bien, cela fonctionne bien quand c'est le paramètre de localisation (par exemple la moyenne) qui est du principal intérêt. Parfois, cependant, le paramètre de variance est du principal intérêt, par exemple lors de l'analyse des données de réponse humaine des tâches de synchronisation, la variabilité de synchronisation est souvent la mesure d'intérêt. Dans ces cas, il n'est pas clair pour moi comment la variabilité pourrait être modélisée hiérarchiquement avec, par exemple, des distributions uniformes, car après l'analyse je veux obtenir la crédibilité de la variance moyenne à la fois au niveau des participants et au niveau du groupe.

Ma question est alors: quelle distribution est recommandée lors de la construction d'un modèle bayésien hiérarchique lorsque la variance des données est du principal intérêt?

Je sais que la distribution gamma peut être re-paramétrisée pour être spécifiée par la moyenne et l'écart-type. Par exemple, le modèle hiérarchique ci-dessous est tiré du livre de Kruschke, Doing Bayesian Data Analysis . Mais Gelman décrit quelques problèmes avec la distribution gamma dans son article et je serais reconnaissant pour des suggestions d'alternatives, de préférence des alternatives qui ne sont pas trop difficiles à travailler dans BUGS / JAGS.

entrez la description de l'image ici

— Rasmus Bååth
source

2

Je ne suis pas d'accord avec la façon dont vous interprétez Gelman concernant le choix du paramètre Gamma pour l'échelle. La base de la modélisation hiérarchique est de relier des paramètres individuels à un paramètre commun à travers une structure avec des paramètres inconnus (généralement moyenne et variance). En ce sens, l'utilisation d'une distribution gamma pour la variance individuelle (ou log-normale pour une queue plus lourde) conditionnée à la variance moyenne et sa dispersion me semble valable (du moins en ce qui concerne les arguments de Gelman).

Les critiques de Gelman au sujet du paramètre gamma pour l'échelle concernent le fait que le gamma est utilisé pour approximer les Jeffreys en définissant des valeurs extrêmes à son paramètre. Le problème est qu'en fonction de l'extrême de ces valeurs (ce qui est assez arbitraire), le postérieur peut être très différent. Cette observation invalide l'utilisation de cet a priori, du moins lorsque nous n'avons pas d'informations à définir dans l'a priori. Dans cette discussion, il me semble que le gamma ou le gamma inverse n'est jamais calibré en termes de moyenne et de variance à partir d'informations antérieures ou d'une structure hiérarchique. Sa recommandation concerne donc un contexte assez différent du vôtre qui, si je comprends bien votre objectif,

— peuhp
source

0

$\tau_i$

— altroware
source