Dans l'exemple de 8 écoles de Gelman, pourquoi l'erreur-type de l'estimation individuelle supposée est-elle connue?


17

Le contexte:

Dans l'exemple de 8 écoles de Gelman (Bayesian Data Analysis, 3e édition, Ch 5.5), huit expériences parallèles dans 8 écoles testent l'effet du coaching. Chaque expérience donne une estimation de l'efficacité du coaching et de l'erreur standard associée.

Les auteurs construisent ensuite un modèle hiérarchique pour les 8 points de données de l'effet coaching comme suit:

yiN(θi,sei)θiN(μ,τ)

Question Dans ce modèle, ils supposent que sei est connu. Je ne comprends pas cette hypothèse - si nous estimons que nous devons modéliser θi , pourquoi ne faisons-nous pas la même chose pour sei ?

J'ai vérifié l' article original de Rubin présentant l'exemple de l'école 8, et là aussi l'auteur dit que (p 382):

l'hypothèse de normalité et d'erreur standard connue est faite systématiquement lorsque nous résumons une étude par un effet estimé et son erreur standard, et nous ne remettrons pas en question son utilisation ici.

Pour résumer, pourquoi ne modélisons-nous pas sei ? Pourquoi le traitons-nous comme connu?


Je suppose que parce qu'ils connaissent le nombre total d'écoles dans la région, le SE est donc fonction de la taille de l'échantillon et de l'estimation?
Statistiques d'apprentissage par l'exemple du

1
La taille de l'échantillon est connue et fixe, mais l'erreur standard dépend également de l'écart type des données, et je ne sais pas pourquoi nous considérons cela comme fixe.
Heisenberg

1
Si vous êtes satisfait de rendre vos résultats entièrement conditionnels à l'hypothèse d'erreurs standard fixes, alors il n'y a rien de mal à faire (et à énoncer) cette condition. Mais pourquoi? Absence d'un prieur défendable? Ou peut-être que si les erreurs standard reçoivent une priorité large et non informative, le reste de l'analyse disparaît. Je ne sais pas.
Peter Leopold

Réponses:


2

À la page 114 du même livre, vous citez: "Le problème de l'estimation d'un ensemble de moyennes avec des variances inconnues nécessitera quelques méthodes de calcul supplémentaires, présentées dans les sections 11.6 et 13.6". C'est donc pour la simplicité; les équations de votre chapitre fonctionnent de manière fermée, alors que si vous modélisez les variances, elles ne le font pas, et vous avez besoin des techniques MCMC des chapitres suivants.

1n1(xix¯)2


Je vois - ils supposent que la variance est estimée très précisément, en d'autres termes, que l'erreur-type de la variance est très petite?
Heisenberg

nσ^22σ4/(n1)
En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.