Erreur standard de l'écart type d'échantillon des proportions


8

J'ai récemment commencé à lire Gelman et Hill's, "Data Analysis Using Regression and Multilevel / Hierarchical Models" et la question est basée sur cela:

L'échantillon contient 6 observations sur les proportions: p1,p2,,p6

Chaque pi a signifie πi et variance πi(1πi)ni, où ni est le nombre d'observations utilisées pour calculer la proportion pi.

La statistique de test est Ti= échantillon écart type de ces proportions.

Le livre dit que la valeur attendue de la variance de l'échantillon des six proportions, p1,p2,,p6, est (1/6)i=16πi(1πi)/ni. Je comprends tout ça.

Ce que je veux savoir, c'est la répartition des Tiet sa variance? J'apprécierais que quelqu'un me fasse savoir de quoi il s'agit ou me guide vers un livre ou un article contenant ces informations.

Merci beaucoup.


Je n'ai pas le livre à vérifier, mais la déclaration sur la valeur attendue de la variance de l'échantillon me semble étrange. Cela devrait certainement dépendre de la variabilitéπiaussi.
Aniko

Une statistique de test est une valeur de recherche pour une distribution comme t de Student, distribution normale, distribution F, etc. Regardez dans le livre et trouvez le nom de la distribution pour cette statistique. La variance devrait également être liée à cela.
Carl

Personne ne voudrait connaître la répartition des Tiprécisément parce que c'est si méchant. C'est parce que les proportions elles-mêmes sont discrètes ...pi ne peut prendre que les valeurs 0/ni,1/ni,,ni/ni--et donc T(il ne doit y avoir aucun indice) est également discret: mais ses valeurs possibles, qui sont nombreuses, ne tombent pas dans une série d'intervalles régulièrement espacés. Sa variance n'est pas trop difficile à déterminer car elle est fonction des quatre premiers moments de chacun despiet ceux-ci sont relativement simples à écrire.
whuber

@Carl est vrai, et bien qu'il ne s'agisse pas d'une réponse directe à la question d'OP, cela vaut la peine d'être considéré. Cependant, des distributions exactes peuvent parfois être dérivées pour les statistiques de test, et celles-ci peuvent fournir de meilleures propriétés de petits échantillons des tests correspondants. Je ne m'attends pas à ce que ce soit le cas.
AdamO

Réponses:


1

La distribution exacte des proportions est pi ~ Bin(ni,πi)/ni, et les proportions peuvent prendre des valeurs pi=0,1ni,2ni,...,ni1ni,1. La distribution résultante de l'écart-type de l'échantillonTest une distribution discrète compliquée. Laissant , il peut s'écrire sous sa forme la plus triviale:p(p1,p2,...,p6)

FT(t)P(Tt)=pP(t)i=16Bin(nipi|ni,πi),

où est l'ensemble de tous les vecteurs de proportion qui conduisent à une variance d'échantillon non supérieure à . Il n'y a vraiment aucun moyen de simplifier cela dans le cas général. Pour obtenir une probabilité exacte de cette distribution, vous devez énumérer les vecteurs de proportion qui produisent une variance d'échantillon dans la plage d'intérêt, puis additionner les produits binomiaux sur cette plage énumérée. Ce serait un exercice de calcul onéreux pour des valeurs même modérément grandes de .P(t){p|Tt}tn1,...,n6

Maintenant, évidemment, la distribution ci-dessus n'est pas une forme très utile. Tout ce que cela vous dit vraiment, c'est que vous devez énumérer les résultats d'intérêt, puis additionner leurs probabilités. C'est pourquoi il serait inhabituel de calculer des probabilités exactes dans ce cas, et il est beaucoup plus facile de recourir à une forme asymptotique pour la distribution de la variance de l'échantillon.

En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.