J'ai une question sur le calcul du facteur de rétrécissement de James-Stein dans l'article de 1977 de Scientific American de Bradley Efron et Carl Morris, "Stein's Paradox in Statistics" .
J'ai rassemblé les données pour les joueurs de baseball et elles sont données ci-dessous:
Name, avg45, avgSeason
Clemente, 0.400, 0.346
Robinson, 0.378, 0.298
Howard, 0.356, 0.276
Johnstone, 0.333, 0.222
Berry, 0.311, 0.273
Spencer, 0.311, 0.270
Kessinger, 0.289, 0.263
Alvarado, 0.267, 0.210
Santo, 0.244, 0.269
Swoboda, 0.244, 0.230
Unser, 0.222, 0.264
Williams, 0.222, 0.256
Scott, 0.222, 0.303
Petrocelli, 0.222, 0.264
Rodriguez, 0.222, 0.226
Campaneris, 0.200, 0.285
Munson, 0.178, 0.316
Alvis, 0.156, 0.200
avg45
est la moyenne après aux chauves-souris et est notée dans l'article. avgSeason
est la moyenne de fin de saison.
L'estimateur de James-Stein pour la moyenne ( ) est donné par z = ˉ y + c ( y - ˉ y ) et le facteur de rétrécissement c est donné par (page 5 de l'article de Scientific American 1977) c = 1 - ( k - 3 ) σ 2
où est le nombre de moyennes inconnues. Ici, il y a 18 joueurs donc k = 18 . Je peux calculer ∑ ( y - ˉ y ) 2 en utilisant des valeurs. Mais je ne sais pas comment calculer σ 2 . Les auteurs disent c = 0,212 pour l'ensemble de données donné.avg45
J'ai essayé d'utiliser à la fois et σ 2 y pour σ 2 mais ils ne donnent pas la bonne réponse de c = 0,212
Quelqu'un peut-il avoir la gentillesse de me faire savoir comment calculer pour cet ensemble de données?