Une valeur de p est la probabilité d'obtenir une statistique au moins aussi extrême que celle observée dans les données d'échantillon en supposant que l'hypothèse nulle ( ) est vraie.
Graphiquement, cela correspond à l'aire définie par la statistique de l'échantillon sous la distribution d'échantillonnage que l'on obtiendrait en supposant :
Cependant, parce que la forme de cette distribution supposée est en fait basée sur les données de l'échantillon, le centrer sur me semble un choix étrange.
Si l'on devait plutôt utiliser la distribution d'échantillonnage de la statistique, c'est-à-dire centrer la distribution sur la statistique de l'échantillon, alors le test d'hypothèse correspondrait à l'estimation de la probabilité de compte tenu des échantillons.
Dans ce cas, la valeur de p est la probabilité d'obtenir une statistique au moins aussi extrême que compte tenu des données au lieu de la définition ci-dessus.
De plus, une telle interprétation a l'avantage de bien correspondre au concept d'intervalles de confiance:
un test d'hypothèse avec un niveau de signification équivaudrait à vérifier si situe dans l' intervalle de confiance de la distribution d'échantillonnage.
Je pense donc que centrer la distribution sur pourrait être une complication inutile.
Y a-t-il des justifications importantes pour cette étape que je n'ai pas considérées?