Puisqu'on peut calculer des intervalles de confiance pour les valeurs p et que l'opposé de l'estimation d'intervalle est l'estimation ponctuelle: la valeur p est-elle une estimation ponctuelle?
Puisqu'on peut calculer des intervalles de confiance pour les valeurs p et que l'opposé de l'estimation d'intervalle est l'estimation ponctuelle: la valeur p est-elle une estimation ponctuelle?
Réponses:
Les estimations ponctuelles et les intervalles de confiance correspondent aux paramètres décrivant la distribution, par exemple la moyenne ou l'écart type.
Mais contrairement à d'autres statistiques d'échantillon telles que la moyenne d'échantillon et l'écart type d'échantillon, la valeur p n'est pas un estimateur utile d'un paramètre de distribution intéressant. Regardez la réponse de @whuber pour les détails techniques.
La valeur p d'une statistique de test donne la probabilité d'observer un écart par rapport à la valeur attendue de la statistique de test au moins aussi grand que celui observé dans l'échantillon, calculé en supposant que l'hypothèse nulle est vraie. Si vous avez la distribution entière, elle est soit cohérente avec l'hypothèse nulle, soit elle ne l'est pas. Ceci peut être décrit avec une variable d'indicateur (voir la réponse de @whuber).
Mais la valeur p ne peut pas être utilisée comme un estimateur utile de la variable indicatrice car elle n’est pas cohérente, car elle ne converge pas car la taille de l’échantillon augmente si l’hypothèse nulle est vraie. Il s'agit d'une autre manière assez compliquée d'affirmer qu'un test statistique peut rejeter ou ne pas rejeter la valeur null, mais ne jamais le confirmer.
Oui, il pourrait être (et a été) soutenu qu'une valeur p est une estimation ponctuelle.
Afin d'identifier toute propriété d'une distribution qu'une valeur p peut estimer, nous devrions supposer qu'elle est asymptotiquement non biaisée. Mais, asymptotiquement, la p-valeur moyenne pour l'hypothèse nulle est (idéalement, car certains tests , il est peut - être un autre numéro différent de zéro) et pour toute autre hypothèse , il est 0 . Ainsi, la valeur p pourrait être considérée comme un estimateur de la moitié de la fonction indicatrice pour l'hypothèse nulle.
Certes, il faut un peu de créativité pour afficher une valeur p de cette manière. Nous pourrions faire un peu mieux en considérant l’estimateur en question comme la décision que nous prenons au moyen de la valeur p: la distribution sous-jacente est-elle un membre de l’hypothèse nulle ou de l’hypothèse alternative? Appelons cet ensemble de décisions possibles . Jack Kiefer écrit
Nous supposons qu’il existe une expérience dont le statisticien peut observer les résultats. Ce résultat est décrit par une variable aléatoire ou un vecteur aléatoire .... Le statisticien ne connaît pas la loi de probabilité de X , mais il est connu que la fonction de distribution F de X est membre d'une classe Ω spécifiée de fonctions de distribution. ...
On dit qu'un problème statistique est un problème d' estimation ponctuelle si est la collection de valeurs possibles d'une propriété réelle ou à valeur vectorielle de F qui dépend de F de manière raisonnablement lisse.
Dans ce cas, puisque est discret, "raisonnablement lisse" n'est pas une restriction du tout. La terminologie de Kiefer reflète cela en faisant référence à des procédures statistiques avec des espaces de décision discrets comme "tests" au lieu de "estimateurs ponctuels".
Bien qu'il soit intéressant d'explorer les limites (et les limites) de telles définitions, comme cette question nous le demande, nous ne devrions peut-être pas insister trop sur le fait qu'une valeur p est un estimateur ponctuel, car cette distinction entre estimateurs et tests est à la fois: utile et conventionnel.
Dans un commentaire sur cette question, Christian Robert a attiré l'attention sur un article de 1992 dans lequel lui-même et ses coauteurs avaient exactement pris ce point de vue et analysé l'admissibilité de la valeur p en tant qu'estimateur de la fonction indicateur . Voir le lien dans les références ci-dessous. Le papier commence
Les approches de test d'hypothèse ont généralement traité le problème du test comme un problème de prise de décision plutôt que d'estimation. Plus précisément, un test d'hypothèse formelle permettra de déterminer si une hypothèse est vraie et ne fournira pas une mesure d'éléments de preuve à associer à cette conclusion. Dans cet article, nous considérons le test d'hypothèse comme un problème d'estimation dans un cadre de décision théorique ....
[Je souligne.]
Jiunn Tzon Hwang, George Casella, Christian Robert, Martin T. Wells et Roger H. Farrell, Estimation de la précision des tests . Ann. Statist. Volume 20, numéro 1 (1992), 490-509. Accès ouvert .
Jack Carl Kiefer, Introduction à l'inférence statistique . Springer-Verlag, 1987.
valeurs p ne sontutiliséespour estimer aucun paramètre d'intérêt, mais pour tester des hypothèses. Par exemple, vous pourriez être intéressé par l'estimation de la population fonction de votre échantillon, ou par son intervalle, mais dans le scénario de test d'hypothèse, comparez la moyenne de l'échantillon ¯ x à la moyenne de la population µ pour voir si ils diffèrent. En fait, dans le scénario de test d'hypothèse,leurs valeurs particulièresne vousintéressentpas, mais plutôt si elles sont inférieures à un seuil (par exemple, p < 0,05 ). Avec p-values vous ne vous intéressez pas beaucoup à leurs valeurs en points, mais vous voulez plutôt savoir si vos données fournissent suffisamment de preuves contre une hypothèse nulle. Dans le scénario de test d'hypothèses, vous ne compareriez pas différentes valeurs les unes aux autres, mais utiliseriez plutôt chacune d'elles pour prendre des décisions distinctes concernant vos hypothèses. Vous ne voulez vraiment rien savoir de l'hypothèse de coque, autant que vous sachiez si vous pouvez la rejeter ou non. Cela rend leurs valeurs indissociables du contexte de la décision et elles diffèrent donc des estimations ponctuelles car, avec les estimations ponctuelles, nous nous intéressons à leurs valeurs en tant que telles.