Est-il possible de prouver une hypothèse nulle?

37

Comme le dit la question - Est-il possible de prouver l'hypothèse nulle? D'après ma compréhension (limitée) de l'hypothèse, la réponse est non, mais je ne peux pas en donner une explication rigoureuse. La question a-t-elle une réponse définitive?

hypothesis-testing proof equivalence

— Pulkit Sinha
source

4

Cela dépend de ce que vous entendez par "prouver". Comme indiqué, il s’agit d’une question philosophique et non statistique, qui n’a pas de réponse définitive (bien que, du moins depuis l’époque de David Hume, la plupart des gens répondraient «non»).

— whuber

C'est en quelque sorte une question mal posée. Nous devons connaître les conditions dans lesquelles cette "preuve" doit se produire.

— Probistislogic

Peut-être une question mieux posée est-elle "Dans quelles conditions / hypothèses est-il possible de prouver l'hypothèse nulle?"

— Probistislogic

Connexes: Pourquoi les statisticiens disent-ils qu'un résultat non significatif signifie "vous ne pouvez pas rejeter le zéro" par opposition à l'hypothèse nulle?

— amibe dit de réintégrer Monica

19

Si vous parlez du monde réel et non de la logique formelle, la réponse est bien sûr. La "preuve" de tout par des moyens empiriques dépend de la force de l’inférence que l’on peut faire, qui est elle-même déterminée par la validité du processus de test évalué à la lumière de tout ce que l’on sait sur le fonctionnement du monde (c.-à-d. La théorie). Chaque fois que l’on accepte que certains résultats empiriques justifient de rejeter l’hypothèse "nulle", on doit nécessairement porter des jugements de ce type (validité du design; le monde fonctionne d’une certaine manière), ce qui oblige à faire les suppositions analogues nécessaires pour justifier la déduction de la "preuve de la null "n'est pas problématique du tout.

Alors, quelles sont les hypothèses analogues? Voici un exemple de "prouver le nul" qui est banal en sciences de la santé et en sciences sociales. (1) Définissez «nul» ou «aucun effet» d’une manière qui ait un sens pratique. Disons que je crois que je devrais me conduire comme s'il n'y avait pas de différence significative entre 2 traitements, t1 et t2, pour une maladie à moins que l'un ne donne 3% de meilleures chances de guérison que l'autre. (2) Déterminez une conception valide pour vérifier s'il y a un effet - dans ce cas, s'il existe une différence de probabilité de récupération entre t1 et t2. (3) Faites une analyse de puissance pour déterminer si la taille de l'échantillon est nécessaire pour générer une probabilité suffisamment élevée - une probabilité sur laquelle je suis confiant, compte tenu de quoi 'en supposant qu'il existe. Habituellement, les gens disent que le pouvoir est suffisant si la probabilité d’observer un effet spécifié à un alpha spécifié est d’au moins 0,80, mais le niveau de confiance adéquat dépend en réalité de votre opposition à l’erreur - la même chose lorsque vous sélectionnez p -seuil de valeur pour "rejeter le zéro." (4) Effectuez le test empirique et observez l'effet. Si elle est inférieure à la valeur de "différence significative" spécifiée - 3% dans mon exemple - vous avez "prouvé" qu'il n'y a "pas d'effet".

Pour un bon traitement de cette question, voir Streiner, DL Unicorns Do Exist: un tutoriel sur la «démonstration» de l'hypothèse nulle . Canadian Journal of Psychiatry 48, 756-761 (2003).

— dmk38
source

1

+1 C'est un bel exemple de l'importance de bien définir son critère de "preuve". Dans de nombreuses applications, celle que vous invoquez ici - la norme "agissez comme si", si je puis dire, est si faible que personne ne l'accepterait comme "preuve". Je ne nie pas son utilité, cependant, et préconise ce type d'approche pour soutenir une prise de décision rationnelle. (Mais peut-être que les méthodes bayésiennes sont meilleures ... :-)

— whuber

1

(+1) Bonne réponse. J'ai ajouté un lien vers une version en ligne de l'article de Streiner; J'espère que cela ne vous dérange pas (n'hésitez pas à l'enlever).

— chl

1

couple more things: (1) Traiter le fait de ne pas rejeter la nullité comme preuve à l’ appui de la nullité est une erreur choquante et une occasion habituelle pour le point de Streiner. Cette erreur transforme essentiellement la forte aversion pour l’erreur de type 1 de la norme "p <0,05" en une licence permettant de créer le type 2. S dit: "attendez - vous avez besoin d’alimentation ..." (2) Whuber cite le fameux argument de Hume. Le pt de H est en fait aussi subversif que les preuves empiriques rejetant le nul comme les preuves du nul. H dit que l'induction ne peut pas soutenir l'inférence causale. D'accord; mais il n'y a pas d'alternative à l'étude empirique! Allez Pearl (& Bayes), pas Hume, sur la causalité!

— dmk38

1

Cette question sur les tests d'équivalence a également de bonnes suggestions. stats.stackexchange.com/questions/3038/…

— Jeromy Anglim

Est-ce que cela équivaut à assumer "pas le nul" comme nouvelle hypothèse nulle et à rejeter ensuite cette nouvelle hypothèse nulle?

16

Réponse du côté mathématique: il est possible si et seulement si "les hypothèses sont singulières".

Si par "prouver" vous voulez dire avoir une règle qui peut "accepter" (devrais-je dire cela :)) avec une probabilité de faire une erreur nulle, alors vous recherchez ce que l'on pourrait appeler le "test idéal" et ceci existe: $H_0$

Si vous testez wether une variable aléatoire est tirée de ou de (c. -à- test contre ) alors il existe un test idéal si et seulement si ( et sont "singuliers"). $X$ $P_0$ $P_1$ $H_0: X\leadsto P_0$ $H_1: X\leadsto P_1$ $P_1\bot P_0$ $P_1$ $P_0$

Si vous ne savez pas ce que "mutuellement singulier" signifie, je peux vous donner un exemple: et (uniformes sur et ) sont mutuellement singuliers. . Cela signifie que si vous voulez tester $\mathcal{U}[0,1]$ $\mathcal{U}[3,4]$ $[0,1]$ $[3,4]$

par rapport $H_0: X\leadsto \mathcal{U}[0,1]$ $H_1: X\leadsto \mathcal{U}[3,4]$

alors il existe un test idéal (devinez ce que c'est :)): un test qui ne trompe jamais!

Si et ne sont pas singuliers, cela n'existe pas (cela résulte du "seulement si partie")! $P_1$ $P_0$

En termes non mathématiques, cela signifie que vous pouvez prouver le zéro si et seulement si la preuve est déjà dans vos hypothèses (c'est-à-dire si et seulement si vous avez choisi l'hypothèse et si différentes qu'une seule observation de ne peut pas être identifié comme appartenant à et vice versa). $H_0$ $H_1$ $H_0$ $H_1$

— robin girard
source

4

+1 belle réponse. Une simple interprétation du calcul est que le zéro et ses alternatives sont supposés produire des ensembles de résultats disjoints; Par exemple, il y a un zèbre dans cette pièce ou il n'y en a pas. Bien sûr, "prouver" comprend ici implicitement "conditionnel au modèle", qui n'est jamais établi avec la même rigueur qu'un théorème mathématique, par exemple; il inclut implicitement "conditionnel à l'exactitude des observations"; et cela implique implicitement que les hypothèses peuvent être interprétées sans ambiguïté. (Pour la critique de ce dernier, voir Women, Fire et Dangerous Things de George Lakoff . )

— whuber

11

Oui, il y a une réponse définitive. La réponse est: non, il n'y a pas moyen de prouver une hypothèse nulle. Autant que je sache, le mieux que vous puissiez faire est de jeter des intervalles de confiance autour de votre estimation et de démontrer que l'effet est si faible qu'il pourrait tout aussi bien être pratiquement inexistant.

— russellpierce
source

4

Plus généralement, le problème des statistiques n’est pas que vous ne pouvez pas prouver l’hypothèse nulle, mais que vous n’êtes pas en mesure de faire des estimations ponctuelles avec certitude. Autrement dit, comme vous ne pouvez pas dire "il n'y a pas d'effet de la variable", vous ne pouvez pas dire que "la taille de l'effet de la variable est de 1,95". Les statistiques ont toujours des intervalles de confiance.

— russellpierce

1

Convenu que la réponse est un grand non, et pour une très forte raison: par construction d'hypothèse statistique. Le fait que la réponse acceptée affirme le contraire est absolument tragique. La réponse des tests d'hypothèses est la suivante: en supposant que mon hypothèse soit vraie , les données que j'ai échantillonnées sont-elles cohérentes? Et pas du tout l'inverse. Il ne faut pas beaucoup de raisonnement pour comprendre que vous ne pouvez pas en déduire si l'hypothèse est vraie ou non.

— Christophe

4

Pour moi, le cadre théorique de la décision présente le moyen le plus simple de comprendre "l'hypothèse nulle". Il dit essentiellement qu'il doit y avoir au moins deux alternatives: l'hypothèse Null et au moins une alternative. Ensuite, le "problème de décision" consiste à accepter l'une des solutions de rechange et à rejeter les autres (bien que nous devions préciser ce que nous entendons par "accepter" et "rejeter" l'hypothèse). Je vois la question de "pouvons-nous prouver l'hypothèse nulle?" comme analogue à "pouvons-nous toujours prendre la bonne décision?". Du point de vue de la théorie de la décision, la réponse est clairement oui si

1) il n’ya pas d’incertitude dans le processus de décision, car c’est un exercice mathématique de déterminer quelle est la bonne décision.

2) nous acceptons tous les autres postulats / hypothèses du problème. La plus critique (je pense) est que les hypothèses entre lesquelles nous décidons sont exhaustives et que l’une (et la seule) d’entre elles doit être vraie et les autres fausses.

D'un point de vue plus philosophique, il n'est pas possible de "prouver" quoi que ce soit, en ce sens que la "preuve" dépend entièrement des hypothèses / axiomes qui mènent à cette "preuve". Je considère la preuve comme une sorte d’équivalence logique plutôt que comme un "fait" ou une "vérité" en ce sens que si la preuve est fausse, les hypothèses qui l’ont conduit sont également fausses.

En appliquant ceci à "prouver l'hypothèse nulle", je peux "prouver" sa véracité en supposant simplement que c'est vrai ou en supposant que ce soit vrai si certaines conditions sont remplies (comme la valeur d'une statistique).

— probabilislogic
source

3

Oui, il est possible de prouver le null - dans le même sens qu'il est possible de prouver une alternative au néant. Dans une analyse bayésienne, il est parfaitement possible que les probabilités en faveur du nul par rapport à l’une quelconque des alternatives proposées lui soient arbitrairement grandes. De plus, il est faux d'affirmer, comme certaines des réponses ci-dessus, que l'on ne peut prouver le nul que si ses alternatives sont disjointes (ne se chevauchent pas avec le nul). Dans une analyse bayésienne, chaque hypothèse a une distribution de probabilité antérieure. Cette distribution répartit une masse unitaire de probabilité a priori sur les alternatives proposées. L'hypothèse nulle met toute la probabilité a priori sur une seule alternative. En principe, les alternatives à null peuvent affecter toute la probabilité antérieure à une alternative non nulle (sur un autre "point"), mais c'est rare. En général, les alternatives couvrent, c'est-à-dire qu'elles étalent la même masse de probabilité antérieure que d'autres alternatives - soit à l'exclusion de l'alternative nulle, soit, plus communément, de l'alternative nulle. La question devient alors de savoir quelle hypothèse met la probabilité la plus ancienne où les données expérimentales tombent. Si les données sont proches des valeurs nulles, alors ce sera la faveur des chances (parmi les hypothèses proposées) MÊME SI CELA EST INCLUS DANS (NIDIMÉ, NON MUTUELLEMENT EXCLUSIF AVEC), LES ALTERNATIVES. L'idée selon laquelle il n'est pas possible qu'une alternative imbriquée soit plus probable que l'ensemble dans lequel elle est imbriquée reflète l'échec de la distinction entre probabilité et vraisemblance. S'il est impossible pour un composant d'un ensemble d'être moins probable que l'ensemble, il est parfaitement possible que la probabilité postérieure d'un composant d'un ensemble d'hypothèses soit supérieure à la probabilité postérieure de l'ensemble dans son ensemble. La vraisemblance postérieure d'une hypothèse est le produit de la fonction de vraisemblance et de la distribution de probabilité antérieure que propose l'hypothèse. Si une hypothèse place toute la probabilité antérieure au bon endroit (par exemple, sur le zéro), elle aura alors une probabilité postérieure supérieure à celle d'une hypothèse qui met une partie de la probabilité antérieure au mauvais endroit (et non sur le zéro). La vraisemblance postérieure d'une hypothèse est le produit de la fonction de vraisemblance et de la distribution de probabilité antérieure que propose l'hypothèse. Si une hypothèse place toute la probabilité antérieure au bon endroit (par exemple, sur le zéro), elle aura alors une probabilité postérieure supérieure à celle d'une hypothèse qui met une partie de la probabilité antérieure au mauvais endroit (et non sur le zéro). La vraisemblance postérieure d'une hypothèse est le produit de la fonction de vraisemblance et de la distribution de probabilité antérieure que propose l'hypothèse. Si une hypothèse place toute la probabilité antérieure au bon endroit (par exemple, sur le zéro), elle aura alors une probabilité postérieure supérieure à celle d'une hypothèse qui met une partie de la probabilité antérieure au mauvais endroit (et non sur le zéro).

2

Techniquement, non, une hypothèse nulle ne peut être prouvée. Pour toute taille d’échantillon fixe et finie, il y aura toujours une taille d’effet faible mais non nulle pour laquelle votre test statistique n’a pratiquement aucune puissance. Plus concrètement, cependant, vous pouvez prouver que vous êtes dans les limites de l'hypothèse nulle, de sorte que des écarts inférieurs à cet epsilon ne sont pratiquement pas significatifs.

— Dsimcha
source

2

Il y a un cas où une preuve est possible. Supposons que vous avez une école et que votre hypothèse nulle est que le nombre de garçons et de filles est égal. Au fur et à mesure que la taille de l'échantillon augmente, l'incertitude du ratio garçons / filles tend à diminuer, pour atteindre éventuellement la certitude (c'est ce que vous voulez dire par preuve) lorsque l'ensemble de la population des élèves est échantillonné.

Mais si vous n'avez pas une population finie, ou si vous échantillonnez avec remplacement et ne pouvez pas localiser les individus ré-échantillonnés, vous ne pouvez pas réduire l'incertitude à zéro avec un échantillon fini.

— Henri
source

0

Je voudrais aborder ici un point sur lequel beaucoup d'utilisateurs sont un peu confus. Quelle est la véritable signification de l'énoncé d'hypothèse nulle H0: p = 0? Essayons-nous de déterminer si le paramètre p est égal à zéro? Bien sûr que non, il n'y a aucun moyen d'atteindre un tel objectif.

Ce que nous avons l’intention d’établir, c’est que, compte tenu de l’ensemble de données, la valeur du paramètre évalué est (ou non) indiscernable à partir de zéro. Rappelez-vous que NHST est "injuste" par rapport aux hypothèses alternatives: le zéro correspond à un niveau de confiance de 95% et seulement 5% à l’alternative. En conséquence, un résultat «non significatif» ne signifie pas que H0 est valable, mais simplement que nous n'avons pas trouvé de preuves suffisantes de la vraisemblance de la solution de remplacement.

— licas
source