Quelle est la différence entre les intervalles de confiance et les tests d'hypothèse?

J'ai lu des controverses concernant les tests d'hypothèses, certains commentateurs suggérant que les tests d'hypothèses ne devraient pas être utilisés. Certains commentateurs suggèrent d' utiliser plutôt des intervalles de confiance .

Quelle est la différence entre les intervalles de confiance et les tests d'hypothèse? Une explication avec référence et des exemples seraient appréciés.

hypothesis-testing confidence-interval

— love-stats
source

Je pense que vous vouliez vous demander pourquoi rapporter les résultats des tests d'hypothèse en montrant l'intervalle de confiance est meilleur que simplement dire que quelque chose est confirmé ou rejeté à un certain niveau de valeur p.

Vous devriez envisager de vérifier certaines de vos autres questions comme une réponse.

— Andy W

Réponses:

Vous pouvez utiliser un intervalle de confiance (IC) pour les tests d'hypothèse. Dans le cas typique, si l'IC d'un effet ne s'étend pas sur 0, vous pouvez rejeter l'hypothèse nulle. Mais un CI peut être utilisé pour plus, alors que le fait de savoir s'il a été réussi est la limite de l'utilité d'un test.

La raison pour laquelle il est recommandé d'utiliser CI au lieu d'un simple test t, par exemple, est qu'alors vous pouvez faire plus que simplement tester des hypothèses. Vous pouvez faire une déclaration sur la gamme des effets que vous pensez être probables (ceux du CI). Vous ne pouvez pas faire cela avec juste un test t. Vous pouvez également l'utiliser pour faire des déclarations sur le null, ce que vous ne pouvez pas faire avec un t-test. Si le test t ne rejette pas la valeur nulle, vous dites simplement que vous ne pouvez pas rejeter la valeur nulle, ce qui ne dit pas grand-chose. Mais si vous avez un intervalle de confiance étroit autour de la valeur nulle, vous pouvez suggérer que la valeur nulle ou proche de celle-ci est probablement la vraie valeur et suggérer que l'effet du traitement, ou variable indépendante, est trop petit pour être significatif ( ou que votre expérience ne fonctionne pas

Ajouté plus tard: j'aurais vraiment dû dire que, même si vous pouvez utiliser un CI comme un test, il n'en est pas un. C'est une estimation d'une plage où vous pensez que les valeurs des paramètres se trouvent. Vous pouvez faire des tests comme des inférences mais vous êtes tellement mieux de ne jamais en parler de cette façon.

Ce qui est mieux?

A) L'effet est de 0,6, t (29) = 2,8, p <0,05. Cet effet statistiquement significatif est ... (une discussion s'ensuit sur cette signification statistique sans aucune mention ni même une forte capacité de discuter de l'implication pratique de l'ampleur de la découverte ... dans un cadre de Neyman-Pearson, l'amplitude du t et Les valeurs de p sont pratiquement dénuées de sens et tout ce que vous pouvez discuter est de savoir si l'effet est présent ou non. Vous ne pouvez jamais vraiment dire qu'il n'y a pas réellement d'effet basé sur le test.)

B) En utilisant un intervalle de confiance à 95%, j'estime que l'effet se situe entre 0,2 et 1,0. (une discussion s'ensuit en parlant de l'effet réel de l'intérêt, que ce soit des valeurs plausibles qui ont une signification particulière et une utilisation du mot significative pour exactement ce qu'il est censé signifier. En outre, la largeur de l'IC peut aller directement à une discussion pour savoir s'il s'agit d'une conclusion solide ou si vous ne pouvez parvenir qu'à une conclusion plus provisoire)

Si vous avez suivi un cours de statistiques de base, vous pourriez initialement vous orienter vers A. Et il peut y avoir des cas où c'est une meilleure façon de rapporter un résultat. Mais pour la plupart des travaux, B est de loin supérieur. Une estimation de la plage n'est pas un test.

— John
source

Un ajout aux commentaires de @john: Premièrement, la question clé est parfois de savoir si l'IC s'étend sur 1, et non sur 0 (par exemple la régression logistique).

— Peter Flom - Réintègre Monica

Les gars, c'est 1 ou est-ce 0? (Cela me semble très éclairant, donc je suppose que j'ai besoin d'apprendre la bonne valeur à rechercher!) @John

— Adhesh Josh

Quelle est la relation entre l'IC à 95% et l'hypothèse de test bilatéral avec alfa = 0,05? sont-ils les mêmes? Sinon alors comment?

— love-stats

love-stats, lorsqu'ils sont utilisés de la même façon, ils sont les mêmes.

— John

Adhesh Josh, l'hypothèse nulle peut être n'importe quelle valeur fixe spécifiée au préalable. C'est une autre caractéristique de l'IC sur NHST simple. Il est très facile à utiliser lorsque vous souhaitez tester une valeur hypothétique autre que 0.

— John

$x_1, x_2, \ldots, x_n$ $\mu$ $\mathcal N(\mu,1)$ $\mu = m$ $H_0: \mu = m$ $0.05.$ $v = (x_1 + x_2 + \cdots + x_n ) / n$ $A(m)$ $v$ $A(m)$ $v$ $\mu=m$ $\mathcal N(m,1)$ $\mu$ $m$ $v$ $A(m)$ $m$ $v$ $0$ $\mu = 0$

$v$ $\mu$ $m$ $\mu=m$ $0.05.$ $m$ $\mu=m$ $0.02$ $1-0.98$

— DavidR
source

Veuillez lire ceci car la valeur p ne peut pas être interprétée comme le plus petit niveau de test pour rejeter null. "Il a déjà été démontré que l'interprétation des valeurs de p dans des expériences uniques (ou en cours) n'est pas autorisée dans un contexte de test d'hypothèse Neyman – Pearson. Le calcul de la valeur p dépend uniquement de la vérité de l'hypothèse nulle. La valeur p ne mesure pas la quantité de preuves à l'appui de HA; c'est une mesure de preuves inductives contre H0. " 'Source: ftp.stat.duke.edu/WorkingPapers/03-26.pdf

— sree22

@ sree22 pouvez-vous développer cela ou suggérer une reformulation? J'essayais de donner une définition de la valeur de p dans ce contexte, pas une interprétation.

— DavidR

«Student» a plaidé en faveur d'intervalles de confiance au motif qu'ils pouvaient montrer quels effets étaient plus importants et quels étaient les plus significatifs.

Par exemple, si vous avez trouvé deux effets où le premier avait un intervalle de confiance pour son impact financier de 5 £ à 6 £, tandis que le second avait un intervalle de confiance de 200 £ à 2800 £. Le premier est plus statistiquement significatif mais le second est probablement plus important.

— Henri
source