J'ai lu des informations sur les valeurs de , les taux d'erreur de type 1, les niveaux de signification, les calculs de puissance, la taille des effets et le débat Fisher vs Neyman-Pearson. Cela m'a laissé un peu dépassé. Je m'excuse pour le mur de texte, mais j'ai estimé qu'il était nécessaire de donner un aperçu de ma compréhension actuelle de ces concepts, avant de passer à mes vraies questions.
D'après ce que j'ai rassemblé, une valeur est simplement une mesure de surprise, la probabilité d'obtenir un résultat au moins aussi extrême, étant donné que l'hypothèse nulle est vraie. À l'origine, Fisher voulait que ce soit une mesure continue.
Dans le cadre Neyman-Pearson, vous sélectionnez un niveau de signification à l'avance et l'utilisez comme point de coupure (arbitraire). Le niveau de signification est égal au taux d'erreur de type 1. Elle est définie par la fréquence à long terme, c'est-à-dire que si vous répétiez une expérience 1000 fois et que l'hypothèse nulle est vraie, environ 50 de ces expériences entraîneraient un effet significatif , en raison de la variabilité d'échantillonnage. En choisissant un niveau de signification, nous nous prémunissons contre ces faux positifs avec une certaine probabilité. valeurs n'apparaissent traditionnellement pas dans ce cadre.
Si nous trouvons une valeur de 0,01, cela ne signifie pas que le taux d'erreur de type 1 est de 0,01, l'erreur de type 1 est indiquée a priori. Je pense que c'est l'un des principaux arguments du débat Fisher vs NP, car les valeurs de sont souvent rapportées à 0,05 *, 0,01 **, 0,001 ***. Cela pourrait induire les gens en erreur en leur disant que l'effet est significatif à une certaine valeur , au lieu d'une certaine valeur de signification.
Je me rends également compte que la valeur est fonction de la taille de l'échantillon. Par conséquent, il ne peut pas être utilisé comme mesure absolue. Une petite valeur pourrait indiquer un petit effet non pertinent dans une expérience sur un grand échantillon. Pour contrer cela, il est important d'effectuer un calcul de la puissance / effet lors de la détermination de la taille de l'échantillon pour votre expérience. valeurs nous indiquent s'il y a un effet, et non sa taille. Voir Sullivan 2012 .
Ma question: comment puis-je concilier le fait que la valeur est une mesure de surprise (plus petite = plus convaincante) alors qu'en même temps, elle ne peut pas être considérée comme une mesure absolue?
Ce qui me déroute, c'est la suivante: peut-on être plus confiant dans une petite valeur que dans une grande? Dans le sens pêcheur, je dirais que oui, nous sommes plus surpris. Dans le cadre NP, le choix d'un niveau de signification plus petit impliquerait que nous nous protégeons plus fortement contre les faux positifs.
Mais d'un autre côté, les valeurs dépendent de la taille de l'échantillon. Ce n'est pas une mesure absolue. Ainsi, nous ne pouvons pas simplement dire que 0,001593 est plus significatif que 0,0439. C'est pourtant ce qu'impliquerait le cadre de Fisher: nous serions plus surpris d'une telle valeur extrême. Il y a même une discussion au sujet du terme hautement significatif étant un terme impropre: est-ce mal de se référer aux résultats comme étant "très importants"?
J'ai entendu dire que les valeurs de dans certains domaines de la science ne sont considérées comme importantes que lorsqu'elles sont inférieures à 0,0001, tandis que dans d'autres domaines, les valeurs autour de 0,01 sont déjà considérées comme hautement significatives.
Questions connexes: