En fait, les valeurs p sont désormais enfin «démodées»: http://www.nature.com/news/psychology-journal-bans-p-values-1.17001 . Null tests de signification des hypothèses (NHST) produit un peu plus d'une description de votre taille de l' échantillon. (*) Toute intervention expérimentale aura un certain effet, ce qui est de dire que l'hypothèse simple nulle de « aucun effet » est toujours faux au sens strict . Par conséquent, un test «non significatif» signifie simplement que la taille de votre échantillon n'était pas assez grande; un test «significatif» signifie que vous avez collecté suffisamment de données pour «trouver» quelque chose.
La «taille d'effet» représente une tentative pour y remédier, en introduisant une mesure à l'échelle naturelle du problème. En médecine, où les traitements ont toujours un certain effet (même s'il s'agit d'un effet placebo), la notion d '«effet cliniquement significatif» est introduite pour se prémunir contre la probabilité préalable de 50% qu'un «traitement» se révèle avoir «a ( statistiquement) effet positif significatif »(bien que minuscule) dans une étude arbitrairement grande.
Si je comprends la nature de votre travail, clarinettiste, alors à la fin de la journée, son objectif légitime est d'informer les actions / interventions qui améliorent l'éducation dans les écoles de votre ressort. Ainsi, votre cadre est une décision-théorique , et les méthodes bayésiennes sont l' approche la plus appropriée (et uniquement cohérente [1] ).
En effet, la meilleure façon de comprendre les méthodes fréquentistes est approximations des méthodes bayésiennes . La taille estimée de l'effet peut être comprise comme visant une mesure de centralité pour la distribution postérieure bayésienne , tandis que la valeur p peut être comprise comme visant à mesurer une queue de cette position postérieure. Ainsi, ensemble, ces deux quantités contiennent une idée approximative de la partie postérieure bayésienne qui constitue l'apport naturel à une perspective théorique de décision sur votre problème. (Alternativement, un intervalle de confiance fréquentiste sur la taille de l'effet peut également être compris comme un intervalle crédible en attente .)
Dans les domaines de la psychologie et de l'éducation, les méthodes bayésiennes sont en fait assez populaires. Une des raisons à cela est qu'il est facile d'installer des «constructions» dans les modèles bayésiens, en tant que variables latentes. Vous aimerez peut-être consulter «le livre des chiots» de John K. Kruschke , un psychologue. Dans l'enseignement (où vous avez des élèves nichés dans des salles de classe, nichés dans des écoles, nichés dans des quartiers, ...), la modélisation hiérarchique est incontournable. Et les modèles bayésiens sont également parfaits pour la modélisation hiérarchique. Sur ce compte, vous voudrez peut-être consulter Gelman & Hill [2].
[1]: Robert, Christian P. The Bayesian Choice: From Decision-Theoretic Foundations to Computational Implementation. 2e éd. Textes Springer en statistiques. New York: Springer, 2007.
[2]: Gelman, Andrew et Jennifer Hill. Analyse des données à l'aide de modèles de régression et multiniveaux / hiérarchiques. Méthodes analytiques pour la recherche sociale. Cambridge; New York: Cambridge University Press, 2007.
Pour en savoir plus sur la «cohérence» d'un ne vous bat pas nécessairement la tête avec une brique bayésienne , voir [3].
[3]: Robins, James et Larry Wasserman. «Conditionnement, vraisemblance et cohérence: une revue de certains concepts fondamentaux». Journal de l'American Statistical Association 95, no. 452 (1er décembre 2000): 1340–46. doi: 10.1080 / 01621459.2000.10474344.
(*) Dans [4], Meehl fouette NHST de façon beaucoup plus élégante, mais non moins abrasive, que moi:
Étant donné que l'hypothèse nulle est presque toujours fausse, les tableaux résumant la recherche en termes de modèles de «différences significatives» ne sont guère plus que des résultats complexes, causalement ininterprétables, des fonctions de puissance statistique.
[4]: Meehl, Paul E. «Risques théoriques et astérisques tabulaires: Sir Karl, Sir Ronald et le lent progrès de la psychologie douce». Journal of Consulting and Clinical Psychiatry 46 (1978): 806–34. http://www3.nd.edu/~ghaeffel/Meehl(1978).pdf
Et voici une citation connexe de Tukey: /stats//a/728/41404