Je viens de lire dans un magazine scientifique (populaire) plutôt bien respecté (le PM allemand, 02/2013, p.36) sur une expérience intéressante (sans source, malheureusement). Cela a attiré mon attention parce que je doutais intuitivement de la signification du résultat, mais les informations fournies étaient suffisantes pour reproduire le test statistique.
Les chercheurs se sont demandé si le froid par temps froid augmentait les chances d'attraper un rhume. Ils ont donc divisé au hasard un groupe de 180 élèves en deux groupes. Un groupe a dû tenir ses pieds dans l'eau froide pendant 20 minutes. L'autre a gardé ses chaussures. Une sorte de manipulation amusante, je pense, mais d'un autre côté je ne suis pas médecin et peut-être que les médecins pensent drôle. Les questions éthiques mises à part.
Quoi qu'il en soit, après 5 jours, 13 des étudiants du groupe de traitement ont eu un rhume, mais seulement 5 du groupe qui ont gardé leurs chaussures. Le rapport de cotes de cette expérience est donc de 2,87.
Étant donné la taille plutôt petite de l'échantillon, j'ai commencé à me demander si cette différence pouvait être significative. J'ai donc effectué deux tests.
D'abord un simple test d'égalité des proportions en utilisant l'approximation normale. Ce test a avec p = 0,0468 . Je suppose que c'est ce que les chercheurs ont testé. C'est vraiment juste significatif. Cependant, ce test z n'est valable que dans de grands échantillons, si je ne me trompe pas, en raison de l'approximation normale. De plus, les taux de prévalence sont plutôt faibles et je me demande si cela ne peut pas affecter le taux de couverture de l'intervalle de confiance de l'effet.
Mon deuxième essai a donc été un test d'indépendance du chi carré, à la fois avec la simulation Monte-Carlo et le chi carré Pearson standard. Ici, je trouve des valeurs de propos de p = 0,082 .
Maintenant, ce n'est pas si rassurant sur les résultats. Je me suis demandé s'il y avait plus d'options pour tester ces données et ce que vous pensez des deux tests (en particulier les hypothèses du premier test significatif)