La chose la plus simple à faire serait probablement un test de signe. L'hypothèse nulle est que chaque résultat a une probabilité égale d'être positif ou négatif (comme lancer une pièce juste). Votre objectif est de déterminer si les résultats observés seraient suffisamment improbables dans cette hypothèse nulle pour que vous puissiez les rejeter.
Quelle est la probabilité d'obtenir 80 têtes ou plus sur 100 tours d'une pièce équitable? Vous pouvez calculer cela en utilisant la distribution binomiale. Dans R
, la fonction appropriée est appelée pbinom
et vous pouvez obtenir une valeur p (unilatérale) en utilisant la ligne de code suivante:
pbinom(80, size = 100, prob = 0.5, lower.tail = FALSE)
Selon ce test, votre intuition est correcte, vous auriez extrêmement peu de chances d'obtenir 80 résultats positifs par hasard si le traitement n'avait aucun effet.
Une option étroitement liée consisterait à utiliser quelque chose comme le test de classement signé par Wilcoxon .
Une meilleure approche, si vous voulez réellement estimer la taille de l'effet (plutôt que de simplement déterminer s'il a tendance à être supérieur à zéro ou non), serait probablement un modèle hiérarchique ("mixte").
Ici, le modèle indique que les résultats de vos 100 individus proviennent d'une distribution, et votre objectif est de voir où se situe la moyenne de cette distribution (ainsi que les intervalles de confiance).
Les modèles mixtes vous permettent d'en dire un peu plus sur la taille de vos effets: après avoir ajusté le modèle, vous pourriez dire quelque chose comme "nous estimons que notre traitement a tendance à améliorer les résultats en moyenne de trois unités, bien que les données soient cohérentes avec la vraie moyenne" la taille de l'effet étant comprise entre 1,5 et 4,5 unités. En outre, il existe certaines variations entre les individus, de sorte qu'une personne donnée peut voir un effet allant de -0,5 à +6,5 unités ".
C'est un ensemble d'énoncés très précis et utiles - bien mieux que juste "l'effet est probablement positif, en moyenne", c'est pourquoi cette approche a tendance à être favorisée par les statisticiens. Mais si vous n'avez pas besoin de tous ces détails, la première approche que j'ai mentionnée pourrait également convenir.