Supposons que j'ai 20 souris. J'appaire les souris d'une manière ou d'une autre, de sorte que j'obtienne 10 paires. Aux fins de cette question, il pourrait s'agir d'un appariement aléatoire, OU il pourrait s'agir d'un appariement sensé, comme essayer d'associer des souris de la même portée, du même sexe, avec un poids similaire, OU il pourrait s'agir d'un appariement délibérément stupide comme en essayant de jumeler des souris avec des poids aussi inégaux que possible. J'utilise ensuite des nombres aléatoires pour affecter une souris de chaque paire au groupe témoin et l'autre souris au groupe à traiter. Je fais maintenant l'expérience, en ne traitant que les souris à traiter, mais en ne prêtant aucune attention aux dispositions qui viennent d'être prises.
Lorsque l'on vient analyser les résultats, on peut utiliser soit des tests t non appariés, soit des tests t appariés. En quoi, le cas échéant, les réponses différeront-elles? (Je m'intéresse essentiellement aux différences systématiques de tout paramètre statistique qui doit être estimé.)
La raison pour laquelle je pose cette question est qu'un article auquel j'ai participé récemment a été critiqué par un biologiste pour avoir utilisé un test t apparié plutôt qu'un test t non apparié. Bien sûr, dans l'expérience réelle, la situation n'était pas aussi extrême que la situation que j'ai esquissée, et il y avait, à mon avis, de bonnes raisons pour l'appariement. Mais le biologiste n'était pas d'accord.
Il me semble qu'il n'est pas possible d'améliorer incorrectement la signification statistique (diminution de la valeur de p), dans les circonstances que j'ai esquissées, en utilisant un test t apparié, plutôt qu'un test non apparié, même s'il est inapproprié de l'appairer. Cela pourrait cependant aggraver la signification statistique si les souris étaient mal appariées. Est-ce correct?