Un peu d'une question étrange. Dans ma classe de biostatistique de quatrième année aujourd'hui, nous discutions quand et quand ne pas utiliser la correction de tests multiples, et le professeur a fait un commentaire désinvolte. Il a demandé pourquoi nous ne corrigeons pas tous les tests que nous avons faits depuis que nous avons commencé à faire des statistiques, car ils sont tous (pour la plupart) indépendants et chaque fois que nous observons un résultat, nous augmentons notre probabilité de tirer un faux positif. Il a ri après, mais pourquoi ne faisons-nous pas cela? Je ne dis pas que nous devrions le faire, car c'est évidemment ridicule, mais jusqu'où est-il trop loin pour corriger les tests?
Nous supposerons alpha = 0,05 pour plus de simplicité, et disons que chaque test A, B et C ne sont soumis à aucune sorte de dépendance et donc indépendants. Si je m'assois et teste A, B et C, que ce soit des tests T ou autre chose, je dois évidemment ajuster pour plusieurs corrections parce que je prends 0,95 à la puissance de trois, et mes chances d'obtenir une fusée ciel faussement positive. Cependant, si je fais A, B et C à des jours différents, dans le contexte de procédures différentes, et que j'en tire des résultats différents, en quoi est-ce différent de la situation précédente? Nous observons toujours les trois tests, ils sont toujours indépendants.
Ce que j'essaie de comprendre, c'est la limite logique où nous disons d' arrêter de faire plusieurs tests de correction. Devrions-nous le faire uniquement pour une famille de tests, ou devrions-nous le faire pour un document entier, ou devrions-nous le faire pour chaque test que nous avons jamais exécuté? Je comprends comment utiliser la correction de tests multiples et utiliser FDR / Bonferonni au travail tout le temps. Ce concept m'a juste pris la tête en rond.
Merci pour votre temps.
Edit: Il y a une discussion approfondie de cette question dans une question plus récente .