Imaginez qu'un chercheur explore un ensemble de données et exécute 1000 régressions différentes et qu'il trouve entre elles une relation intéressante.
Imaginez maintenant qu'un autre chercheur avec les mêmes données exécute une seule régression, et il s'avère que c'est le même que l'autre chercheur a pris 1000 régressions pour trouver. Le chercheur 2 ne connaît pas le chercheur 1.
Le chercheur 1 devrait-il faire des déductions différentes de celles du chercheur 2? Pourquoi? Par exemple, le chercheur 1 devrait-il effectuer plusieurs corrections de comparaisons, mais pas le chercheur 2?
Si le chercheur 2 vous montrait d'abord sa régression unique, quelles inférences feriez-vous? Si après que ce chercheur 1 vous a montré ses résultats, devriez-vous changer votre déduction? Si oui, pourquoi est-ce important?
PS 1 : Si parler d'hypothétiques chercheurs rend le problème abstrait, pensez-y: imaginez que vous n'avez effectué qu'une seule régression pour votre article, en utilisant la meilleure méthode disponible. Ensuite, un autre chercheur a exploré 1000 régressions différentes avec les mêmes données, jusqu'à ce qu'il trouve exactement la même régression que vous avez exécutée . Devriez-vous faire deux déductions différentes? Les preuves sont-elles les mêmes pour les deux cas ou non? Devriez-vous modifier votre inférence si vous connaissiez les résultats des autres chercheurs? Comment le public devrait-il évaluer les preuves des deux études?
PS 2: veuillez essayer d'être précis et de fournir une justification mathématique / théorique, si possible!