Après tout, si un article a pris des années à écrire et a été soumis à un examen par les pairs, alors les statistiques seront-elles sûrement solides?
Mon expérience de la lecture d'articles qui tentent d'appliquer des statistiques dans une grande variété de domaines (sciences politiques, économie, psychologie, médecine, biologie, finance, science actuarielle, comptabilité, optique, astronomie et bien d'autres) est que la qualité des L'analyse statistique peut se situer n'importe où dans le spectre, de l'excellent travail bien fait au non-sens flagrant. J'ai vu une bonne analyse dans chacun des domaines que j'ai mentionnés et une analyse assez mal faite dans la quasi-totalité d'entre eux.
Certains journaux sont généralement assez bons, et certains peuvent ressembler davantage à jouer aux fléchettes avec un bandeau sur les yeux - la plupart d’entre eux ne sont peut-être pas trop éloignés de la cible, mais il y en aura quelques-uns dans le mur, le sol et le plafond. Et peut-être le chat.
Je n'ai pas l'intention de nommer les coupables, mais je dirai que j'ai vu des carrières académiques reposant sur une utilisation erronée des statistiques (c'est-à-dire où les mêmes erreurs et incompréhensions ont été répétées, papier après papier, pendant plus de dix ans).
Donc mon conseil est laisser le lecteur se méfier ; ne croyez pas que les éditeurs et les réviseurs savent ce qu'ils font. Avec le temps, vous aurez peut-être une bonne idée des auteurs sur lesquels on peut généralement compter pour ne rien faire de trop choquant, et de ceux qui doivent être traités avec une prudence particulière. Vous pouvez avoir l’impression que certaines statistiques ont des normes très élevées.
Mais même un auteur généralement bon peut faire une erreur, ou bien les arbitres et les éditeurs peuvent ne pas détecter les erreurs qu'ils pourraient normalement trouver; un bon journal peut publier un hurleur.
[Parfois, vous verrez même de très mauvais journaux gagner des prix ou des récompenses ... ce qui ne dit pas grand chose pour la qualité des personnes qui jugent le prix, non plus.]
Je ne voudrais pas deviner ce que la fraction de "mauvaises" statistiques que j'aurais pu voir (sous différentes formes et à chaque étape de la définition de la question, de la conception de l'étude, de la collecte de données, de la gestion de données, etc. analyse et conclusions), mais ce n’est pas assez petit pour que je me sente à l’aise.
Je pourrais citer des exemples, mais je ne pense pas que ce soit le bon forum pour le faire. (Ce serait bien s'il y avait un bon forum pour cela, en fait, mais encore une fois, il deviendrait probablement très politisé très rapidement et ne servirait bientôt plus son but.)
J'ai passé un peu de temps à parcourir PLOS ONE ... et encore une fois, je ne vais pas pointer du doigt des documents spécifiques. Certaines choses que j'ai remarquées: il semblerait qu'une grande partie des articles contiennent des statistiques, probablement plus de la moitié comportant des tests d'hypothèses. Les principaux dangers semblent être de nombreux tests, avec un élevé comme 0,05 sur chacun (ce qui n’est pas automatiquement un problème, du moment que nous comprenons que de très petits effets pourraient se révéler significatifs par hasard), ou incroyablement bas. niveau de signification individuel, ce qui aura tendance à donner une faible puissance. J'ai aussi vu un certain nombre de cas où environ une demi-douzaine de tests différentsα ont apparemment été appliquées pour résoudre exactement la même question. Cela me semble une idée généralement mauvaise. Globalement, la norme était plutôt bonne sur quelques dizaines de journaux, mais j’ai vu un journal absolument terrible.
[Je pourrais peut-être citer un seul exemple, indirectement. Cette question demande de savoir si quelqu'un fait quelque chose de douteux. C'est loin d'être la pire chose que j'ai vue.]
D'autre part, je vois aussi (encore plus souvent) des cas dans lesquels des personnes sont obligées de franchir toutes sortes d'obstacles inutiles pour que leur analyse soit acceptée. les choses parfaitement raisonnables à faire ne sont pas acceptées car il existe une "bonne" façon de faire les choses, selon un critique, un éditeur ou un superviseur, ou simplement dans la culture tacite d'un domaine particulier.