En février 2016, l'American Statistical Association a publié une déclaration officielle sur la signification statistique et les valeurs p. Notre fil à ce sujet traite de ces questions en détail. Cependant, aucune autorité n’a été proposée pour offrir une alternative efficace universellement reconnue - jusqu’à présent. L'American Statistical Society (ASS) a publié sa réponse, les valeurs-p: et ensuite?
"La valeur p n'est pas bonne pour beaucoup."
Nous pensons que l'ASA n'est pas allé assez loin. Il est temps d'admettre que l'ère des valeurs prédictives est terminée. Les statisticiens les ont utilisées avec succès pour brouiller les étudiants de premier cycle, tromper les scientifiques et berner les rédacteurs en chef, mais le monde commence à voir au travers de cette ruse. Nous devons abandonner cette tentative des statisticiens du début du 20ème siècle de contrôler la prise de décision. Nous devons revenir à ce qui fonctionne réellement.
La proposition officielle d'ASS est la suivante:
Au lieu de valeurs-p, l’ASS préconise la procédure STOP (procédure SeaT-of-Pants). Cette méthode reconnue et éprouvée a été utilisée par les Grecs anciens, les hommes de la Renaissance et tous les scientifiques jusqu'à ce que Ronald Fisher arrive et ruine des choses. Le STOP est simple, direct, basé sur les données et faisant autorité. Pour le mener à bien, une figure d'autorité (un homme plus âgé, de préférence) examine les données et décide si elles sont d'accord avec son opinion. Quand il en décide ainsi, le résultat est «significatif». Autrement, ce n'est pas le cas et tout le monde est obligé d'oublier tout.
Des principes
La réponse aborde chacun des six principes de l'ASA.
Le STOP peut indiquer dans quelle mesure les données sont incompatibles avec un modèle statistique spécifié.
Nous aimons cette phrase parce que c’est une façon très élégante de dire que STOP répondra à toute question par oui ou par non. Contrairement aux valeurs p ou à d'autres procédures statistiques, cela ne laisse aucun doute. C'est la réponse parfaite à ceux qui disent: «Nous n'avons pas besoin d'hypothèse nulle puante! Qu'est-ce que le *?! @ Est-ce, en tout cas? Personne n'a jamais pu comprendre ce que c'était supposé être.
Le STOP ne mesure pas la probabilité qu'une hypothèse soit vraie: il décide en fait si c'est vrai ou non.
Tout le monde est confus par les probabilités. En supprimant les probabilités, le système STOP élimine le besoin d'années d'études de premier cycle et de cycles supérieurs. Désormais, toute personne (suffisamment âgée et de sexe masculin) peut effectuer une analyse statistique sans la peine et la torture d'écouter même un seul exposé statistique ou d'utiliser un logiciel obscur qui génère des résultats inintelligibles.
Les conclusions scientifiques et les décisions commerciales ou politiques peuvent être fondées sur le bon sens et sur de véritables personnalités.
Quoi qu'il en soit, les autorités ont toujours pris d'importantes décisions. Admettons-le simplement et coupons les intermédiaires. En utilisant STOP, les statisticiens seront libres de faire ce qui leur convient le mieux: utiliser des chiffres pour dissimuler la vérité et sanctifier les préférences de ceux qui sont au pouvoir.
Une inférence correcte exige un rapport complet et une transparence.
STOP est la procédure statistique la plus transparente et la plus évidente jamais inventée: vous regardez les données et vous décidez. Il élimine tous les tests z, tests t, tests chi-deux et procédures de soupe à l'alphabet (ANOVA! GLM! MLE!) Déroutants utilisés par les gens pour cacher le fait qu'ils n'ont aucune idée de la signification des données.
Le STOP mesure l’importance du résultat.
Cela va de soi: si une personne en position d'autorité utilise le STOP, le résultat doit être important.
En soi, le STOP fournit une bonne mesure des preuves concernant un modèle ou une hypothèse.
Nous ne voudrions pas contester une autorité, n'est-ce pas? Les chercheurs et les décideurs reconnaîtront que le STOP fournit toutes les informations dont ils ont besoin. Pour ces raisons, l’analyse de données peut se terminer par le STOP; il n'y a pas besoin d'approches alternatives, telles que les valeurs p, l'apprentissage automatique ou l'astrologie.
Autres approches
Certains statisticiens préfèrent les méthodes dites «bayésiennes», dans lesquelles un théorème obscur publié à titre posthume par un clerc du XVIIIe siècle est appliqué sans réfléchir pour résoudre tous les problèmes. Ses défenseurs les plus notés admettent librement que ces méthodes sont «subjectives». Si nous utilisons des méthodes subjectives, il est évident que plus le décideur est autoritaire et compétent, meilleur sera le résultat. Le STOP apparaît ainsi comme la limite logique de toutes les méthodes Bayes. Pourquoi faire l'effort de faire ces calculs horribles et de perdre autant de temps sur l'ordinateur, alors que vous pouvez simplement montrer les données au responsable et lui demander quelle est son opinion? Fin de l'histoire.
Une autre communauté s'est récemment constituée pour contester le sacerdoce des statisticiens. Ils s’appellent eux-mêmes «apprenants de la machine» et «spécialistes des données», mais ce ne sont en réalité que des pirates informatiques à la recherche d’un statut supérieur. C’est la position officielle de l’ASS que ces gars-là doivent former leur propre organisation professionnelle s’ils veulent que les gens les prennent au sérieux.
La question
Est-ce la réponse aux problèmes identifiés par l'ASA avec les valeurs p et le test d'hypothèses nulles? Peut-il vraiment unir les paradigmes bayésien et frequentiste (comme le prétend implicitement la réponse)?