Le contexte
Un groupe de sociologues et de statisticiens ( Benjamin et al., 2017 ) ont récemment suggéré que le taux de faux positifs typique ( = .05) utilisé comme seuil pour déterminer la «signification statistique» devait être ajusté à un seuil plus conservateur. ( = .005). Un groupe concurrent de spécialistes des sciences sociales et de statisticiens ( Lakens et al., 2018 ) a répondu, arguant contre l'utilisation de ce seuil - ou de tout autre - choisi arbitrairement. Ce qui suit est une citation de Lakens et al. (p. 16) qui aide à illustrer le sujet de ma question:α
Idéalement, le niveau alpha est déterminé en comparant les coûts et les avantages à une fonction d'utilité à l'aide de la théorie de la décision. Cette analyse coûts-avantages (et donc le niveau alpha) diffère lors de l'analyse de grands ensembles de données existants par rapport à la collecte de données à partir d'échantillons difficiles à obtenir. La science est diverse et il appartient aux scientifiques de justifier le niveau alpha qu'ils décident d'utiliser. ... La recherche doit être guidée par des principes de science rigoureuse, et non par des heuristiques et des seuils de couverture arbitraires.
Question
Je me demande comment on pourrait s'y prendre pour justifier un alpha choisi d'une manière «guidée par des principes de science rigoureuse», comme Lakens et al. suggérer, dans la plupart des contextes de sciences sociales (c'est-à-dire en dehors de certains cas où l'on a une qualité plus concrète, comme le profit, à optimiser)?
Après la diffusion de Lakens et al., J'ai commencé à voir des calculateurs en ligne circuler pour aider les chercheurs à prendre cette décision. Lors de leur utilisation, les chercheurs doivent spécifier un "rapport de coût" des erreurs faussement positives et fausses négatives. Cependant, comme le suggère cette calculatrice ici , la détermination d'un tel rapport de coûts peut impliquer beaucoup de conjectures quantitatives:
Alors que certains coûts d'erreur sont faciles à quantifier en termes monétaires (coûts directs), d'autres sont difficiles à chiffrer (coûts indirects). ... Bien qu'il soit difficile de quantifier, vous devez vous efforcer de leur attribuer un chiffre.
Par exemple, bien que Lakens et al. suggèrent d'étudier des échantillons difficiles à atteindre comme facteur que l'on pourrait envisager pour justifier l'alpha, il semble qu'on reste à deviner à quel point cet échantillon est difficile à atteindre, et donc, comment ajuster la sélection de l'alpha en conséquence. Comme autre exemple, il me semble difficile de quantifier le coût de publication d'un faux positif, en termes de temps / argent que d'autres s'engageraient par la suite à poursuivre des recherches fondées sur une inférence erronée.
Si la détermination de ce rapport de coûts est en grande partie une question de supposition subjective, je me demande si ces décisions peuvent (encore une fois, en dehors de l'optimisation de quelque chose comme le profit) être "justifiées". Autrement dit, d'une manière qui existe en dehors des hypothèses formulées sur l'échantillonnage, les compromis, l'impact, etc.,? De cette façon, la détermination d'un rapport de coût des erreurs faussement positives / fausses négatives me semble être quelque chose qui s'apparente à la sélection d'un a priori dans l'inférence bayésienne - une décision qui peut être quelque peu subjective, influencer les résultats et donc être débattue - -mais je ne suis pas sûr que ce soit une comparaison raisonnable.
Sommaire
Pour concrétiser ma demande:
- Les taux de faux positifs / faux négatifs et leurs ratios de coûts peuvent-ils jamais être "rigoureusement" justifiés dans la plupart des contextes de sciences sociales?
- Si oui, quels sont les principes généralisables que l'on pourrait suivre pour justifier ces choix analytiques (et peut-être un exemple ou deux d'entre eux en action)
- Sinon, mon analogie avec la subjectivité potentielle dans le choix des ratios de coûts - comme s'apparentant à la sélection préalable bayésienne - est-elle raisonnable?
Les références
Benjamin, DJ, Berger, J., Johannesson, M., Nosek, BA, Wagenmakers, E., ... Johnson, V. (2017, 22 juillet). Redéfinir la signification statistique. Récupéré de psyarxiv.com/mky9j
Lakens, D., Adolfi, FG, Albers, CJ, Anvari, F., Apps, MA, ... Zwaan, RA (2018, 15 janvier). Justifiez votre Alpha. Récupéré de psyarxiv.com/9s3y6