Quelles méthodes statistiques sont archaïques et devraient être omises des manuels? [fermé]

Dans l'état actuel des choses, cette question ne convient pas à notre format de questions / réponses. Nous nous attendons à ce que les réponses soient étayées par des faits, des références ou une expertise, mais cette question suscitera probablement un débat, des arguments, des sondages ou une discussion approfondie. Si vous pensez que cette question peut être améliorée et éventuellement rouverte, visitez le centre d'aide pour obtenir des conseils.

Fermé il y a 6 ans .

En répondant à une question sur un intervalle de confiance pour une proportion binomiale, j'ai souligné le fait que l'approximation normale est une méthode peu fiable et archaïque. Elle ne devrait pas être enseignée comme méthode, bien qu'il puisse y avoir un argument selon lequel elle devrait être incluse dans une leçon sur ce qui fait une méthode adéquate.

Quelles sont les autres approches statistiques «standard» qui ont dépassé leur date limite de consommation et qui devraient être omises des futures éditions de manuels (laissant ainsi la place à des idées utiles)?

references history

— Michael Lew
source

Larry Wasserman pose la question et propose quelques réponses dans son blog . Voir aussi les commentaires des utilisateurs.

— JohnRos

Pourquoi l'approximation normale est-elle mauvaise à enseigner?

— Douglas Zare

Je pensais que cette question pourrait apporter des réponses constructives mais, après avoir vu les réponses qui ont été publiées jusqu'à présent (y compris celles supprimées), j'en doute sérieusement, alors je vote pour clore.

— Macro

0

$0$

1

$1$

Je ne pense pas que ce soit un bon argument contre l'enseigner. Les gens utilisent ce qu'ils comprennent et se souviennent, et enseigner uniquement des formules avec une composition complexe signifie que les étudiants ne construiront pas autant leurs intuitions ou ne pourront pas faire des exemples simples à la main. Si les inconvénients sont importants, informez-vous d'eux et les gens peuvent se rappeler pourquoi des méthodes plus compliquées existent. Si vous n'enseignez pas l'approximation normale, comment pourriez-vous dire, "l'intervalle de Wilson est proche de l'approximation normale avec le lissage de Laplace avec k = 2?" Cela semble subjectif et argumentatif, donc je vote pour terminer.

— Douglas Zare

Ces trois se classeraient probablement quelque part dans une liste d'exercices déconseillés:

recherche de quantiles de la distribution normale / F / t dans un tableau.
Tests de normalité.
Tests d'égalité des variances avant de faire les deux échantillons t-tests ou anova.
Tests paramétriques univariés classiques (par exemple non robustes) et intervalles de confiance.

Les statistiques ont évolué à l'ère des ordinateurs et des grands ensembles de données multivariés. Je ne m'attends pas à ce que cela soit annulé. Par nécessité, les approches enseignées dans les cours plus avancés ont en quelque sorte été influencées par les critiques de Breiman et Tukey. L'OMI s'est définitivement orientée vers les approches qui nécessitent moins d'hypothèses pour être efficaces. Un cours d'introduction devrait refléter cela.

Je pense que certains éléments pourraient encore être enseignés dans une dernière étape aux étudiants intéressés par l'histoire des pensées statistiques.

— user603
source

Veuillez fournir des preuves à l'appui de votre réponse. Si ce fil de discussion se transforme en listes pures de choses que certains pensent être mauvaises, il devra être fermé.

— whuber

Je conviens que l'utilisation de tableaux statistiques est une technologie de calcul absolument obsolète. Les tests de normalité ont cependant leurs raisons.

— StasK

@StasK D'accord sur les tables (et les tests de normalité); mais comme nous semblons discuter de la pédagogie, dans la mesure où les «manuels» renvoient à des références pour soutenir l'enseignement, je pense qu'il est possible d'enseigner comment relier les quantiles aux zones sous des graphiques de PDF et tester cette compréhension en posant des questions nécessitant une manipulation (et donc estimation) de ces zones. Les recherches dans les tableaux restent un moyen pratique d'estimer les zones, en particulier dans les queues. Nous devons juste nous rappeler que la recherche (ou le calcul!) Est purement un calcul auxiliaire et n'est pas le but de l'exercice.

— whuber

Je suis d'accord sur les tableaux, et pas seulement parce qu'ils sont inutiles. Ils jouent également sur la notion qu'il y a quelque chose de spécial dans la valeur P associée aux valeurs critiques qu'ils spécifient. Cela tend à obscurcir l'utilisation des valeurs P comme indices de preuve.

— Michael Lew

Les tests de normalité peuvent être omis, mais ils devraient peut-être être complétés par des exercices qui montrent le peu de pouvoir dont ils disposent pour distinguer les distributions avec les petits échantillons pour lesquels la normalité importe réellement! Il serait peut-être préférable de faire des exercices qui montrent dans quelle mesure la non-normalité affecte les propriétés de divers tests et estimations d'intervalle.

— Michael Lew