Je lis The Book of Why de Judea Pearl, et cela me passe à la peau 1 . Plus précisément, il me semble qu’il dénigre inconditionnellement les statistiques "classiques" en invoquant un argument de paille selon lequel les statistiques ne sont jamais, jamais en mesure d’enquêter sur les relations de cause à effet, qu’elles ne s’intéressent jamais aux relations de cause à effet et que les statistiques sont devenues un modèle. entreprise de réduction des données en aveugle ". La statistique devient un vilain mot dans son livre.
Par exemple:
Les statisticiens ont été extrêmement confus quant aux variables qui devraient et ne devraient pas être contrôlées. La pratique par défaut a donc été de contrôler tout ce que l'on peut mesurer. [...] C'est une procédure simple et pratique à suivre, mais elle est à la fois une source de gaspillage et d'erreur. Une des principales réalisations de la révolution causale a été de mettre fin à cette confusion.
Dans le même temps, les statisticiens sous-estiment fortement le contrôle au sens où ils répugnent à parler de causalité [...]
Cependant, les modèles causaux ont été dans les statistiques comme, pour toujours. Je veux dire, un modèle de régression peut être utilisé essentiellement un modèle causal, puisque nous supposons essentiellement qu'une variable est la cause et une autre est l'effet (la corrélation est donc une approche différente de la modélisation par régression) et nous testons si cette relation causale explique les modèles observés. .
Une autre citation:
Rien d’étonnant à ce que les statisticiens en particulier aient trouvé difficile de comprendre ce problème [Le problème de Monty Hall]. Comme le dit RA Fisher (1922), ils sont habitués à "la réduction des données" et à l'ignorance du processus de génération de données.
Cela me rappelle la réponse écrite par Andrew Gelman au célèbre dessin animé xkcd sur Bayésiens et fréquentistes: "Néanmoins, je pense que le dessin animé dans son ensemble est injuste dans la mesure où il compare un bayésien sensé à un statisticien fréquentiste qui suit aveuglément les conseils de manuels superficiels. . "
Le nombre de fausses déclarations de s-word qui, selon ce que je perçois, existe dans le livre de Judea Pearls, m'a amené à me demander si l'inférence causale (que je percevais jusqu'à présent comme un moyen utile et intéressant d'organiser et de tester une hypothèse scientifique 2 ) est sujette à caution.
Questions: pensez-vous que Judea Pearl déforme les statistiques, et si oui, pourquoi? Juste pour faire en sorte que l'inférence causale sonne plus grande qu'elle ne l'est? Pensez-vous que l'inférence causale est une révolution avec un grand R qui change vraiment toutes nos pensées?
Modifier:
Les questions ci-dessus sont mon problème principal, mais comme elles sont, il est vrai, d'avis, veuillez répondre à ces questions concrètes (1) quel est le sens de la "révolution de causalité"? (2) En quoi est-ce différent des statistiques "orthodoxes"?
1. Aussi parce qu'il est comme un gars modeste.
2. Je veux dire dans le sens scientifique, pas statistique.
EDIT : Andrew Gelman a écrit ce post sur le livre de Judea Pearls et je pense qu’il a fait un bien meilleur travail que moi pour expliquer mes problèmes avec ce livre. Voici deux citations:
À la page 66 du livre, Pearl et Mackenzie écrivent que les statistiques «sont devenues une entreprise de réduction de données sans modèle». Hey! De quoi parlez-vous ?? Je suis statisticien, je fais des statistiques depuis 30 ans, travaillant dans des domaines allant de la politique à la toxicologie. «Réduction des données modèle-aveugle»? C'est juste des conneries. Nous utilisons des modèles tout le temps.
Et un autre:
Regardez. Je connais le dilemme du pluraliste. D'une part, Pearl estime que ses méthodes sont meilleures que tout ce qui a précédé. Bien. Pour lui et pour beaucoup d'autres, ce sont les meilleurs outils pour étudier l'inférence causale. Dans le même temps, en tant que pluraliste ou étudiant en histoire scientifique, nous réalisons qu’il existe de nombreuses façons de préparer un gâteau. Il est difficile de faire preuve de respect envers des approches que vous ne travaillez pas vraiment pour vous, et à un moment donné, la seule façon de le faire est de prendre du recul et de réaliser que de vraies personnes utilisent ces méthodes pour résoudre de vrais problèmes. Par exemple, je pense que prendre des décisions en utilisant les valeurs-p est une idée terrible et logiquement incohérente qui a conduit à de nombreuses catastrophes scientifiques; dans le même temps, de nombreux scientifiques parviennent à utiliser les valeurs p comme outils d'apprentissage. Je le reconnais. De même, Je recommanderais à Pearl de reconnaître que l’appareil de statistiques, la modélisation par régression hiérarchique, les interactions, la poststratification, l’apprentissage automatique, etc., résolvent de vrais problèmes d’inférence causale. Nos méthodes, comme celle de Pearl, peuvent aussi nous gâcher - GIGO! - et peut-être que Pearl a raison de dire que nous ferions tous mieux de passer à son approche. Mais je ne pense pas que cela l’aide quand il donne des déclarations inexactes sur ce que nous faisons.