Taleb et le cygne noir


63

Le livre de Taleb "The Black Swan" était un best-seller du New York Times quand il est paru il y a plusieurs années. Le livre en est maintenant à sa deuxième édition. Après avoir rencontré des statisticiens lors d'une conférence statistique annuelle (JSM), Taleb a quelque peu atténué ses critiques à l'égard des statistiques. Mais l’idée maîtresse du livre est que les statistiques ne sont pas très utiles car elles reposent sur la distribution normale et sur de très rares événements: les "Cygnes noirs" n’ont pas de distributions normales.

Pensez-vous que ceci est une critique valable? Taleb manque-t-il certains aspects importants de la modélisation statistique? Peut-on prédire des événements rares au moins en ce sens que les probabilités d'occurrence peuvent être estimées?



2
De plus, IMO, je ne pense pas qu'une balise "cygnes noirs" soit très utile. Sorte de jargon à cet auteur particulier qui devrait être évité. Les événements rares me semblent suffisants, mais vous connaissez le jargon mieux que moi à coup sûr.
Andy W

1
@AndyW Alors que les cygnes noirs sont peut-être un terme inventé par Taleb, il est en train de devenir un terme couramment utilisé pour désigner les événements rares et peut donc avoir une portée plus large que celle du livre de Taleb.
Michael Chernick

2
Je n'ai pas nécessairement de problème avec la création d'une balise 'cygnes noirs' ou d'une balise 'événements rares', cependant, j'encourage fortement les gens à créer un extrait de wiki de balise, au minimum, lors de la création d'une nouvelle balise. Les futurs utilisateurs auront besoin de conseils concernant la signification et l’utilisation correcte de la balise. Il pourrait également être utile de créer les deux options et de faire immédiatement de bs un synonyme de re, afin d’éviter de rencontrer ce problème par accident à l’avenir.
gung - Rétablir Monica

2
À propos de @kjetilbhalvorsen J'ai lu le livre de Benoît Mandelbrot sur les finances et je ne pouvais pas oublier que pratiquement toutes les idées de The Black Swan sont là, bien mieux expliquées et sans se perdre. Cela a vraiment mis en lumière la "contribution" de Taleb.
Antoni Parellada

Réponses:


69

J'ai lu le cygne noir il y a quelques années. L'idée de Black Swan est bonne et l'attaque contre l'erreur ludique (voir les choses comme s'il s'agissait de jeux de dés, avec des probabilités connues) est bonne, mais les statistiques sont scandaleusement faussées, le problème central étant la fausse affirmation selon laquelle toutes les statistiques s'effondrent si des variables ne sont pas normalement distribués. Cet aspect m'a suffisamment ennuyé pour écrire à Taleb la lettre ci-dessous:

Cher Dr Taleb

J'ai récemment lu "Le Cygne Noir". Comme vous, je suis un fan de Karl Popper, et je suis tombé d’accord avec beaucoup de ce qu’il contient. Je pense que votre exposé de la fausseté ludique est fondamentalement valable et attire l’attention sur un problème réel et commun. Cependant, je pense qu’une grande partie de la partie III déprécie votre argumentation globale, au point de discréditer éventuellement le reste du livre. C'est une honte, car je pense que les arguments concernant les cygnes noirs et les "inconnus inconnus" reposent sur leurs mérites sans s'appuyer sur certaines des erreurs de la partie III.

La principale question sur laquelle je souhaite attirer votre attention - et sur votre réponse, en particulier si j’ai mal compris les problèmes - est votre représentation erronée du domaine des statistiques appliquées. À mon avis, les chapitres 14, 15 et 16 reposent en grande partie sur un argument de paille, sur une présentation erronée des statistiques et de l'économétrie. Le domaine de l'économétrie que vous décrivez n'est pas celui qui m'a été enseigné lorsque j'ai étudié la statistique appliquée, l'économétrie et la théorie du risque actuariel (à l'Australian National University, mais en utilisant des textes qui semblaient plutôt standard). Les questions que vous soulevez (telles que les limitations des distributions gaussiennes) sont bien comprises et enseignées, même au premier cycle.

Par exemple, vous allez trop loin pour montrer comment la distribution des revenus ne suit pas une distribution normale et présentez ceci comme un argument contre la pratique statistique en général. Aucun statisticien compétent ne prétendrait le faire et les moyens de traiter ce problème sont bien établis. En utilisant simplement des techniques du niveau de base "d'économétrie de première année", par exemple, transformer la variable en prenant son logarithme rendrait vos exemples numériques beaucoup moins convaincants. Une telle transformation invaliderait en réalité une grande partie de ce que vous dites, car la variance de la variable initiale augmente à mesure que sa moyenne augmente.

Je suis sûr que certains économétriciens incompétents font des régressions MLS, etc. avec une variable de réponse non transformée, comme vous le dites, mais cela les rend simplement incompétents et utilise des techniques bien établies pour être inappropriées. Ils auraient certainement échoué même dans les cours de premier cycle, qui passent beaucoup de temps à chercher des moyens plus appropriés de modéliser des variables telles que le revenu, reflétant la distribution réelle observée (non gaussienne).

La famille des modèles linéaires généralisés est un ensemble de techniques développées en partie pour résoudre les problèmes que vous soulevez. De nombreuses familles de distributions exponentielles (par exemple les distributions gamma, exponentielle et de Poisson) sont asymétriques et ont une variance qui augmente à mesure que le centre de la distribution augmente, ce qui contourne le problème que vous indiquez avec l'utilisation de la distribution gaussienne. Si cela reste trop limitatif, il est possible de supprimer une "forme" préexistante et de spécifier simplement une relation entre la moyenne d'une distribution et sa variance (par exemple, en permettant à la variance d'augmenter proportionnellement au carré de la moyenne), en utilisant la méthode d'estimation "quasi-vraisemblance".

Bien sûr, vous pourriez soutenir que cette forme de modélisation est encore trop simpliste et constitue un piège intellectuel qui nous incite à penser que l'avenir sera comme le passé. Vous avez peut-être raison, et je pense que la force de votre livre est de faire réfléchir les gens comme moi. Mais vous avez besoin d'arguments différents de ceux que vous utilisez aux chapitres 14 à 16. Le grand poids que vous accordez au fait que la variance de la distribution gaussienne soit constante quelle que soit sa moyenne (ce qui pose des problèmes d’évolutivité), par exemple, n’est pas valide. Vous insistez donc sur le fait que les distributions réelles ont tendance à être asymétriques plutôt que des courbes en cloche.

Fondamentalement, vous avez simplifié à l'extrême l'approche la plus élémentaire de la statistique (modélisation naïve de variables brutes ayant des distributions gaussiennes) et montré, de manière approfondie, (correctement) les inconvénients d'une telle approche trop simplifiée. Vous l'utiliserez ensuite pour faire le vide afin de discréditer tout le champ. C'est soit un grave manque de logique, soit une technique de propagande. C’est regrettable, car cela nuit à votre argumentation générale, que j’ai trouvée en grande partie (comme je l’ai dit) valide et convaincante.

Je serais intéressé d'entendre ce que vous dites en réponse. Je doute que je sois le premier à avoir soulevé cette question.

Cordialement

PE


24
Avez-vous reçu une réponse?
cardinal

4
Oui. Beaucoup de statisticiens ont déjà critiqué la distribution normale! Un exemple: le célèbre statisticien danois Georg Rasch (connu pour ses modèles en psychométrie!) Était connu pour dire, quand il avait trop bu, que "tous les livres mentionnant la distribution normale devraient être brûlés"!
kjetil b halvorsen

5
++ Peter. Une très bonne lettre !!
Michael Chernick

14
@ cardinal - J'ai reçu une réponse automatique à l'effet suivant: "Depuis la crise financière mondiale, j'ai reçu trop de courriels pour pouvoir répondre".
Peter Ellis

4
On dirait que la quantité de courriels en réaction au livre a été un BlackSwan eux-mêmes. :)
gwr

22

Je n'ai pas lu le livre, mais comme indiqué, la critique me semble assez déraisonnable. Si les événements extrêmes sont importants, les statistiques disposent d'outils appropriés, tels que la théorie des valeurs extrêmes, et un bon statisticien saura les utiliser (ou au moins découvrira comment les utiliser et sera suffisamment impliqué dans le but de: l'analyse à regarder). La critique semble être "les statistiques sont mauvaises parce qu'il y a de mauvais statisticiens qui ne connaissent que les distributions normales".


4
Peut-être lire le livre avant de le critiquer?
kjetil b halvorsen

7
@kjetilbhalvorsen Je ne critique pas le livre, je critique les critiques énoncées dans la question (qui peuvent ou non représenter le contenu du livre). Je l'ai dit très clairement dans le libellé de ma réponse (notez que je n'ai utilisé le mot "livre" qu'une seule fois, pour indiquer que je ne l'avais pas lu et que je n'ai pas du tout mentionné Taleb). Peut - être lire la réponse attentivement avant de le critiquer? ; o)
Dikran Marsupial

19

Dire que "l’essentiel du livre, c’est que les statistiques ne sont pas très utiles" est inexact, à mon avis. Après avoir lu le livre, ce qu’il semble dire, c’est que des problèmes comme la finance quantitative ou toute sorte de négoce de titres qui suppose une distribution normale sont fondamentalement défectueux (en fait, dans le livre, il appelle des personnes qui prétendent utiliser ces modèles pour faire des prédictions. , "charlatans"). Selon Taleb, si la distribution normale modélise les valeurs d'objets tangibles / physiques (taille, poids, durée de vie, etc.), des systèmes tels que les marchés sont souvent dictés par les émotions humaines et sont donc sujets à grandes fluctuations que les distributions normales ne peuvent pas prédire avec précision.

Je ne comprends pas bien les statistiques et, jusqu'à la lecture des réponses ici, je n'avais jamais entendu parler de choses comme la théorie des valeurs extrêmes. Quoi qu'il en soit, The Black Swan et Fooled By Randomness semblent avoir des prémisses similaires, ce qui est "une distribution normale pas toujours satisfaisante". Je ne me rappelle pas qu'il diffamait tout le domaine des statistiques.


16
(+1) Pour la première phrase. Cependant, Taleb est plus un polémiste (auto-absorbé) qu'un intellectuel sérieux. Je n'ai que la première édition de BS; son commentaire sur les statistiques est surestimé et mal informé dans de nombreux endroits, mais la thèse tentée du texte va au-delà de ce qui est cité dans la première phrase, comme vous le signalez.
cardinal

3
+1 Je pense que la clé est quand on parle de finance. Un lien dans le NY Times qui cite le premier chapitre, je crois: nytimes.com/2007/04/22/books/chapters/0422-1st-tale.html
Wayne, le

6
La tarification des options, par exemple, a commencé avec des hypothèses normales sur les rendements logarithmiques, mais sait que beaucoup de gens tiennent compte de la kurtose avec des modèles plus complexes de diffusion par saut / volatilité stochastique.
muratoa

4
+1 Bienvenue sur notre site! Merci beaucoup d'avoir partagé vos pensées.
whuber

4
Après avoir lu le livre et écrit ma propre critique (je pourrais avoir une critique de client Amazon sur ce livre avec des milliers d’autres), je pense que Taleb a pour thème principal la finance et le marché boursier, mais il en a une vision plus générale. -a appelé Black Swans et a une vision très mal informée de la statistique et de la profession de la statistique (du moins dans la première édition). Une mauvaise utilisation de la distribution normale peut constituer une critique valable de la manière dont certaines personnes peuvent modéliser des événements rares. Mais beaucoup d’entre nous le font de la bonne façon et il ya une certaine valeur dans les résultats de la bonne approche.
Michael Chernick

18

J'ai lu "Le Cygne Noir", ça m'a plu et je suis un statisticien. Je n'ai pas du tout trouvé sa "critique des statistiques" insupportable. Point par point:

  1. Taleb n'a pas inventé le concept du cygne noir. C’était depuis longtemps un exemple privilégié de la pensée philosophique!
  2. Taleb ne critique pas tant les "statistiques" que certaines (mauvaises) applications.
  3. Le livre était un best-seller. Cela ne visait pas les statisticiens, mais le grand public. Il a très bien enseigné au public ce que les statisticiens savaient très bien, mais beaucoup d’autres lecteurs (la majorité!) Ne le savaient pas. Nous pourrions donc apprendre beaucoup de ce livre sur la façon de "vendre" des statistiques.
  4. Le plus important (pour moi), Taleb a inclus beaucoup de références à la philosophie sceptique grecque antique. Personne d'autre n'a mentionné ce point ici, mais je pense que l'inclusion était le véritable argument de vente du livre!
  5. Le livre est un travail littéraire, pas un travail technique. Si vous souhaitez critiquer Taleb pour son travail technique, rendez-vous sur sa page d'accueil et téléchargez certains de ses documents techniques.

Pour ceux qui n'aiment pas cette réponse, ou qui n'aiment pas le livre, vous pouvez jeter un coup d'œil aux arguments techniques de Taleb dans le nouveau https://fernandonogueiracosta.files.wordpress.com/2014/07/taleb-nassim-silent-risk. pdf "Silent Risk", qui est technique.


6
Un grand +1 pour être le premier (oups - deuxième) répondant réellement qualifié pour parler du livre! (Et pour avoir dit des choses intéressantes à ce sujet aussi.)
whuber

4
qu'en est-il de sa représentation de l'économétrie et de la statistique selon les distributions gaussiennes?
Peter Ellis

2
@kjetilbhalvorsen Vous dites que vous avez lu le livre. Si vous le lisez attentivement, il est impossible de manquer l'attachement au métier de statistique. Avoir un diplôme en mathématiques ne signifie rien en ce qui concerne la connaissance des statistiques par une personne. Beaucoup de mathématiciens ont eu leur diplôme sans suivre un seul cours de statistiques. D'autres peuvent n'avoir suivi qu'un seul cours très élémentaire. J'ai rencontré des mathématiciens qui ont enseigné les statistiques et / ou les probabilités et qui n'étaient pas vraiment qualifiés pour le faire.
Michael Chernick

3
Michael Chernik: Peut-être, mais je continue à critiquer une œuvre par ses points forts, du moins pas seulement par ses points faibles! et une œuvre littéraire doit être lue comme telle. Taleb devrait être félicité pour avoir fait de Black Swans un concept que beaucoup de gens comprennent. C'est un concept important. Tous les journalistes ridiculisant Rumsfeldt pour avoir parlé d '"inconnus inconnus" le prouvent. Rumsfeldt n'utilisait qu'un concept qu'il avait appris des officiers militaires! Au moins, ils connaissaient Black Swans.
kjetil b halvorsen

9
"Une œuvre littéraire" n'est qu'une excuse pour déformer la réalité si ce que Taleb a écrit était un roman. Ne pas entrer dans un traitement technique est excusable, mal représenter quelque chose en gros l'est moins.
Fomite

10

Je n'ai pas lu Black Swan, mais si sa critique des statistiques est aussi simple que vous le dites, alors c'est ridicule. Évidemment, certaines statistiques reposent sur la distribution normale, mais beaucoup ne le font pas.

Des événements rares peuvent-ils être modélisés? Bien sûr qu'ils peuvent. La vraie question est de savoir dans quelle mesure ils peuvent être modélisés. Et cette question aura différentes réponses dans différents domaines, en fonction de ce que nous savons sur les événements rares et leurs antécédents.

Le New York Times Magazine d'aujourd'hui contient un article intéressant de Nate Silver sur l'amélioration de la prévision météorologique au cours de la dernière décennie. Cela inclut une meilleure modélisation des événements rares tels que les ouragans.

Le livre vaut-il la peine d'être lu?


3
J'ai lu le livre et présenté des arguments similaires, comme le vôtre et celui de Dikran. Taleb semblait très naïf. Il y a eu une session le concernant à la JSM il y a quelques années. Je pense que c'était à Washington. La deuxième édition est sortie après cela et est un peu plus raisonnable. Taleb a des choses intéressantes à dire sur des "Cygnes noirs" spécifiques et il en sait beaucoup sur l'économie. Je pense que cela vaut la peine d'être lu et que la deuxième édition est meilleure.
Michael Chernick

Vous êtes l'administrateur d'un site de statistiques, la partie 3 ne vous intéressera probablement pas. Cela pourrait même vous irriter. Les parties I et II pourraient vous donner un aperçu en dehors des statistiques. Vous pouvez essayer de lire le premier chapitre à peu près, puis juger du reste du livre à partir de là. En ce qui concerne la météo, Taleb semble impliquer que les prévisionnistes sont des experts qui sont généralement des experts: experts qui sont généralement des experts: juges des éleveurs, astronomes, pilotes d’essais, juges des sols, maîtres des échecs, physiciens, mathématiciens (quand ils traitent de problèmes mathématiques). comptables, inspecteurs des grains, ph
BCLC

inspecteurs des grains, interprètes de photos, analystes en assurance (traitant de statistiques de type courbe en cloche). Experts qui ont tendance à être… pas des experts: courtiers en valeurs mobilières, psychologues cliniciens, psychiatres, officiers des admissions dans les collèges, juges des tribunaux, conseillers, sélectionneurs de personnel, analystes du renseignement (le bilan de la CIA, malgré ses coûts, est lamentable), à ​​moins que l'on ne prenne en compte une grande dose de prévention invisible. J'ajouterais ces résultats de mon propre examen de la littérature: économistes, prévisionnistes, professeurs de finance, politologues, «expert en risques
BCLC

s, ”Le personnel de la Banque des règlements internationaux, membres augustes de l'Association internationale des ingénieurs financiers et conseillers financiers personnels. Simplement, les choses qui bougent, et qui nécessitent donc des connaissances, n’ont généralement pas d’experts, alors que celles qui ne bougent pas semblent avoir des experts. En d'autres termes, les professions qui traitent avec l'avenir et basent leurs études sur un passé non répétable ont un problème expert (à l'exception de la météo et des activités impliquant des processus physiques à court terme et non socio-économiques).
BCLC

1
Oui, le livre mérite d'être lu!
kjetil b halvorsen

8

Je n'ai pas non plus lu le livre, mais son propos ne peut pas être aussi simpliste que de dire qu'il existe des distributions avec des queues plus grosses que la distribution normale. Ce serait un commentaire sur les autres réponses, mais je n’ai pas accumulé assez d’éloges sur ce site.

De Wikipedia:

"Il déclare que la statistique est fondamentalement incomplète car elle ne permet pas de prédire le risque d'événements rares ..."

Cette question est également assez similaire à: Que pense la communauté du quatrième quadrant?


2
Je n'étais pas au courant du message sur "Quatrième Quadrant". Là, John Cook pointe vers la JSM où Taleb a parlé et fournit un lien vers les commentaires de son blog sur la discussion. Le message est un duplicata à faire mais le débat est bref. Je pense donc que cela vaut la peine de continuer celui-ci.
Michael Chernick

2
Je ne pense pas qu'il soit vrai que les statistiques ne permettent pas de prédire le risque d'événement rare. C'est difficile parce que, dans les données, peu d'informations utiles à cette tâche sont généralement utiles de la même manière que pour l'estimation de la tendance centrale. Ce n'est donc pas tant un problème de statistiques que de données.
Dikran Marsupial le

2
@ dikran: Je suis d'accord avec vous et je pense que ses livres sont des livres de troll. Mais je perdrais quand même horriblement dans un débat contre lui, de la même manière que je perdrais contre un débatteur expérimenté en matière de design intelligent.
projet du

1
@draft oui, il y a une bonne raison pour que les idées scientifiques ne soient plus réglées par un débat public!
Dikran Marsupial

4
Le livre ne se limite pas aux statistiques, ses arguments sur les "inconnus inconnus" (ainsi que sur les "cygnes noirs") et sur "l'erreur ludique" (traiter le monde comme s'il s'agissait d'un jeu de dés avec des probabilités connues) sont à peu près tout. indépendant de sa critique erronée des statistiques comme dépendant de distributions normales. Vous pouvez supprimer tous les chapitres de statistiques et améliorer considérablement le livre.
Peter Ellis


5

Je ne pense pas que Taleb dirait que les techniques statistiques basées sur la distribution gaussienne ne sont pas utiles. Son point de vue dans le livre était qu’ils sont très utiles pour de nombreux processus physiques et biologiques et pour la modélisation (mais pas tous). Il soulève des points positifs et des points négatifs (The Black Swan et Linked étaient le commencement du fléau "tout est une loi de puissance!" essais destinés au profane.

Cela dit, je pense que Taleb aime aggraver les gens. Vous pouvez le voir dans sa bataille avec Myron Scholes. Dans ce cas, il aurait peut-être été utile que l’enseignement statistique au niveau du premier cycle, et parfois au niveau des cycles supérieurs, évite en quelque sorte l’hypothèse de la distribution gaussienne. J'imagine que pendant ses années dans la finance, il a rencontré un grand nombre de candidats possédant une grande connaissance de Black-Scholes et d'autres techniques, mais qui n'ont pas pris en compte les hypothèses sous-jacentes telles que la distribution. Je soupçonne que Taleb se moquait de l'établissement d'enseignement pour avoir échoué à éduquer correctement.


1
+1 pour vos commentaires intéressants. Mais je suis en désaccord sur son point de vue de la distribution normale. Il semble penser que les statisticiens l'utilisent là où cela ne s'applique pas et il a très tort de caractériser les statisticiens de la sorte. Il sait peut-être mieux maintenant. Oui, il a clairement un style d'écriture destiné à provoquer et irriter les gens.
Michael Chernick

1
Je n'ai pas le livre avec moi, alors c'est de mémoire. Une partie de sa colère provient sûrement d'une mauvaise expérience avec les gens. Il raconte qu’à un moment donné, "quelqu'un" (éditera quand je recevrai le livre et pourra trouver des noms) lui criera: "Je suis membre de l’Académie nationale des sciences"! Ce n’est pas vraiment un argument, et il faut se moquer de "quelqu'un" pour l’utiliser comme tel.
kjetil b halvorsen

2
Il est possible que je mette un positif positif inconscient sur ce que je lisais, mais je me suis clairement membre NTT en donnant plusieurs exemples où la distribution gaussienne avait un sens, comme sa tasse de café. J'ai donné le livre afin que je ne puisse pas revenir en arrière et réévaluer cela. L'écriture populaire de Taleb est beaucoup plus polémique que ses écrits professionnels, du moins ce que j'ai lu de ces derniers.
Fraijo le

2
Je ne pense pas que nous prétendions que Taleb pense que la distribution normale n'a jamais de sens. C'est juste que pour les exemples qu'il trouve importants, il pense qu'il est inapproprié de les utiliser. Il a raison à ce sujet mais a tort de penser que la plupart des statisticiens l'utilisent dans ces situations.
Michael Chernick le

1
Intéressant non seulement le nombre de commentateurs qui n'ont pas lu le livre (pour ma part, je l'ai écrémé et c'était beaucoup), mais le nombre de ceux qui l'ont lu, mais qui n'ont pas jugé bon de le garder à portée de main. "Je l'ai donné"; "Je l'ai laissé dans le grenier"; etc.
rolando2

2

Ceux d’entre vous qui n’ont pas lu le livre sont très loin de la base. Il fait une grande distinction entre le scalable et indescriptible. Pour les questions indescriptibles, les statistiques traditionnelles serviront assez bien. Il ne critique pas que ce soit. Les cygnes noirs sont à l’origine de l’échelle et sont difficiles à prédire compte tenu des données empiriques passées. Le livre explique en quoi ces événements peuvent avoir un impact considérable et ne sont généralement expliqués qu’après coup. L'épistémologie est excellente.


-2

Sans lire le livre, j’ai le sentiment que les cloches gaussiennes échouent parce qu’elles n’ont jamais donné une définition claire de la "densité de probabilité"; De plus, ils ne donnent jamais un ensemble complet de points de courbes de Lorenz qui incluent à la fois le total de la variable distribuée et le total des populations qui perçoivent la première. Si "densité" est utilisé, il est nécessaire d'expliquer par rapport à quelle variable; Par exemple, si vous parlez de kilogrammes par litre, il s'agit d'une densité de poids liée au volume. Cette étape n'est pas donnée par la théorie gaussienne dans les manuels scolaires. Pas étonnant que les jeunes ne comprennent pas correctement les statistiques.

En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.