Il semble qu'il y ait quelque chose dans notre compréhension humaine qui crée des difficultés à saisir intuitivement l'idée de variance. Dans un sens étroit, la réponse est immédiate: la quadrature nous rejette de notre compréhension réflexive. Mais, est-ce seulement la variance qui pose problème, ou est-ce l'idée de propagation dans les données? Nous cherchons refuge dans la gamme, ou simplement énoncer le minimum et le maximum, mais évitons-nous simplement la vraie difficulté? Dans la moyenne (mode ou médiane) on retrouve le centre, le résumé ... une simplification; la variance propage les choses et les rend inconfortables. L'homme primitif utiliserait certainement le moyen de chasser les animaux en triangulant pour prier, mais je suppose que c'est beaucoup plus tard que nous avons ressenti le besoin de quantifier la propagation des choses. En fait, le terme variance a été introduit par Ronald Fisher pour la première fois en 1918 dans le document "La corrélation entre les parents sur la suppression de l'hérédité mendélienne".
La plupart des gens qui suivent l'actualité auraient entendu l'histoire du discours malheureux de Larry Summers sur les aptitudes en mathématiques par sexe , probablement liées à son départ de Harvard. En un mot, il a suggéré une plus grande variance dans la répartition des compétences en mathématiques chez les hommes par rapport aux femmes, même si les deux sexes jouissaient de la même moyenne. Indépendamment de la pertinence ou des implications politiques, cela semble être confirmé dans la littérature scientifique .
Plus important encore, la compréhension de questions telles que le changement climatique - veuillez m'excuser d'avoir soulevé des sujets qui pourraient conduire à des discussions complètement inutiles - par la population en général pourrait être facilitée par une meilleure familiarité avec l'idée de variance.
Le problème est aggravé lorsque nous essayons de saisir la covariance, comme le montre ce post , avec une excellente réponse colorée de @whuber ici .
Il peut être tentant de rejeter cette question comme trop générale, mais il est clair que nous en discutons indirectement, comme dans ce post , où les mathématiques sont triviales, mais le concept continue d'être insaisissable, malgré une acceptation plus confortable de la plage comme opposé à la variance idée plus nuancée .
Dans une lettre de Fisher à EBFord , faisant référence à la controverse suscitée par ses soupçons sur les expériences mendéliennes, nous lisons: "Maintenant, lorsque les données ont été truquées, je sais très bien comment, en général, les gens sous-estiment la fréquence des écarts de chance importants , de sorte que la tendance est toujours de les faire trop bien correspondre aux attentes ... les écarts [dans les données de Mendel] sont scandaleusement faibles. " Le grand RA Fisher est si désireux de soupçonner de petites variations dans de petits échantillons qu'il écrit : "il reste possible, entre autres, que Mendel ait été trompé par un assistant qui ne savait que trop bien ce qui était attendu".
Et il est tout à fait possible que ce parti pris en faveur d'une propagation sous-estimée ou incomprise persiste aujourd'hui. Si oui, y a-t-il une explication pour laquelle nous sommes plus à l'aise avec les concepts de centralité qu'avec la dispersion? Y a-t-il quelque chose que nous puissions faire pour internaliser l'idée?
Certains concepts que nous «voyons» en un clin d'œil, puis nous ne le faisons pas, mais nous les acceptons et continuons. Par exemple, ou E = m c 2 , mais nous n'avons même pas vraiment besoin de connaître ces identités pour prendre des décisions dans notre vie quotidienne. Il n'en va pas de même pour la variance. Alors, ne devrait-il pas être plus intuitif?
Nassim Taleb a fait fortune en appliquant sa perception (enfin, vraiment Benoît Mandelbrot ) d'une compréhension erronée de la variance à l'exploitation des temps de crise, et a essayé de rendre le concept compréhensible aux masses avec des phrases comme, "la variance de la variance est, épistémologiquement , une mesure du manque de connaissance sur le manque de connaissance de la moyenne "- oui, il y a plus de contexte à cette bouchée ... Et à son crédit, il l'a aussi simplifié avec l' idée de Thanksgiving Turquie . On peut soutenir que la clé de l'investissement est de comprendre la variance (et la covariance).
Alors, pourquoi est-il si glissant et comment y remédier? Sans formules ... juste l'intuition d'années de gestion de l'incertitude ... Je ne connais pas la réponse, mais ce n'est pas mathématique (nécessairement, c'est-à-dire): par exemple, je me demande si l'idée de kurtosis interfère avec la variance. Dans le graphique suivant, nous avons deux histogrammes se chevauchant avec pratiquement la même variance; pourtant, ma réaction de réflexe est que celle qui a la queue la plus longue et le pic le plus haut (kurtosis supérieur) est plus "étalée":