La tendance centrale, la propagation et l'asymétrie peuvent toutes être définies relativement bien, au moins sur une base intuitive; les mesures mathématiques standard de ces choses correspondent également relativement bien à nos notions intuitives. Mais le kurtosis semble être différent. C'est très déroutant et cela ne correspond pas bien à toute intuition sur la forme distributionnelle.
Une explication typique de kurtosis dans un cadre appliqué serait cet extrait des statistiques appliquées pour les entreprises et la gestion utilisant Microsoft Excel :
Le kurtosis fait référence au pic de distribution ou inversement à la platitude. S'il y a plus de valeurs de données dans les queues que ce que vous attendez d'une distribution normale, le kurtosis est positif. Inversement, s'il y a moins de valeurs de données dans les queues que vous ne le pensez dans une distribution normale, le kurtosis est négatif. Excel ne peut pas calculer cette statistique sauf si vous avez au moins quatre valeurs de données.
Mis à part la confusion entre «kurtosis» et «excess kurtosis» (comme dans ce livre, il est courant d'utiliser le premier mot pour désigner ce que d'autres auteurs appellent ce dernier), l'interprétation en termes de «pic» ou de «planéité» est alors embrouillé par le changement d'attention sur le nombre d'éléments de données dans les queues. Il est nécessaire de tenir compte à la fois du "pic" et de la "queue" - Kaplanskys'est plaint en 1945 que de nombreux manuels de l'époque déclaraient à tort que le kurtosis était lié à la hauteur du pic de la distribution par rapport à celui d'une distribution normale, sans tenir compte des queues. Mais avoir clairement à considérer la forme à la fois au sommet et dans la queue rend l'intuition plus difficile à saisir, un point que l'extrait cité ci-dessus saute en passant de la pointe à la lourdeur de la queue comme si ces concepts étaient les mêmes.
De plus, cette explication classique de "pic et queue" de kurtosis ne fonctionne bien que pour les distributions symétriques et unimodales (en effet, les exemples illustrés dans ce texte sont tous symétriques). Pourtant, la manière générale "correcte" d'interpréter le kurtosis, que ce soit en termes de "pics", de "queues" ou de "épaules", est contestée depuis des décennies .
Existe-t-il un moyen intuitif d'enseigner le kurtosis dans un cadre appliqué qui ne heurtera pas les contradictions ou les contre-exemples lorsqu'une approche plus rigoureuse est adoptée? Le kurtosis est-il même un concept utile dans le contexte de ce type de cours d'analyse de données appliquées, par opposition aux cours de statistiques mathématiques? Si le «pic» d'une distribution est un concept intuitivement utile, devrions-nous plutôt l'enseigner au moyen de moments L ?
Herkenhoff, L. et Fogli, J. (2013). Statistiques appliquées aux entreprises et à la gestion à l'aide de Microsoft Excel . New York, NY: Springer.
Kaplansky, I. (1945). "Une erreur courante concernant le kurtosis". Journal de l'American Statistical Association , 40 (230): 259.
Darlington, Richard B (1970). "Est-ce que Kurtosis est vraiment un" pic "?". The American Statistician 24 (2): 19-22
Moors, JJA. (1986) "Le sens de kurtosis: Darlington réexaminé". The American Statistician 40 (4): 283–284
Balanda, Kevin P. et MacGillivray, HL (1988). " Kurtosis: A Critical Review". The American Statistician 42 (2): 111-119
DeCarlo, LT (1997). " Sur le sens et l'utilisation du kurtosis ". Méthodes psychologiques , 2 (3), 292. Chicago
Hosking, JRM (1992). "Moments ou moments L? Un exemple comparant deux mesures de forme distributionnelle". The American Statistician 46 (3): 186–189