Kurtosis mesure les valeurs aberrantes. Les valeurs aberrantes sont problématiques pour les inférences standard (par exemple, les tests t, les intervalles t) qui sont basées sur la distribution normale. C'est la fin de l'histoire! Et c'est vraiment une histoire assez simple.
La raison pour laquelle cette histoire n'est pas bien appréciée est que le mythe ancien selon lequel le kurtosis mesure le "pic" persiste.
Voici une explication simple montrant pourquoi le kurtosis mesure les valeurs aberrantes et non le "pic".
Considérez l'ensemble de données suivant.
0, 3, 4, 1, 2, 3, 0, 2, 1, 3, 2, 0, 2, 2, 3, 2, 5, 2, 3, 1
Kurtosis est la valeur attendue des (valeurs z) ^ 4. Voici les (valeurs z) ^ 4:
6,51, 0,30, 5,33, 0,45, 0,00, 0,30, 6,51, 0,00, 0,45, 0,30, 0,00, 6,51, 0,00, 0,00, 0,30, 0,00, 27,90, 0,00, 0,30, 0,45
La moyenne est de 2,78, et c'est une estimation du kurtosis. (Soustrayez 3 si vous voulez un excès de kurtosis.)
Maintenant, remplacez la dernière valeur de données par 999 pour qu'elle devienne une valeur aberrante:
0, 3, 4, 1, 2, 3, 0, 2, 1, 3, 2, 0, 2, 2, 3, 2, 5, 2, 3, 999
Maintenant, voici les (valeurs z) ^ 4:
0,00, 0,00, 0,00, 0,00, 0,00, 0,00, 0,00, 0,00,0,00, 0,00, 0,00, 0,00, 0,00, 0,00, 0,00, 0,00, 0,00, 0,00, 0,00, 360,98
La moyenne est de 18,05, et c'est une estimation du kurtosis. (Soustrayez 3 si vous voulez un excès de kurtosis.)
De toute évidence, seules les valeurs aberrantes importent. Rien sur le "pic" ou les données proches du milieu ne compte.
Si vous effectuez des analyses statistiques standard avec le deuxième ensemble de données, vous devriez vous attendre à des problèmes. Le grand kurtosis vous alerte du problème.
Voici un article qui élabore:
Westfall, PH (2014). Kurtosis as Peakedness, 1905 - 2014. RIP The American Statistician, 68, 191-195.