Le message original manque quelques points majeurs: (1) Aucune "donnée" ne peut jamais être distribuée normalement. Les données sont nécessairement discrètes. La question valable est: "le processus qui a produit les données est-il un processus normalement distribué?" Mais (2) la réponse à la deuxième question est toujours «non», quel que soit le résultat d'un test statistique ou d'une autre évaluation basée sur des données. Les processus normalement distribués produisent des données avec une continuité infinie, une symétrie parfaite et des probabilités spécifiées avec précision dans des plages d'écart type (par exemple 68-95-99.7), dont aucune n'est jamais précisément vraie pour les processus qui donnent naissance à des données que nous pouvons mesurer avec n'importe quoi appareil de mesure que nous, humains, pouvons utiliser.
Ainsi, vous ne pouvez jamais considérer que les données sont normalement distribuées et vous ne pouvez jamais considérer le processus qui a produit les données comme un processus précisément distribué normalement. Mais, comme Glen_b l'a indiqué, cela n'a peut-être pas trop d'importance, selon ce que vous essayez de faire avec les données.
Les statistiques d'asymétrie et de kurtosis peuvent vous aider à évaluer certains types d'écarts par rapport à la normalité de votre processus de génération de données. Ce sont des statistiques très variables, cependant. Les erreurs standard données ci-dessus ne sont pas utiles car elles ne sont valables que dans le cadre de la normalité, ce qui signifie qu'elles ne sont utiles que comme test de normalité, un exercice essentiellement inutile. Il serait préférable d'utiliser le bootstrap pour trouver les se, bien que de grands échantillons soient nécessaires pour obtenir des se précis.
En outre, le kurtosis est très facile à interpréter, contrairement au post ci-dessus. Il s'agit de la moyenne (ou valeur attendue) des valeurs Z, chacune portée à la quatrième puissance. Grand | Z | les valeurs sont aberrantes et contribuent fortement à la kurtosis. Petit | Z | les valeurs, où le "pic" de la distribution est, donnent des valeurs Z ^ 4 qui sont minuscules et ne contribuent pratiquement pas à la kurtosis. J'ai prouvé dans mon article https://www.ncbi.nlm.nih.gov/pmc/articles/PMC4321753/ que le kurtosis est très bien approximé par la moyenne des valeurs Z ^ 4 * I (| Z |> 1). Par conséquent, le kurtosis mesure la propension du processus de génération de données à produire des valeurs aberrantes.