Existe-t-il des équivalents normalisés de l'asymétrie et du kurtosis?


10

Quel serait l'équivalent normalisé de l'asymétrie qui aurait la même unité que les données? De même, quel serait l'équivalent normalisé de Kurtosis? Idéalement, ces fonctions devraient être linéaires par rapport aux données, ce qui signifie que si toutes les observations devaient être multipliées par un facteur n, l'asymétrie et le kurtosis normalisés résultants seraient multipliés par le même facteur n. L'avantage d'avoir de tels équivalents normalisés serait de pouvoir les superposer au-dessus d'un graphique standard en boîte et moustaches.


Quelle question amusante!
Alexis

Je ne sais pas à quel point il serait éclairant de les illustrer sur des graphiques. La raison pour laquelle nous illustrons les écarts-types est qu'ils donnent une mesure naturelle de la dispersion des données (si elles sont normalement distribuées): 65% des observations se situent à l'intérieur de l'intervalle. Je ne pense pas qu'il y ait de telles interprétations visuelles naturelles pour les troisième et quatrième moments.
Ben Kuhn

2
Qu'essayez-vous de montrer à propos de vos données? S'il s'agit d'un certain comportement qualitatif de la distribution, un complot de violon pourrait-il être préférable? Mais oui, de toute façon, c'est une question amusante.
Ben Kuhn

On peut avoir une impression d'asymétrie et de kurtosis en regardant un histogramme montrant la distribution de son ensemble de données, mais cela donnera une perception très subjective de ces mesures. Je voudrais les représenter sur deux échelles linéaires, l'une pour l'asymétrie parallèle à l'axe du diagramme en boîte et moustaches, l'autre orthogonale à celle-ci. Cela pourrait être représenté comme une boîte séparée superposée sur le dessus de la boîte principale. Plus cette case est haute, plus les données sont biaisées. Le plus large, le plus pointu (kurtosis élevé).
Ismael Ghalimi du

Et merci pour le lien vers l'intrigue du violon. C'est vraiment intelligent.
Ismael Ghalimi

Réponses:


10

Les mesures d'asymétrie sont délibérément sans unité .

L'instant asymétrie habituel est un troisième moment normalisé, .E[(X-μσ)3]

Si vous centrez mais ne standardisez pas, vous avez ... qui est alors clairement en unités cubes .μ3=E[(X-μ)3]

Si vous vouliez quelque chose dans les mêmes unités que , vous devez prendre la racine cubique, de la même manière que nous prenons la racine carrée de la variance et obtenir quelque chose dans les mêmes unités des données d'origine. (Cependant - méfiez-vous, car de nombreux packages ne prendront pas les racines cubiques de nombres négatifs, vous devrez peut-être le calculer comme suit:Xsigne(X-μ)×|E(X-μ)3|1/3.)

Je ne sais pas à quel point ce sera utile.

Pour certaines autres mesures d'asymétrie, comme les deux mesures d'asymétrie Pearson, vous multipliez simplement par .σ

σμ

Kurtosis suit le même schéma - pour l'instant kurtosis, vous devez prendre les quatrième racines du quatrième moment non normalisé pour obtenir quelque chose qui évolue avec les données.

σ


10

L'asymétrie et le kurtosis sont des caractéristiques de forme. Donc, si je vous dis que la chose, une balle, est ronde , peu importe le rayon de la chose. Ce peut être une petite balle ou une grosse balle . D'un autre côté, quand je dis une petite boule ou un gros cube, je fais référence à la taille de l'objet, pas à la forme.

À cet égard, l'écart type est la taille de la distribution, c'est pourquoi l'asymétrie et le kurtosis sont normalisés par la taille. Vous pourriez également dire que l'écart-type appartient à la mécanique, et l'asymétrie et le kurtosis à la géométrie. Par conséquent, non, nous n'avons pas besoin de les avoir en unités de mesure de la variable. La taille et la forme sont distinctes. Une grosse et une petite balle sont également rondes , c'est-à-dire que la taille n'a pas d'importance dans ce cas :)


1

RM2=RXXT|X|M2=PΛ2PT

X=Λ-1PTX
M2

M2jej=R(Λ-1PTX)(Λ-1PTX)T|X|
=Λ-1PT(RXXT|X|)PΛ-1
=Λ-1PTPΛ2PTPΛ-1=je

La signification géométrique du deuxième moment est "orientation", ce qui se justifie par le fait que la diagonalisation normalise le deuxième moment. Lorsque l'asymétrie est calculée sous cette normalisation, cela s'appelle l'asymétrie de Mardia .

En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.