Comment le kurtosis d'une distribution est-il lié à la géométrie de la fonction de densité?


12

Le kurtosis consiste à mesurer le pic et la planéité d'une distribution. La fonction de densité de la distribution, si elle existe, peut être considérée comme une courbe et présente des caractéristiques géométriques (telles que la courbure, la convexité, ...) liées à sa forme.

Je me demande donc si le kurtosis d'une distribution est lié à certaines caractéristiques géométriques de la fonction de densité, ce qui peut expliquer la signification géométrique du kurtosis?


Je demande une relation dans la formule avec une certaine quantité géométrique de la courbe de densité, pas seulement le sens vague que j'ai souligné dans mon article. Ou c'est bien d'avoir juste une explication de la raison pour laquelle le kurtosis a une signification géométrique
Tim

@Peter C'est loin de la vérité. On peut modifier la géométrie du graphique du PDF presque arbitrairement sans changer aucun moment spécifié (nombre fini de ses) moments.
whuber

La question étroitement liée sur stats.stackexchange.com/questions/25010/… suggère quelle devrait être la bonne réponse à cette question.
whuber

@whuber alors que je suis d'accord et merci pour cet exemple, je me demande également si cela ne dit pas plus sur la propriété remarquable de cette famille particulière de pdf que sur la kurtosis en général.
user603

@ user603 C'est une bonne chose à se demander. Cependant, l'énoncé ne concerne pas cette famille particulière: il se trouve que pour la distribution lognormale, on peut produire une représentation explicite d'une classe de PDF alternatifs avec les mêmes moments. Il est spécial que tous les moments soient identiques, mais perturber la plupart des distributions d'une manière qui fixe un nombre fini de leurs moments n'est pas difficile. (C'est difficile pour certaines distributions discrètes, comme le Bernoulli, mais elles n'ont pas de PDF.)
whuber

Réponses:


17

Les moments d'une distribution continue, et leurs fonctions comme le kurtosis, en disent très peu sur le graphique de sa fonction de densité.

Considérez, par exemple, les graphiques suivants.

entrez la description de l'image ici

Chacun d'eux est le graphe d'une fonction non négative intégrant à : ce sont tous des PDF. De plus, ils ont tous exactement les mêmes moments - jusqu'au dernier nombre infini d'entre eux. Ainsi, ils partagent une kurtosis commune (qui se trouve être égale à - 3 + 3 e 2 + 2 e 3 + e 4. )13+3e2+2e3+e4

Les formules de ces fonctions sont

fk,s(x)=12πxexp(12(log(x))2)(1+ssin(2kπlog(x))

pour - 1 s 1 , et k Z .x>0, 1s1,kZ.

La figure affiche les valeurs de à gauche et les valeurs de k en haut. La colonne de gauche montre le PDF pour la distribution log-normale standard.sk

L'exercice 6.21 de la Théorie avancée des statistiques de Kendall (Stuart & Ord, 5e édition) demande au lecteur de montrer que tous ces événements ont les mêmes moments.

On peut de même modifier n'importe quel pdf pour créer un autre pdf de forme radicalement différente mais avec les mêmes deuxième et quatrième moments centraux (disons), qui auraient donc le même kurtosis. À partir de cet exemple, il devrait être parfaitement clair que la kurtosis n'est pas une mesure facilement interprétable ou intuitive de symétrie, d'unimodalité, de bimodalité, de convexité ou de toute autre caractérisation géométrique familière d'une courbe.

Les fonctions des moments, donc (et kurtosis comme cas particulier) ne décrivent pas les propriétés géométriques du graphique du pdf. Cela a un sens intuitif: parce qu'un pdf représente la probabilité au moyen de l' aire, nous pouvons presque librement déplacer la densité de probabilité d'un endroit à un autre, modifiant radicalement l'apparence du pdf, tout en fixant un nombre fini de moments prédéfinis.


1
"De cet exemple seulement, il devrait être très clair ... toute autre caractérisation géométrique familière d'une courbe." Je comprends ce que vous voulez dire, mais il y a lieu de divergence raisonnable dans l'interprétation ici. Une autre interprétation est celle de Darlington, qui montre comment à partir d'une distribution symétrique, déplacer une masse à des points spécifiques augmente / diminue le kurtosis (encore une fois, pas une contradiction avec votre exemple, juste une compréhension plus `` positive '').
user603

1
@ user603 Je ne suis pas en désaccord, mais je pense que l'approche "positive" néglige les hypothèses très spéciales qui sont implicitement faites pour que cela fonctionne. On pourrait aussi commencer par le graphe d'un PDF extrêmement asymétrique dont l'asymétrie est nulle (ils ne sont pas difficiles à construire). Ainsi, cette approche positive décrit simplement ce qui arrive à certains PDF très spéciaux lorsque la masse est déplacée. Bien que cela puisse être très utile pour l'intuition, cela ne semble pas avoir de rapport logique avec la présente question.
whuber

1
Je suis d'accord pour l'asymétrie (et pour votre réponse en général). Mais le kurtosis, en tant que fonction, a un minimum. Cela rend les choses un peu plus intéressantes.
user603

1
@ user603 Merci; c'est une distinction perspicace. Je ne pense pas que cela change l'une des conclusions actuelles de manière importante, mais cela aide certainement l'intuition et indique une différence importante entre les moments pairs et les moments impairs.
whuber

6

Pour les distributions symétriques (c'est-à-dire celles pour lesquelles les moments centrés pairs sont significatifs), le kurtosis mesure une caractéristique géométrique du pdf sous-jacent. Il n'est pas vrai que le kurtosis mesure (ou soit en général lié) au pic d'une distribution. Au contraire, le kurtosis mesure à quel point la distribution sous-jacente est symétrique et bimodale (algébriquement, une distribution parfaitement symétrique et bimodale aura un kurtosis de 1, qui est la plus petite valeur possible que le kurtosis puisse avoir) [0].

En résumé [1], si vous définissez:

k=E(xμ)4/σ4

avec , puisE(X)=μ,V(X)=σ2

k=V(Z2)+11

pour .Z=(Xμ)/σ

Cela implique que peut être considéré comme une mesure de la dispersion de Z 2 autour de son attente 1. En d'autres termes, si vous avez une interprétation géométrique de la variance et de l'espérance, celle du kurtosis suit.kZ2

[0] RB Darlington (1970). Kurtosis est-il vraiment un "pic"? Le statisticien américain, vol. 24, n ° 2.

[1] JJA Moors (1986). La signification de Kurtosis: Darlington Reexamined. The American Statistician, Volume 40, Numéro 4.


1
Partout où vous écrivez «bimodal», voulez-vous dire peut-être «unimodal»?
whuber

1
Oui, ces exemples fonctionnent pour les distributions symétriques. Une explicite pourrait être construite à partir des familles pseudo-lognormales: prendre une de ces pdfs (infiniment modaux) avec une moyenne de μ et définir un nouveau pdf comme g ( x ) = ( f ( x ) + ffμ En mélangeant une petite quantité de g avec une distribution de kurtosis minimum, vous trouvez qu'il existe des distributions avec une infinité de modes dont le kurtosis est arbitrairement proche de la valeur minimale de 1g(x)=(f(x)+f(2μx))/2.g1. Ainsi, au moins, le kurtosis ne dit absolument rien de la bimodalité. Comme il ne le fait pas, quelle propriété géométrique du pdf décrit-il précisément?
whuber


1
La kurtosis n'indique pas la bimodalité, sauf dans le cas extrême où elle est proche de son minimum, où elle indique quelque chose de similaire à la distribution équiprobable à deux points. Vous pouvez avoir des distributions bimodales avec toutes les valeurs possibles de kurtosis. Voir ncbi.nlm.nih.gov/pmc/articles/PMC4321753 pour des exemples.
Peter Westfall

1
ppv0

5

[NB ceci a été écrit en réponse à une autre question sur place; les réponses ont été fusionnées à la présente question. C'est pourquoi cette réponse semble répondre à une question formulée différemment. Cependant, une grande partie du message devrait être pertinente ici.]

Kurtosis ne mesure pas vraiment la forme des distributions. Dans certaines familles de distribution, vous pouvez peut-être dire qu'il décrit la forme, mais plus généralement, le kurtosis ne vous dit pas grand-chose sur la forme réelle. La forme est influencée par de nombreuses choses, y compris des choses sans rapport avec le kurtosis.

Si l'on fait une recherche d'image pour kurtosis, plusieurs images comme celle-ci apparaissent:

p

qui semblent plutôt montrer une variance changeante, plutôt qu’augmenter le kurtosis. À titre de comparaison, voici trois densités normales que je viens de dessiner (en utilisant R) avec différents écarts-types:

entrez la description de l'image ici

Comme vous pouvez le voir, il semble presque identique à l'image précédente. Ils ont tous exactement le même kurtosis. En revanche, voici un exemple qui est probablement plus proche de ce que le diagramme visait

entrez la description de l'image ici

6

C'est généralement ce que les gens veulent dire quand ils parlent de kurtosis indiquant la forme de la densité. Cependant, le kurtosis peut être subtil - il ne doit pas fonctionner comme ça.

Par exemple, à une variance donnée, une kurtose plus élevée peut en fait se produire avec un pic plus faible.

Il faut aussi se méfier de la tentation (et dans de nombreux livres, il est ouvertement déclaré) que zéro excès de kurtosis implique la normalité. Il existe des distributions avec un excès de kurtosis 0 qui ne ressemblent en rien à la normale. Voici un exemple:

dgam 2.3

En effet, cela illustre également le point précédent. Je pourrais facilement construire une distribution d'apparence similaire avec une kurtosis plus élevée que la normale mais qui est toujours nulle au centre - une absence complète de pic.

Il existe un certain nombre de messages sur le site qui décrivent davantage la kurtosis. Un exemple est ici .


Mais je ne l'ai pas dit? Le livre le dit?
Stat Tistician

Je le sais. Je n'ai jamais dit que tu l'avais dit. Comment proposeriez-vous que je réponde aux déclarations manifestement incorrectes que vous demandez? Faites comme s'ils n'avaient pas tort?
Glen_b -Reinstate Monica

1
@Glen_b Les photos ne sont pas extraites du livre. Le livre ne donne pas d'illustrations. J'ai utilisé la recherche d'images goolge pour ces illustrations.
Stat Tistician

2
Certains auteurs décrivent le kurtosis comme un pic et certains l'écrivent comme le poids de la queue, mais l'interprétation sceptique selon laquelle le kurtosis est quelque soit les mesures du kurtosis est la seule histoire totalement sûre. Les exemples numériques donnés par Irving Kaplansky (1945) suffisent à eux seuls à montrer que la kurtosis ne porte aucune interprétation sans équivoque. (L'article de Kaplansky est l'un des rares qu'il a écrit au milieu des années 1940 sur les probabilités et les statistiques. Il est beaucoup mieux connu comme un algèbre distingué.) Référence complète et plus dans stata-journal.com/sjpdf.html?articlenum=st0204
Nick Cox

1
Il y a des livres et des articles qui prétendent que le kurtosis est un pic, donc ma première clause reste correcte ainsi que supportable comme une déclaration sur ce qui est dans la littérature. Ce qui est plus crucial, c'est la façon dont on considère les exemples et les arguments de Kaplansky.
Nick Cox

3

μ±σ https://www.ncbi.nlm.nih.gov/pmc/articles/PMC4321753/

Edit 23/11/2018: Depuis la rédaction de cet article, j'ai développé des perspectives géométriques sur le kurtosis. La première est que l'excès de kurtosis peut en effet être visualisé géométriquement en termes d'écarts par rapport à la ligne de 45 degrés attendue dans les queues du tracé quantile-quantile normal; voir Ce tracé QQ indique-t-il une distribution leptokurtique ou platykurtique?

pV(v)V={(Xμ)/σ}4XE(V)VX

μ±σXμ±σμσX0.25μ±σμσ


3
Plutôt que de simplement continuer à renvoyer les gens vers un document dans la plupart de vos messages, cela vous dérangerait-il de résumer les arguments ici? Voir l'aide ici sous "toujours fournir un contexte pour les liens", en particulier où il est dit "toujours citer la partie importante". Ce n'est pas nécessairement de le citer littéralement là où l'argument est étendu, mais au moins un résumé de l'argument est nécessaire. Vous faites simplement quelques déclarations générales, puis vous liez à un document. L'affirmation selon laquelle le kurtosis mesure le comportement de la queue est (sans contexte) trompeuse (manifestement)
Glen_b -Reinstate Monica

2
... mais il est impossible d'être en désaccord avec les arguments que vous ne présentez pas ici, et peut-être d'arriver à une conclusion plus nuancée.
Glen_b -Reinstate Monica

Mes arguments sont clairement présentés ici: en.wikipedia.org/wiki/… Commentaires bienvenus! BTW, kurtosis EST une mesure du poids de la queue, tout simplement pas le même que d'autres qui ont été considérés. Il mesure le poids de la queue via E (Z ^ 4), qui est une mesure du poids de la queue puisque les valeurs | Z | <1 y contribuent si peu. Selon la même logique, E (Z ^ n), pour des puissances paires n plus élevées, sont également des mesures de poids de queue.
Peter Westfall

Bonjour Peter, veuillez visiter stats.stackexchange.com/help/merging-accounts pour fusionner vos comptes afin de pouvoir modifier vos anciens messages.
whuber

3

Un autre type de réponse: nous pouvons illustrer géométriquement le kurtosis, en utilisant les idées de http://www.quantdec.com/envstats/notes/class_06/properties.htm : moments graphiques.

k=E(Xμσ)4=(xμσ)4f(x)dx
fXμ,σ2x ke=k3

Dans ce qui suit, je vais montrer un tracé de kurtosis graphique pour certaines distributions symétriques, toutes centrées sur zéro et mises à l'échelle pour avoir la variance 1.

kurtosis visuel pour certaines distributions symétriques

Remarquez la quasi-absence de contribution au kurtosis du centre, montrant que le kurtosis n'a pas grand-chose à voir avec le "pic".


1
Z2b+bb
En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.