Une transformation pour changer l'inclinaison sans affecter la kurtosis?

11

Je suis curieux de savoir s'il existe une transformation qui modifie l'inclinaison d'une variable aléatoire sans affecter la kurtosis. Cela serait analogue à la façon dont une transformation affine d'un RV affecte la moyenne et la variance, mais pas le biais et le kurtosis (en partie parce que le biais et le kurtosis sont définis comme étant invariants aux changements d'échelle). Est-ce un problème connu?

data-transformation random-variable moments

— shabbychef
source

Exigez-vous que l'écart-type reste également constant avec cette transformation?

— russellpierce

non, je m'attends à ce que ce ne soit pas le cas, mais l'excès de kurtosis devrait rester fixe. Je m'attendrais cependant à ce que la transformation soit monotone et de préférence déterministe.

— shabbychef

1

Yikes - malheur à la personne qui veut prouver une fonction non déterministe est monotone.

— russellpierce

Ce fil peut intéresser les lecteurs: Transformation pour augmenter le kurtosis et l'asymétrie du rv normal .

— gung - Rétablir Monica

6

Ma réponse est le début d'un hack total, mais je ne connais aucun moyen établi de faire ce que vous demandez.

Ma première étape serait de classer par ordre votre ensemble de données, vous pouvez trouver la position proportionnelle dans votre ensemble de données, puis la transformer en une distribution normale, cette méthode a été utilisée dans Reynolds et Hewitt, 1996. Voir l'exemple de code R ci-dessous dans PROCMiracle.

Une fois que la distribution est normale, le problème a été inversé - une question d'ajustement du kurtosis mais pas de l'inclinaison. Une recherche sur Google a suggéré que l'on pouvait suivre les procédures de John & Draper, 1980 pour ajuster le kurtosis mais pas l'inclinaison - mais je n'ai pas pu reproduire ce résultat.

Mes tentatives de développer une fonction d'étalement / rétrécissement brut qui prend la valeur d'entrée (normalisée) et en ajoute ou en soustrait une valeur proportionnelle à la position de la variable sur l'échelle normale entraîne un ajustement monotone, mais en pratique, a tendance à créer une distribution bimodale bien que présentant les valeurs d'asymétrie et de kurtosis souhaitées.

Je me rends compte que ce n'est pas une réponse complète, mais j'ai pensé que cela pourrait fournir un pas dans la bonne direction.

PROCMiracle <- function(datasource,normalrank="BLOM")
  {
     switch(normalrank,
      "BLOM" = {
                  rmod <- -3/8
                  nmod <- 1/4
                },
      "TUKEY" = {
                  rmod <- -1/3
                  nmod <- 1/3
                },
      "VW" ={
                  rmod <- 0
                  nmod <- 1
            },
      "NONE" = {
                  rmod <- 0
                  nmod <- 0
                }
    )
    print("This may be doing something strange with NA values!  Beware!")
    return(scale(qnorm((rank(datasource)+rmod)/(length(datasource)+nmod))))
  }

— russellpierce
source

J'avais fait quelque chose comme ça: classer, puis utiliser la transformation g-and-h pour obtenir un kurtosis et un biais fixes. Cependant, cette technique suppose que je connais réellement la population kurtosis, que je peux estimer, mais je suis intéressé, philosophiquement, s'il y a une transformation qui préserve la kurtosis sans que je

— doive

@shabbychef: Oh, eh bien, désolé de ne rien ajouter de nouveau. Cependant, vous avez ajouté quelque chose de nouveau, je n'avais jamais entendu parler de la formule g-and-h auparavant. Avez-vous une citation librement accessible qui la fournit? Je suis tombé sur un papier avec ça énoncé ( fic.wharton.upenn.edu/fic/papers/02/0225.pdf ) mais la notion m'est un peu étrangère (en particulier c'est que e ^ Z ^ g ou autre chose )? Je l'ai essayé comme ça ... mais les résultats semblaient bizarres ... a + b * (e ^ g ^ z-1) * (exp ((h * z ^ 2) / 2) / g).

— russellpierce

1

@drnexus: Je ne voulais pas biaiser les résultats en mentionnant ma technique. J'ai découvert les distributions g et h et g et k de Haynes et. al, dx.doi.org/10.1016/S0378-3758(97)00050-5 , et Fisher & Klein, econstor.eu/bitstream/10419/29578/1/614055873.pdf

— shabbychef

1

Une autre technique intéressante est venue à l'esprit, bien que cela ne réponde pas tout à fait à la question, est de transformer un échantillon pour avoir un échantillon L-skew fixe et un échantillon L-kurtosis (ainsi qu'une moyenne fixe et une échelle L). Ces quatre contraintes sont linéaires dans les statistiques d'ordre. Pour garder la transformée monotone sur un échantillon de observations, il faudrait alors encore équations. Cela pourrait alors être posé comme un problème d'optimisation quadratique: minimiser le $n$ $n-1$ $\ell_2$ norme entre les statistiques d'ordre d'échantillon et la version transformée soumise aux contraintes données. C'est une sorte d'approche farfelue, cependant. Dans la question d'origine, je cherchais quelque chose de plus basique et fondamental. Je cherchais également implicitement une technique qui pourrait être appliquée à des observations individuelles, indépendamment d'avoir une cohorte entière d'échantillons.

— shabbychef
source

0

Je préfère modéliser cet ensemble de données en utilisant une distribution leptokurtic au lieu d'utiliser des transformations de données. J'aime la distribution sinh-arcsinh de Jones et Pewsey (2009), Biometrika.

— abc
source