Questions marquées «data-transformation»

Ré-expression mathématique, souvent non linéaire, des valeurs de données. Les données sont souvent transformées soit pour répondre aux hypothèses d'un modèle statistique, soit pour rendre les résultats d'une analyse plus interprétables.


3
Réponses expresses en termes d'unités originales, en données transformées Box-Cox
Pour certaines mesures, les résultats d'une analyse sont présentés de manière appropriée sur l'échelle transformée. Dans la plupart des cas, cependant, il est souhaitable de présenter les résultats sur l'échelle de mesure d'origine (sinon votre travail est plus ou moins sans valeur). Par exemple, dans le cas de données transformées …

5
Réduction de dimensionnalité SVD pour des séries temporelles de différentes longueurs
J'utilise la décomposition en valeurs singulières comme technique de réduction de dimensionnalité. Étant donné des Nvecteurs de dimension D, l'idée est de représenter les entités dans un espace transformé de dimensions non corrélées, qui condense la plupart des informations des données dans les vecteurs propres de cet espace dans un …



1
Les root sont-elles recommandées?
Mon collègue veut analyser certaines données après avoir transformé la variable de réponse en la portant à la puissance de (c'est-à-dire ).1818\frac18y0.125y0.125y^{0.125} Je suis mal à l'aise avec cela, mais j'ai du mal à expliquer pourquoi. Je ne peux penser à aucune justification mécanique de cette transformation. Je ne l'ai …

1
Quelle est la façon la plus appropriée de transformer des proportions lorsqu'elles sont une variable indépendante?
Je pensais avoir compris ce problème, mais maintenant je ne suis pas aussi sûr et je voudrais vérifier avec les autres avant de continuer. J'ai deux variables, Xet Y. Yest un rapport, et il n'est pas limité par 0 et 1 et est généralement distribué normalement. Xest une proportion, délimitée …

4
Indique qu'un problème est bien adapté à la régression linéaire
J'apprends la régression linéaire en utilisant Introduction à l'analyse de régression linéaire par Montgomery, Peck et Vining . J'aimerais choisir un projet d'analyse de données. J'ai la pensée naïve que la régression linéaire ne convient que lorsque l'on soupçonne qu'il existe des relations fonctionnelles linéaires entre les variables explicatives et …

2
Les X et Y normalement distribués sont-ils plus susceptibles d'entraîner des résidus normalement distribués?
Ici, la mauvaise interprétation de l'hypothèse de normalité dans la régression linéaire est discutée (que la `` normalité '' fait référence au X et / ou au Y plutôt qu'aux résidus), et l'affiche demande s'il est possible d'avoir X et Y non distribués normalement et ont encore des résidus normalement …


1
Critères de sélection du «meilleur» modèle dans un modèle de Markov caché
J'ai un ensemble de données de série chronologique auquel j'essaie d'adapter un modèle de Markov caché (HMM) afin d'estimer le nombre d'états latents dans les données. Mon pseudo-code pour ce faire est le suivant: for( i in 2 : max_number_of_states ){ ... calculate HMM with i states ... optimal_number_of_states = …



2
Que faire lorsque certains points dans le temps ont des réponses fortement biaisées et d'autres pas dans une étude de mesures répétées?
En règle générale, lorsque l'on rencontre des mesures de résultats continues mais asymétriques dans un plan longitudinal (par exemple, avec un effet inter-sujets), l'approche courante consiste à transformer le résultat en normalité. Si la situation est extrême, comme dans le cas d'observations tronquées, on peut se montrer fantaisiste et utiliser …

2
Les modèles de séries chronologiques de différence logarithmique sont-ils meilleurs que les taux de croissance?
Souvent, je vois des auteurs estimer un modèle de «différence logarithmique», par exemple Journal( yt) - journal( yt - 1) = log( yt/ yt - 1) = α + βXtJournal⁡(yt)-Journal⁡(yt-1)=Journal⁡(yt/yt-1)=α+βXt\log (y_t)-\log(y_{t-1}) = \log(y_t/y_{t-1}) = \alpha + \beta x_t Je conviens que cela est approprié pour relier à une variation en …

En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.