Ré-expression mathématique, souvent non linéaire, des valeurs de données. Les données sont souvent transformées soit pour répondre aux hypothèses d'un modèle statistique, soit pour rendre les résultats d'une analyse plus interprétables.
J'ai eu du mal avec le problème suivant avec, je l'espère, un problème facile pour les statisticiens (je suis un programmeur avec une certaine exposition aux statistiques). Je dois résumer les réponses à une enquête (pour la direction). L'enquête comprend plus de 100 questions, regroupées dans différents domaines (avec environ …
Pour certaines mesures, les résultats d'une analyse sont présentés de manière appropriée sur l'échelle transformée. Dans la plupart des cas, cependant, il est souhaitable de présenter les résultats sur l'échelle de mesure d'origine (sinon votre travail est plus ou moins sans valeur). Par exemple, dans le cas de données transformées …
J'utilise la décomposition en valeurs singulières comme technique de réduction de dimensionnalité. Étant donné des Nvecteurs de dimension D, l'idée est de représenter les entités dans un espace transformé de dimensions non corrélées, qui condense la plupart des informations des données dans les vecteurs propres de cet espace dans un …
Dans ce cas particulier, je fais référence au jour où un lac gèle. Cette date "glacée" n'a lieu qu'une fois par an, mais parfois elle ne se produit pas du tout (si l'hiver est chaud). Ainsi, sur une année, le lac peut geler le jour 20 (20 janvier) et une …
Problème Je voudrais tracer la variance expliquée par chacun des 30 paramètres, par exemple sous forme de graphique à barres avec une barre différente pour chaque paramètre, et la variance sur l'axe y: Cependant, les variances sont fortement biaisées vers de petites valeurs, y compris 0, comme on peut le …
Mon collègue veut analyser certaines données après avoir transformé la variable de réponse en la portant à la puissance de (c'est-à-dire ).1818\frac18y0.125y0.125y^{0.125} Je suis mal à l'aise avec cela, mais j'ai du mal à expliquer pourquoi. Je ne peux penser à aucune justification mécanique de cette transformation. Je ne l'ai …
Je pensais avoir compris ce problème, mais maintenant je ne suis pas aussi sûr et je voudrais vérifier avec les autres avant de continuer. J'ai deux variables, Xet Y. Yest un rapport, et il n'est pas limité par 0 et 1 et est généralement distribué normalement. Xest une proportion, délimitée …
J'apprends la régression linéaire en utilisant Introduction à l'analyse de régression linéaire par Montgomery, Peck et Vining . J'aimerais choisir un projet d'analyse de données. J'ai la pensée naïve que la régression linéaire ne convient que lorsque l'on soupçonne qu'il existe des relations fonctionnelles linéaires entre les variables explicatives et …
Ici, la mauvaise interprétation de l'hypothèse de normalité dans la régression linéaire est discutée (que la `` normalité '' fait référence au X et / ou au Y plutôt qu'aux résidus), et l'affiche demande s'il est possible d'avoir X et Y non distribués normalement et ont encore des résidus normalement …
Supposons que j'ai une variable leptokurtique que je voudrais transformer en normalité. Quelles transformations peuvent accomplir cette tâche? Je suis bien conscient que la transformation des données n'est pas toujours souhaitable, mais en tant que poursuite académique, supposons que je veuille "marteler" les données en normalité. De plus, comme vous …
J'ai un ensemble de données de série chronologique auquel j'essaie d'adapter un modèle de Markov caché (HMM) afin d'estimer le nombre d'états latents dans les données. Mon pseudo-code pour ce faire est le suivant: for( i in 2 : max_number_of_states ){ ... calculate HMM with i states ... optimal_number_of_states = …
J'ai deux variables aléatoires et .X>0X>0X > 0Y>0Y>0Y > 0 Étant donné que je peux estimer comment puis-je estimerCov(X,Y),Cov(X,Y),\text{Cov}(X, Y),Cov(log(X),log(Y))?Cov(log(X),log(Y))?\text{Cov}(\log(X), \log(Y))?
C'est probablement une question très fondamentale, mais je ne semble pas être en mesure d'y trouver une réponse solide. J'espère ici, je peux. Je lis actuellement des articles en préparation de ma propre thèse de maîtrise. Actuellement, je lis un article qui étudie la relation entre les tweets et les …
En règle générale, lorsque l'on rencontre des mesures de résultats continues mais asymétriques dans un plan longitudinal (par exemple, avec un effet inter-sujets), l'approche courante consiste à transformer le résultat en normalité. Si la situation est extrême, comme dans le cas d'observations tronquées, on peut se montrer fantaisiste et utiliser …
Souvent, je vois des auteurs estimer un modèle de «différence logarithmique», par exemple Journal( yt) - journal( yt - 1) = log( yt/ yt - 1) = α + βXtJournal(yt)-Journal(yt-1)=Journal(yt/yt-1)=α+βXt\log (y_t)-\log(y_{t-1}) = \log(y_t/y_{t-1}) = \alpha + \beta x_t Je conviens que cela est approprié pour relier à une variation en …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.