Ré-expression mathématique, souvent non linéaire, des valeurs de données. Les données sont souvent transformées soit pour répondre aux hypothèses d'un modèle statistique, soit pour rendre les résultats d'une analyse plus interprétables.
Vous pouvez avoir des données en format large ou en format long. C'est une chose assez importante, car les méthodes utilisables sont différentes, en fonction du format. Je sais que vous devez travailler avec melt()et à cast()partir du package de remodelage, mais il semble que certaines choses ne me soient …
Disons par exemple que vous faites un modèle linéaire, mais les données sont complexes.yyy y= x β+ ϵy=xβ+ϵ y = x \beta + \epsilon Mon ensemble de données est complexe, comme dans tous les nombres en sont de la forme ( a + b i ) . Y a-t-il quelque …
Je travaille avec un grand ensemble de données (confidentiel, donc je ne peux pas trop en partager), et suis arrivé à la conclusion qu'une régression binomiale négative serait nécessaire. Je n'ai jamais fait de régression glm auparavant et je ne trouve aucune information claire sur les hypothèses. Sont-ils les mêmes …
Une étape de prétraitement courante pour les algorithmes d'apprentissage automatique est le blanchiment des données. Il semble qu'il soit toujours bon de faire du blanchiment car il corréle les données, ce qui le rend plus simple à modéliser. Quand le blanchiment n'est-il pas recommandé? Remarque: je fais référence à la …
J'essaie d'effectuer une régression multiple dans R. Cependant, ma variable dépendante a le tracé suivant: Voici une matrice de nuage de points avec toutes mes variables ( WARest la variable dépendante): Je sais que je dois effectuer une transformation sur cette variable (et éventuellement les variables indépendantes?) Mais je ne …
Fermé. Cette question est hors sujet . Il n'accepte pas actuellement de réponses. Voulez-vous améliorer cette question? Mettez à jour la question afin qu'elle soit sur le sujet pour la validation croisée. Fermé il y a 6 ans . Je voudrais effectuer la mnormalisation colonne par colonne d'une matrice dans …
J'ai déjà utilisé Forecast Pro pour prévoir des séries chronologiques univariées, mais je passe mon flux de travail à R. Le package de prévisions pour R contient beaucoup de fonctions utiles, mais une chose qu'il ne fait pas est une sorte de transformation de données avant d'exécuter auto .arima (). …
Ma variable dépendante ci-dessous ne correspond à aucune distribution de stock que je sache. La régression linéaire produit des résidus quelque peu anormaux et asymétriques à droite qui se rapportent au Y prédit de manière étrange (2e graphique). Avez-vous des suggestions de transformations ou d'autres façons d'obtenir les résultats les …
Je comprends la logique du codage pour l'analyse des données. Ma question ci-dessous concerne l'utilisation d'un code spécifique. Y a-t-il une raison pour laquelle le sexe est souvent codé 0 pour les femmes et 1 pour les hommes? Pourquoi ce codage est-il considéré comme «standard»? Comparez cela avec Femelle = …
L'apprentissage automatique (ML) utilise fortement les techniques de régression linéaire et logistique. Elle repose également sur des techniques d'ingénierie (fonction feature transform, kerneletc.). Pourquoi rien au sujet variable transformation(par exemple power transformation) mentionné dans ML? (Par exemple, je n'ai jamais entendu parler de la prise de racine ou du journal …
Je recherche une étude de cas de régression linéaire avancée illustrant les étapes nécessaires pour modéliser des relations non linéaires complexes et multiples à l'aide de GLM ou OLS. Il est étonnamment difficile de trouver des ressources allant au-delà des exemples d'école de base: la plupart des livres que j'ai …
Je travaille sur un algorithme qui repose sur le fait que les observations sont normalement distribuées, et je voudrais tester empiriquement la robustesse de l'algorithme à cette hypothèse.OuiOuiY Pour ce faire, je cherchais une suite de transformations qui perturberait progressivement la normalité de . Par exemple, si les sont normaux, …
J'utilise la quatrième 1/4transformation de puissance root ( ) sur ma variable de réponse, en raison de l'hétéroscédasticité. Mais maintenant, je ne sais pas comment interpréter mes coefficients de régression. Je suppose que j'aurais besoin de prendre les coefficients à la quatrième puissance lors de la rétrotransformation (voir ci-dessous la …
J'ai construit un indice de capital social en utilisant la technique PCA. Cet indice comprend des valeurs à la fois positives et négatives. Je veux transformer / convertir cet index en échelle 0-100 pour le rendre facile à interpréter. Veuillez me suggérer un moyen le plus simple de le faire.
La désaisonnalisation est une étape cruciale du prétraitement des données pour de plus amples recherches. Le chercheur a cependant un certain nombre d'options pour la décomposition tendance-cycle-saisonnière. Les méthodes de décomposition saisonnières rivales les plus courantes (à en juger par le nombre de citations dans la littérature empirique) sont X-11 …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.