Questions marquées «data-transformation»

Ré-expression mathématique, souvent non linéaire, des valeurs de données. Les données sont souvent transformées soit pour répondre aux hypothèses d'un modèle statistique, soit pour rendre les résultats d'une analyse plus interprétables.


2
Test de Bartlett vs test de Levene
J'essaie actuellement d'adresser les violations aux hypothèses de l'ANOVA. J'ai utilisé Shapiro-Wilk pour tester la normalité et j'ai essayé le test de Levene et le test d'égalité de variance de Bartlett. Depuis lors, j'ai transformé mes données pour essayer de remédier aux inégalités. J'ai relancé le test de Bartlett sur …


3
Sont ces formules de transformation P, LSD, MSD, HSD, CI, à SE comme une estimation exacte ou gonflé / conservateur de
Contexte Je mène une méta-analyse qui inclut des données publiées précédemment. Souvent, les différences entre les traitements sont signalées avec les valeurs P, les différences les moins significatives (LSD) et d'autres statistiques, mais ne fournissent aucune estimation directe de la variance. Dans le contexte du modèle que j'utilise, une surestimation …


1
Intervalles de confiance rétrotransformés
Ayant rencontré cette discussion, je soulève la question des conventions relatives aux intervalles de confiance rétrospectifs. Selon cet article, la couverture nominale CI rétrotransformée pour la moyenne d'une variable aléatoire log-normale est: UCL(X)=exp(Y+var(Y)2+zvar(Y)n+var(Y)22(n−1)−−−−−−−−−−−−√) UCL(X)=exp⁡(Y+var(Y)2+zvar(Y)n+var(Y)22(n−1))\ UCL(X)= \exp\left(Y+\frac{\text{var}(Y)}{2}+z\sqrt{\frac{\text{var}(Y)}{n}+\frac{\text{var}(Y)^2}{2(n-1)}}\right) LCL(X)=exp(Y+var(Y)2−zvar(Y)n+var(Y)22(n−1)−−−−−−−−−−−−√) LCL(X)=exp⁡(Y+var(Y)2−zvar(Y)n+var(Y)22(n−1))\ LCL(X)= \exp\left(Y+\frac{\text{var}(Y)}{2}-z\sqrt{\frac{\text{var}(Y)}{n}+\frac{\text{var}(Y)^2}{2(n-1)}}\right) / et non le naïf /exp((Y)+zvar(Y)−−−−−−√)exp⁡((Y)+zvar(Y))\exp((Y)+z\sqrt{\text{var}(Y)}) Maintenant, quels sont ces …




2
Regroupement de données de dénombrement très biaisées: des suggestions à faire (transformer, etc.)?
Problème de base Voici mon problème de base: j'essaie de regrouper un ensemble de données contenant des variables très asymétriques avec des nombres. Les variables contiennent de nombreux zéros et ne sont donc pas très informatives pour ma procédure de clustering - qui est probablement l'algorithme k-means. Très bien, dites-vous, …



2
Régression avec variable indépendante inverse
Supposons que j'ai un -vecteur Y de variables dépendantes et un N -vecteur X de variable indépendante. Lorsque Y est tracé contre 1NNNYOuiYNNNXXXYOuiY , je vois qu'il y a une relation linéaire (tendance à la hausse) entre les deux. Maintenant, cela aussi signifie qu'il ya une tendancebaisse linéaire entreYetX.1X1X\frac{1}{X}YYYXXX Maintenant, …

3
Comment la repondération des données sur la diversité de l'American Community Survey affecterait-elle ses marges d'erreur?
Contexte: Mon organisation compare actuellement ses statistiques sur la diversité de la main-d'œuvre (ex.% De personnes handicapées,% de femmes,% d'anciens combattants) à la disponibilité totale de main-d'œuvre pour ces groupes sur la base de l'American Community Survey (un projet d'arpentage du US Census Bureau). Il s'agit d'une référence inexacte, car …

1
Comment intégrer une valeur aberrante innovante à l'observation 48 dans mon modèle ARIMA?
Je travaille sur un ensemble de données. Après avoir utilisé certaines techniques d'identification de modèle, je suis sorti avec un modèle ARIMA (0,2,1). J'ai utilisé la detectIOfonction dans le package TSAen R pour détecter une valeur aberrante innovante (IO) à la 48e observation de mon ensemble de données d'origine. Comment …
10 r  time-series  arima  outliers  hypergeometric  fishers-exact  r  time-series  intraclass-correlation  r  logistic  glmm  clogit  mixed-model  spss  repeated-measures  ancova  machine-learning  python  scikit-learn  distributions  data-transformation  stochastic-processes  web  standard-deviation  r  machine-learning  spatial  similarities  spatio-temporal  binomial  sparse  poisson-process  r  regression  nonparametric  r  regression  logistic  simulation  power-analysis  r  svm  random-forest  anova  repeated-measures  manova  regression  statistical-significance  cross-validation  group-differences  model-comparison  r  spatial  model-evaluation  parallel-computing  generalized-least-squares  r  stata  fitting  mixture  hypothesis-testing  categorical-data  hypothesis-testing  anova  statistical-significance  repeated-measures  likert  wilcoxon-mann-whitney  boxplot  statistical-significance  confidence-interval  forecasting  prediction-interval  regression  categorical-data  stata  least-squares  experiment-design  skewness  reliability  cronbachs-alpha  r  regression  splines  maximum-likelihood  modeling  likelihood-ratio  profile-likelihood  nested-models 

En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.