Questions marquées «data-transformation»

Ré-expression mathématique, souvent non linéaire, des valeurs de données. Les données sont souvent transformées soit pour répondre aux hypothèses d'un modèle statistique, soit pour rendre les résultats d'une analyse plus interprétables.

4
Box Cox se transforme pour la régression
J'essaie d'adapter un modèle linéaire sur certaines données avec un seul prédicteur (disons (x, y)). Les données sont telles que pour les petites valeurs de x, les valeurs y donnent un ajustement serré à une ligne droite, mais à mesure que les valeurs x augmentent, les valeurs y deviennent plus …

2


1
Comment combiner les prévisions lorsque la variable de réponse dans les modèles de prévision était différente?
introduction A jeCjAICjAIC_jjjjA jeCjAICjAIC_j R P j = e ( A I C ∗ - A I C j ) / 2 jA jeC∗= minjA jeCjAIC∗=minjAICjAIC^* = \min_j{AIC_j}R Pj= e( A IC∗- A ICj) / 2RPj=e(AIC∗−AICj)/2RP_j = e^{(AIC^*-AIC_j)/2}jjj wj= R Pj∑jR Pjwj=RPj∑jRPjw_j = \frac{RP_j}{\sum_j RP_j} Problème Une difficulté que j'essaie …



7
Distribution normale et transformations monotones
J'ai entendu dire que de nombreuses quantités présentes dans la nature sont normalement distribuées. Ceci est généralement justifié en utilisant le théorème de la limite centrale, qui dit que lorsque vous faites la moyenne d'un grand nombre de variables aléatoires iid, vous obtenez une distribution normale. Ainsi, par exemple, un …




4
La valeur absolue d'une série stationnaire est-elle également stationnaire?
Je sais que les transformations linéaires des séries temporelles résultant de processus (faiblement) stationnaires sont également stationnaires. Est-ce vrai, cependant, pour une transformation d'une série en prenant également la valeur absolue de chaque élément? En d'autres termes, si est stationnaire, alors stationnaire?{xi,i∈N}{Xje,je∈N}\{x_i,i\in\mathbb{N}\}{|xi|,i∈N}{|Xje|,je∈N}\{|x_i|,i\in\mathbb{N}\}


3
Comment effectuer une SVD pour imputer des valeurs manquantes, un exemple concret
J'ai lu les excellents commentaires sur la façon de traiter les valeurs manquantes avant d'appliquer SVD, mais j'aimerais savoir comment cela fonctionne avec un exemple simple: Movie1 Movie2 Movie3 User1 5 4 User2 2 5 5 User3 3 4 User4 1 5 User5 5 1 5 Étant donné la matrice …
8 r  missing-data  data-imputation  svd  sampling  matlab  mcmc  importance-sampling  predictive-models  prediction  algorithms  graphical-model  graph-theory  r  regression  regression-coefficients  r-squared  r  regression  modeling  confounding  residuals  fitting  glmm  zero-inflation  overdispersion  optimization  curve-fitting  regression  time-series  order-statistics  bayesian  prior  uninformative-prior  probability  discrete-data  kolmogorov-smirnov  r  data-visualization  histogram  dimensionality-reduction  classification  clustering  accuracy  semi-supervised  labeling  state-space-models  t-test  biostatistics  paired-comparisons  paired-data  bioinformatics  regression  logistic  multiple-regression  mixed-model  random-effects-model  neural-networks  error-propagation  numerical-integration  time-series  missing-data  data-imputation  probability  self-study  combinatorics  survival  cox-model  statistical-significance  wilcoxon-mann-whitney  hypothesis-testing  distributions  normal-distribution  variance  t-distribution  probability  simulation  random-walk  diffusion  hypothesis-testing  z-test  hypothesis-testing  data-transformation  lognormal  r  regression  agreement-statistics  classification  svm  mixed-model  non-independent  observational-study  goodness-of-fit  residuals  confirmatory-factor  neural-networks  deep-learning 

3
Trouvez la distribution et passez à la distribution normale
J'ai des données qui décrivent la fréquence à laquelle un événement se produit pendant une heure ("nombre par heure", nph) et la durée des événements ("durée en secondes par heure", dph). Ce sont les données d'origine: nph <- c(2.50000000003638, 3.78947368414551, 1.51456310682008, 5.84686774940732, 4.58823529414907, 5.59999999993481, 5.06666666666667, 11.6470588233699, 1.99999999998209, NA, 4.46153846149851, 18, …
8 normal-distribution  data-transformation  logistic  generalized-linear-model  ridge-regression  t-test  wilcoxon-signed-rank  paired-data  naive-bayes  distributions  logistic  goodness-of-fit  time-series  eviews  ecm  panel-data  reliability  psychometrics  validity  cronbachs-alpha  self-study  random-variable  expected-value  median  regression  self-study  multiple-regression  linear-model  forecasting  prediction-interval  normal-distribution  excel  bayesian  multivariate-analysis  modeling  predictive-models  canonical-correlation  rbm  time-series  machine-learning  neural-networks  fishers-exact  factorisation-theorem  svm  prediction  linear  reinforcement-learning  cdf  probability-inequalities  ecdf  time-series  kalman-filter  state-space-models  dynamic-regression  index-decomposition  sampling  stratification  cluster-sample  survey-sampling  distributions  maximum-likelihood  gamma-distribution 


En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.