Questions marquées «r-squared»

Le coefficient de détermination, généralement symbolisé par R2, est la proportion de la variance de réponse totale expliquée par un modèle de régression. Peut également être utilisé pour divers pseudo-R au carré proposés, par exemple pour la régression logistique (et d'autres modèles.)

6
Est utiles ou dangereux?
J'ai parcouru quelques notes de cours de Cosma Shalizi (en particulier, la section 2.1.1 de la deuxième leçon ), et il m'a été rappelé que vous pouvez obtenir un très faible même avec un modèle complètement linéaire.R2R2R^2 Pour paraphraser l'exemple de Shalizi: supposons que vous ayez un modèle , où …

9
Quand est-il possible de supprimer l'interception dans un modèle de régression linéaire?
J'utilise des modèles de régression linéaire et me demande quelles sont les conditions pour supprimer le terme d'interception. En comparant les résultats de deux régressions différentes où l’une a l’interception et l’autre pas, je remarque que le de la fonction sans interception est beaucoup plus élevé. Y a-t-il certaines conditions …

2
L'élimination du terme d'interception statistiquement significatif augmente dans le modèle linéaire
Dans un modèle linéaire simple avec une seule variable explicative, αi=β0+β1δi+ϵiαi=β0+β1δi+ϵi\alpha_i = \beta_0 + \beta_1 \delta_i + \epsilon_i Je trouve que la suppression du terme d'interception améliore grandement l'ajustement (la valeur de va de 0,3 à 0,9). Cependant, le terme d'interception semble être statistiquement significatif.R2R2R^2 Avec interception: Call: lm(formula = …

3
Quand R carré est-il négatif?
D'après ce que je comprends, ne peut pas être négatif car c'est le carré de R. Cependant, j'ai exécuté une régression linéaire simple dans SPSS avec une seule variable indépendante et une variable dépendante. Ma sortie SPSS me donne une valeur négative pour . Si je devais calculer cela manuellement …

7
Quelle mesure pseudo- est celle à déclarer pour la régression logistique (Cox & Snell ou Nagelkerke)?
J'ai une SPSSsortie pour un modèle de régression logistique. La sortie indique deux mesures pour l'ajustement du modèle, Cox & Snellet Nagelkerke. Donc, en règle générale, laquelle de ces mesures R2R²R^² rapporteriez-vous comme ajustement du modèle? Ou, lequel de ces indices d'ajustement est celui qui est habituellement rapporté dans les …

3
Interprétation du prédicteur et / ou de la réponse transformé par log
Je me demande si cela fait une différence d'interprétation si seules les variables dépendantes, indépendantes et dépendantes, ou uniquement les variables indépendantes sont transformées par un journal. Considérons le cas de log(DV) = Intercept + B1*IV + Error Je peux interpréter l'IV comme l'augmentation en pourcentage, mais comment cela change-t-il …
46 regression  data-transformation  interpretation  regression-coefficients  logarithm  r  dataset  stata  hypothesis-testing  contingency-tables  hypothesis-testing  statistical-significance  standard-deviation  unbiased-estimator  t-distribution  r  functional-data-analysis  maximum-likelihood  bootstrap  regression  change-point  regression  sas  hypothesis-testing  bayesian  randomness  predictive-models  nonparametric  terminology  parametric  correlation  effect-size  loess  mean  pdf  quantile-function  bioinformatics  regression  terminology  r-squared  pdf  maximum  multivariate-analysis  references  data-visualization  r  pca  r  mixed-model  lme4-nlme  distributions  probability  bayesian  prior  anova  chi-squared  binomial  generalized-linear-model  anova  repeated-measures  t-test  post-hoc  clustering  variance  probability  hypothesis-testing  references  binomial  profile-likelihood  self-study  excel  data-transformation  skewness  distributions  statistical-significance  econometrics  spatial  r  regression  anova  spss  linear-model 

5
Relation entre
Disons que j'ai deux tableaux à dimension, un 1a1a1a_1 et . Chacun contient 100 points de données. correspond aux données réelles et la prédiction du modèle. Dans ce cas, la valeur de serait: Entre-temps, cela serait égal à la valeur carrée du coefficient de corrélation, Maintenant, si j'échange les deux: …

1
calculé manuellement ne correspond pas à randomForest () pour tester de nouvelles données
Je sais que cette question est assez spécifique R, mais je pense peut-être à la variance des proportions expliquée, , de manière incorrecte. Voici.R2R2R^2 J'essaie d'utiliser le Rpaquet randomForest. J'ai des données d'entraînement et des données de test. Lorsque j'adapte un modèle de forêt aléatoire, la randomForestfonction vous permet de …

2
Quelle est la formule du R-carré ajustée dans lm dans R et comment doit-elle être interprétée?
Quelle est la formule exacte utilisée dans R lm() pour le R au carré ajusté? Comment puis-je l'interpréter? Formules ajustées au carré Il semble exister plusieurs formules pour calculer le R au carré ajusté. Formule de Wherry: 1−(1−R2)(n−1)(n−v)1−(1−R2)(n−1)(n−v)1-(1-R^2)\frac{(n-1)}{(n-v)} La formule de McNemar: 1−(1−R2)(n−1)(n−v−1)1−(1−R2)(n−1)(n−v−1)1-(1-R^2)\frac{(n-1)}{(n-v-1)} Formule du Seigneur: 1−(1−R2)(n+v−1)(n−v−1)1−(1−R2)(n+v−1)(n−v−1)1-(1-R^2)\frac{(n+v-1)}{(n-v-1)} Formule de Stein: …

1
Quelle est la différence entre «coefficient de détermination» et «erreur quadratique moyenne»?
Pour le problème de régression, j'ai vu des gens utiliser le «coefficient de détermination» (alias R au carré) pour effectuer la sélection du modèle, par exemple pour trouver le coefficient de pénalité approprié pour la régularisation. Cependant, il est également courant d'utiliser "l'erreur quadratique moyenne" ou "l'erreur quadratique moyenne" comme …

5
Comment gérer les données hiérarchiques / imbriquées dans l'apprentissage automatique
Je vais expliquer mon problème avec un exemple. Supposons que vous souhaitiez prédire le revenu d'un individu en fonction de certains attributs: {âge, sexe, pays, région, ville}. Vous avez un ensemble de données de formation comme ça train <- data.frame(CountryID=c(1,1,1,1, 2,2,2,2, 3,3,3,3), RegionID=c(1,1,1,2, 3,3,4,4, 5,5,5,5), CityID=c(1,1,2,3, 4,5,6,6, 7,7,7,8), Age=c(23,48,62,63, 25,41,45,19, …
29 regression  machine-learning  multilevel-analysis  correlation  dataset  spatial  paired-comparisons  cross-correlation  clustering  aic  bic  dependent-variable  k-means  mean  standard-error  measurement-error  errors-in-variables  regression  multiple-regression  pca  linear-model  dimensionality-reduction  machine-learning  neural-networks  deep-learning  conv-neural-network  computer-vision  clustering  spss  r  weighted-data  wilcoxon-signed-rank  bayesian  hierarchical-bayesian  bugs  stan  distributions  categorical-data  variance  ecology  r  survival  regression  r-squared  descriptive-statistics  cross-section  maximum-likelihood  factor-analysis  likert  r  multiple-imputation  propensity-scores  distributions  t-test  logit  probit  z-test  confidence-interval  poisson-distribution  deep-learning  conv-neural-network  residual-networks  r  survey  wilcoxon-mann-whitney  ranking  kruskal-wallis  bias  loss-functions  frequentist  decision-theory  risk  machine-learning  distributions  normal-distribution  multivariate-analysis  inference  dataset  factor-analysis  survey  multilevel-analysis  clinical-trials 


2
Quelle est la distribution de en régression linéaire sous l'hypothèse nulle? Pourquoi son mode n'est-il pas nul lorsque ?
Quelle est la distribution du coefficient de détermination, ou R au carré, , en régression multiple univariée linéaire sous l'hypothèse nulle ?R 2 R2R^2H 0 : β = 0H0:β=0H_0:\beta=0 Comment cela dépend-il du nombre de prédicteurs et du nombre d'échantillons ? Existe-t-il une expression de forme fermée pour le mode …



En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.