Questions marquées «regression»

Techniques d'analyse de la relation entre une (ou plusieurs) variables "dépendantes" et des variables "indépendantes".

4
Interprétation du pseudo-R2 de McFadden
J'ai un modèle de régression logistique binaire avec un pseudo-R de McFadden de 0,192 avec une variable dépendante appelée paiement (1 = paiement et 0 = pas de paiement). Quelle est l'interprétation de ce pseudo R au carré? S'agit-il d'une comparaison relative pour les modèles imbriqués (par exemple, un modèle …




3


1
Dans quelle mesure un modèle de régression est-il incorrect lorsque les hypothèses ne sont pas remplies?
Lors de l'ajustement d'un modèle de régression, que se passe-t-il si les hypothèses des résultats ne sont pas remplies, en particulier: Que se passe-t-il si les résidus ne sont pas homoscédastiques? Si les résidus montrent une tendance à la hausse ou à la baisse dans les résidus par rapport au …


5
Quels sont les dangers de violer l'hypothèse d'homoscédasticité pour la régression linéaire?
À titre d'exemple, considérons l' ChickWeightensemble de données dans R. La variance augmente évidemment avec le temps, donc si j'utilise une régression linéaire simple comme: m <- lm(weight ~ Time*Diet, data=ChickWeight) Mes questions: Quels aspects du modèle seront discutables? Les problèmes se limitent-ils à extrapoler en dehors de la Timeplage? …


1
Calcul de la répétabilité des effets d'un modèle lmer
Je viens de tomber sur cet article , qui décrit comment calculer la répétabilité (aka fiabilité, aka corrélation intraclasse) d'une mesure via la modélisation d'effets mixtes. Le code R serait: #fit the model fit = lmer(dv~(1|unit),data=my_data) #obtain the variance estimates vc = VarCorr(fit) residual_var = attr(vc,'sc')^2 intercept_var = attr(vc$id,'stddev')[1]^2 #compute …
28 mixed-model  reliability  intraclass-correlation  repeatability  spss  factor-analysis  survey  modeling  cross-validation  error  curve-fitting  mediation  correlation  clustering  sampling  machine-learning  probability  classification  metric  r  project-management  optimization  svm  python  dataset  quality-control  checking  clustering  distributions  anova  factor-analysis  exponential  poisson-distribution  generalized-linear-model  deviance  machine-learning  k-nearest-neighbour  r  hypothesis-testing  t-test  r  variance  levenes-test  bayesian  software  bayesian-network  regression  repeated-measures  least-squares  change-scores  variance  chi-squared  variance  nonlinear-regression  regression-coefficients  multiple-comparisons  p-value  r  statistical-significance  excel  sampling  sample  r  distributions  interpretation  goodness-of-fit  normality-assumption  probability  self-study  distributions  references  theory  time-series  clustering  econometrics  binomial  hypothesis-testing  variance  t-test  paired-comparisons  statistical-significance  ab-test  r  references  hypothesis-testing  t-test  normality-assumption  wilcoxon-mann-whitney  central-limit-theorem  t-test  data-visualization  interactive-visualization  goodness-of-fit 


6
Pourquoi avons-nous besoin d'une régression multivariée (par opposition à un tas de régressions univariées)?
Je viens de parcourir ce merveilleux livre: Analyse statistique multivariée appliquée par Johnson et Wichern . L'ironie est que je ne suis toujours pas en mesure de comprendre la motivation pour utiliser des modèles multivariés (régression) au lieu de modèles univariés (régression) séparés. J'ai parcouru les publications stats.statexchange 1 et …

3
Pourquoi le centrage de variables indépendantes pourrait-il modifier les principaux effets avec modération?
J'ai une question liée à la régression multiple et à l'interaction, inspirée de ce fil de CV: terme d'interaction utilisant une analyse de régression hiérarchique à variables centrées? Quelles variables devons-nous centrer? Lorsque je vérifie un effet de modération, je centre mes variables indépendantes et je multiplie les variables centrées …

3
Pourquoi RSS est-il distribué chi carré times np?
Je voudrais comprendre pourquoi, sous le modèle OLS, le RSS (somme résiduelle des carrés) est distribué χ2⋅(n−p)χ2⋅(n−p)\chi^2\cdot (n-p) ( ppp étant le nombre de paramètres dans le modèle, le nombre d'observations).nnn Je m'excuse d'avoir posé une question aussi fondamentale, mais il semble que je ne puisse pas trouver la réponse …

En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.