Questions marquées «assumptions»

Désigne les conditions dans lesquelles une procédure statistique produit des estimations et / ou des inférences valides. Par exemple, de nombreuses techniques statistiques nécessitent l'hypothèse que les données sont échantillonnées au hasard d'une manière ou d'une autre. Les résultats théoriques sur les estimateurs nécessitent généralement des hypothèses sur le mécanisme de génération des données.

1
Pourquoi les erreurs non distribuées normalement compromettent-elles la validité de nos déclarations de signification?
Il y a une hypothèse de normalité quand il s'agit de considérer les modèles OLS et c'est que les erreurs soient normalement distribuées. J'ai parcouru Cross Validated et il semble que Y et X ne doivent pas être normaux pour que les erreurs soient normales. Ma question est pourquoi, lorsque …

1
Étude de la robustesse de la régression logistique contre la violation de la linéarité du logit
Je procède à une régression logistique avec un résultat binaire (démarrage et non démarrage). Ma combinaison de prédicteurs sont toutes des variables continues ou dichotomiques. En utilisant l'approche Box-Tidwell, l'un de mes prédicteurs continus viole potentiellement l'hypothèse de linéarité du logit. Rien dans les statistiques de qualité de l'ajustement n'indique …






1
R régression linéaire variable catégorielle valeur «cachée»
Ceci est juste un exemple que j'ai rencontré plusieurs fois, donc je n'ai pas d'échantillons de données. Exécution d'un modèle de régression linéaire dans R: a.lm = lm(Y ~ x1 + x2) x1est une variable continue. x2est catégorique et a trois valeurs, par exemple "Low", "Medium" et "High". Cependant, la …
10 r  regression  categorical-data  regression-coefficients  categorical-encoding  machine-learning  random-forest  anova  spss  r  self-study  bootstrap  monte-carlo  r  multiple-regression  partitioning  neural-networks  normalization  machine-learning  svm  kernel-trick  self-study  survival  cox-model  repeated-measures  survey  likert  correlation  variance  sampling  meta-analysis  anova  independence  sample  assumptions  bayesian  covariance  r  regression  time-series  mathematical-statistics  graphical-model  machine-learning  linear-model  kernel-trick  linear-algebra  self-study  moments  function  correlation  spss  probability  confidence-interval  sampling  mean  population  r  generalized-linear-model  prediction  offset  data-visualization  clustering  sas  cart  binning  sas  logistic  causality  regression  self-study  standard-error  r  distributions  r  regression  time-series  multiple-regression  python  chi-squared  independence  sample  clustering  data-mining  rapidminer  probability  stochastic-processes  clustering  binary-data  dimensionality-reduction  svd  correspondence-analysis  data-visualization  excel  c#  hypothesis-testing  econometrics  survey  rating  composite  regression  least-squares  mcmc  markov-process  kullback-leibler  convergence  predictive-models  r  regression  anova  confidence-interval  survival  cox-model  hazard  normal-distribution  autoregressive  mixed-model  r  mixed-model  sas  hypothesis-testing  mediation  interaction 

3
Quelles sont les conséquences d'une variance non constante des termes d'erreur dans la régression linéaire?
L'une des hypothèses de régression linéaire est qu'il devrait y avoir une variance constante dans les termes d'erreur et que les intervalles de confiance et les tests d'hypothèse associés au modèle reposent sur cette hypothèse. Que se passe-t-il exactement lorsque les termes d'erreur n'ont pas de variance constante?

2
Les hypothèses des moindres carrés
Supposons la relation linéaire suivante: , où est la variable dépendante, une seule variable indépendante et le terme d'erreur.Y i X i u iOuije= β0+ β1Xje+ ujeYi=β0+β1Xi+uiY_i = \beta_0 + \beta_1 X_i + u_iOuijeYiY_iXjeXiX_iujeuiu_i Selon Stock & Watson (Introduction à l'économétrie; chapitre 4 ), la troisième hypothèse des moindres carrés …

1
Quand est-il OK d'écrire «nous avons supposé une distribution normale» d'une mesure empirique?
Il est ancré dans l'enseignement des disciplines appliquées, comme la médecine, que les mesures des quantités biomédicales dans la population suivent une «courbe en cloche» normale. Une recherche Google de la chaîne "nous avons supposé une distribution normale" renvoie résultats! Ils sonnent comme «étant donné le petit nombre de points …

2
Quelle est la différence entre ces deux tests de Breusch-Pagan?
En utilisant R sur certaines données et en essayant de voir si mes données sont hétéroscédastiques, j'ai trouvé deux implémentations du test de Breusch-Pagan, bptest (package lmtest) et ncvTest (package car). Cependant, ceux-ci produisent des résultats différents. Quelle est la différence entre les deux? Quand devriez-vous choisir d'utiliser l'un ou …


2
Comment les résidus sont-ils liés aux perturbations sous-jacentes?
Dans la méthode des moindres carrés, nous voulons estimer les paramètres inconnus dans le modèle: Yj=α+βxj+εj(j=1...n)Yj=α+βxj+εj(j=1...n)Y_j = \alpha + \beta x_j + \varepsilon_j \enspace (j=1...n) Une fois que nous avons fait cela (pour certaines valeurs observées), nous obtenons la droite de régression ajustée: Yj=α^+β^x+ej(j=1,...n)Yj=α^+β^x+ej(j=1,...n)Y_j = \hat{\alpha} + \hat{\beta}x +e_j \enspace …

2
Vérification de l'hypothèse de cotes proportionnelles dans une régression logistique ordinale à l'aide de la fonction polr
J'ai utilisé la fonction «polr» dans le package MASS pour exécuter une régression logistique ordinale pour une variable de réponse catégorielle ordinale avec 15 variables explicatives continues. J'ai utilisé le code (illustré ci-dessous) pour vérifier que mon modèle répond à l'hypothèse de cotes proportionnelles en suivant les conseils fournis dans …

En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.