Les résidus d'un modèle sont les valeurs réelles moins les valeurs prévues. De nombreux modèles statistiques font des hypothèses sur l'erreur, qui est estimée par les résidus.
Lors de la régression linéaire multiple OLS, plutôt que de tracer les résidus par rapport aux valeurs ajustées, je trace les résidus Studentized (internes) par rapport aux valeurs ajustées (idem pour les covariables). Ces résidus sont définis comme: e∗je= ejes2( 1 - hje je)---------√eje∗=ejes2(1-hjeje)\begin{equation} e^*_i = \frac{e_i}{\sqrt{s^2 (1-h_{ii})}} \end{equation} où …
Supposons que nous ayons un modèle .Yi=β0+β1Xi1+β2Xi2+⋯+βkXik+ϵiYi=β0+β1Xi1+β2Xi2+⋯+βkXik+ϵiY_i = \beta_0 + \beta_1X_{i1} + \beta_2X_{i2} + \dots + \beta_kX_{ik} + \epsilon_i La régression a un certain nombre d'hypothèses, telles que les erreurs devraient être normalement distribuées avec un zéro moyen et une variance constante. On m'a appris à vérifier ces hypothèses en …
Je suis tombé sur le terme inlier dans la mesure LOF (Local Outlier Factor), je connais bien le terme de valeurs aberrantes (enfin essentiellement des menteurs - des instances qui ne se comportent pas comme les autres instances). Que signifie «Inliers» dans le contexte de la détection d'anomalies? et comment …
Les «résidus étudiés» et les «résidus standardisés» sont-ils les mêmes dans les modèles de régression? J'ai construit un modèle de régression linéaire dans R et je voulais tracer le graphique des valeurs ajustées v / s des résidus Studentized, mais je n'ai pas trouvé de moyen automatisé de le faire …
Tout d'abord: D'après ce que j'ai compris, les résidus d'amorçage fonctionnent comme suit: Adapter le modèle aux données Calculez les résidus Rééchantillonnez les résidus et ajoutez-les à 1. Ajuster le modèle au nouvel ensemble de données à partir de 3. Répétez les ntemps, mais ajoutez toujours les résidus rééchantillonnés à …
C'est assez difficile à décrire pour moi, mais je vais essayer de rendre mon problème compréhensible. Donc, vous devez d'abord savoir que j'ai fait une régression linéaire très simple jusqu'à présent. Avant d'estimer le coefficient, j'ai regardé la distribution de mon . Il est lourd gauche asymétrique. Après avoir estimé …
Avec la régression OLS appliquée à la réponse continue, on peut construire l'équation de régression multiple en exécutant séquentiellement des régressions des résidus sur chaque covariable. Ma question est, existe-t-il un moyen de le faire avec la régression logistique via les résidus de régression logistique ? Pr(Y=1|x,z)Pr(Y=1|x,z)\Pr(Y = 1 | …
Je voudrais classer les points de données comme ayant besoin d'un modèle plus complexe ou n'ayant pas besoin d'un modèle plus complexe. Ma pensée actuelle est d'adapter toutes les données à un modèle linéaire simple et d'observer la taille des résidus pour faire cette classification. J'ai ensuite fait quelques lectures …
Dans la méthode des moindres carrés, nous voulons estimer les paramètres inconnus dans le modèle: Yj=α+βxj+εj(j=1...n)Yj=α+βxj+εj(j=1...n)Y_j = \alpha + \beta x_j + \varepsilon_j \enspace (j=1...n) Une fois que nous avons fait cela (pour certaines valeurs observées), nous obtenons la droite de régression ajustée: Yj=α^+β^x+ej(j=1,...n)Yj=α^+β^x+ej(j=1,...n)Y_j = \hat{\alpha} + \hat{\beta}x +e_j \enspace …
J'ai un ensemble de données avec deux variables nominales catégorielles (les deux avec 5 catégories). Je voudrais savoir si (et comment) je suis capable d'identifier des corrélations potentielles entre les catégories de ces deux variables. En d'autres termes, si par exemple les résultats de la catégorie dans la variable 1 …
J'utilise PROC GLM dans SAS pour ajuster une équation de régression de la forme suivante Oui= b0+ b1X1+ b2X2+ b3X3+ b4tOui=b0+b1X1+b2X2+b3X3+b4t Y = b_0 + b_1X_1 + b_2X_2 + b_3X_3 + b_4t Le tracé QQ des résidus rouges résultants indique un écart par rapport à la normalité. Toute transformation de …
Selon l' analyse de régression par exemple , le résidu est la différence entre la réponse et la valeur prédite, puis il est dit que chaque résidu a une variance différente, nous devons donc considérer des résidus normalisés. Mais la variance concerne un groupe de valeurs, comment une seule valeur …
Dans R, pourquoi les paramètres par défaut qqplot(linear model)utilisent-ils les résidus normalisés sur l'axe des y? Pourquoi R n'utilise-t-il pas les résidus "réguliers"?
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.