Les résidus d'un modèle sont les valeurs réelles moins les valeurs prévues. De nombreux modèles statistiques font des hypothèses sur l'erreur, qui est estimée par les résidus.
En regardant les définitions Wikipedia de: Erreur quadratique moyenne (MSE) Somme résiduelle des carrés (RSS) Il me semble que MSE=1NRSS=1N∑(fi−yi)2MSE=1NRSS=1N∑(fi−yi)2\text{MSE} = \frac{1}{N} \text{RSS} = \frac{1}{N} \sum (f_i -y_i)^2 où est le nombre d'échantillons et est notre estimation de .NNNfifif_iyiyiy_i Cependant, aucun des articles de Wikipédia ne mentionne cette relation. Pourquoi? …
Cela ressemble à une question similaire et n'a pas reçu beaucoup de réponses. En omettant des tests tels que Cook's D, et en regardant simplement les résidus en tant que groupe, je suis intéressé par la façon dont les autres utilisent les résidus lors de l'évaluation de la qualité de …
Lorsque j'utilise GAM, cela me donne un DF résiduel de (dernière ligne du code). Qu'est-ce que ça veut dire? Au-delà de l'exemple GAM, en général, le nombre de degrés de liberté peut-il être un nombre non entier?26.626.626.6 > library(gam) > summary(gam(mpg~lo(wt),data=mtcars)) Call: gam(formula = mpg ~ lo(wt), data = mtcars) …
J'ai appris que je dois tester la normalité non pas sur les données brutes mais sur leurs résidus. Dois-je calculer les résidus et ensuite faire le test W de Shapiro-Wilk? Les résidus sont-ils calculés comme : ?Xje- méchantXi−meanX_i - \text{mean} Veuillez consulter cette question précédente pour mes données et la …
En régression linéaire multiple, je peux comprendre que les corrélations entre le résidu et les prédicteurs sont nulles, mais quelle est la corrélation attendue entre le résiduel et la variable critère? Doit-on s'attendre à ce qu'il soit nul ou fortement corrélé? Quelle est la signification de cela?
J'ai actuellement du mal à trouver le bon modèle pour les données de comptage difficiles (variable dépendante). J'ai essayé différents modèles (des modèles à effets mixtes sont nécessaires pour mon type de données) tels que lmeret lme4(avec une transformation logarithmique) ainsi que des modèles à effets mixtes linéaires généralisés avec …
Je suis un peu confus quant aux hypothèses de régression linéaire. Jusqu'à présent, j'ai vérifié si: toutes les variables explicatives étaient corrélées linéairement avec la variable de réponse. (C'était le cas) il y avait une colinéarité entre les variables explicatives. (il y avait peu de colinéarité). les distances Cook des …
Gelman et Hill (2006) écrivent à la p46 que: L'hypothèse de régression qui est généralement la moins importante est que les erreurs sont normalement distribuées. En fait, aux fins de l'estimation de la droite de régression (par rapport à la prévision de points de données individuels), l'hypothèse de normalité est …
Je me suis récemment lancé dans l'ajustement de modèles mixtes de régression dans le cadre bayésien, en utilisant un algorithme MCMC (fonction MCMCglmm dans R en fait). Je crois avoir compris comment diagnostiquer la convergence du processus d'estimation (trace, tracé de geweke, autocorrélation, distribution postérieure ...). L'une des choses qui …
Selon un texte que j'utilise, la formule de la variance du ithithi^{th} résiduel est donnée par: σ2(1−1n−(xi−x¯¯¯)2Sxx)σ2(1−1n−(xi−x¯)2Sxx)\sigma^2\left ( 1-\frac{1}{n}-\frac{(x_{i}-\overline{x})^2}{S_{xx}} \right ) Je trouve cela difficile à croire car le ithithi^{th} résiduel est la différence entre la ithithi^{th} valeur observée et la ithithi^{th} valeur ajustée; si l'on devait calculer la variance …
Nous définissons une architecture de goulot d'étranglement comme le type trouvé dans le document ResNet où [deux couches conv 3x3] sont remplacées par [une conv 1x1, une conv 3x3 et une autre couche conv 1x1]. Je comprends que les couches conv 1x1 sont utilisées comme une forme de réduction de …
Wikipedia et la vignette du package sandwich R donnent de bonnes informations sur les hypothèses supportant les erreurs standard des coefficients OLS et le contexte mathématique des estimateurs sandwich. Je ne sais toujours pas comment le problème de l'hétéroscédasticité résiduelle est abordé, probablement parce que je ne comprends pas complètement …
Dans le contexte de la régression OLS, je comprends qu'un tracé résiduel (vs valeurs ajustées) est conventionnellement considéré pour tester la variance constante et évaluer la spécification du modèle. Pourquoi les résidus sont-ils tracés par rapport aux ajustements, et non par les valeurs ? En quoi les informations diffèrent-elles de …
Bien que ces deux termes omniprésents soient souvent utilisés comme synonymes, il semble parfois y avoir une distinction. Y a-t-il effectivement une différence, ou sont-ils exactement synonymes?
J'ai un GLMM avec une distribution binomiale et une fonction de lien logit et j'ai le sentiment qu'un aspect important des données n'est pas bien représenté dans le modèle. Pour tester cela, je voudrais savoir si les données sont bien décrites par une fonction linéaire sur l'échelle logit. Par conséquent, …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.