Les résidus d'un modèle sont les valeurs réelles moins les valeurs prévues. De nombreux modèles statistiques font des hypothèses sur l'erreur, qui est estimée par les résidus.
Cette question découle de ma confusion réelle sur la façon de décider si un modèle logistique est assez bon. J'ai des modèles qui utilisent l'état des couples projet individuel deux ans après leur formation en tant que variable dépendante. Le résultat est réussi (1) ou non (0). J'ai des variables …
J'ai discuté avec plusieurs membres du laboratoire de celui-ci, et nous sommes allés à plusieurs sources mais n'avons toujours pas tout à fait la réponse: Quand on dit qu'un GLM a une famille de poisson , disons-nous parler de la distribution des résidus ou de la variable de réponse? Points …
J'ai ajusté le modèle à l'aide caret, mais j'ai ensuite réexécuté le modèle à l'aide du gbmpackage. Je crois comprendre que le caretpackage utilise gbmet que la sortie doit être la même. Cependant, un simple test rapide utilisant data(iris)montre une différence dans le modèle d'environ 5% en utilisant RMSE et …
Lors de la modélisation de séries chronologiques, on a la possibilité de (1) modéliser la structure corrélationnelle des termes d'erreur comme par exemple un processus AR (1) (2) inclure la variable dépendante retardée comme variable explicative (sur le côté droit) Je comprends que ce sont parfois des raisons substantielles d'aller …
Ici, la mauvaise interprétation de l'hypothèse de normalité dans la régression linéaire est discutée (que la `` normalité '' fait référence au X et / ou au Y plutôt qu'aux résidus), et l'affiche demande s'il est possible d'avoir X et Y non distribués normalement et ont encore des résidus normalement …
J'ai un très grand ensemble de données et il manque environ 5% de valeurs aléatoires. Ces variables sont corrélées entre elles. L'exemple de jeu de données R suivant n'est qu'un exemple de jouet avec des données corrélées factices. set.seed(123) # matrix of X variable xmat <- matrix(sample(-1:1, 2000000, replace = …
Pourquoi est-il nécessaire de poser l'hypothèse distributionnelle sur les erreurs, c'est-à-dire ϵ i ∼ N ( 0 , σ 2 )yi=Xβ+ϵiyi=Xβ+ϵiy_i = X\beta + \epsilon_{i} , avec .ϵi∼N(0,σ2)ϵi∼N(0,σ2)\epsilon_{i} \sim \mathcal{N}(0,\sigma^{2}) Pourquoi ne pas écrire y i ~ N ( X β , σ 2 )yi=Xβ+ϵiyi=Xβ+ϵiy_i = X\beta + \epsilon_{i} , …
Je suis doctorant en psychologie expérimentale et je m'efforce d'améliorer mes compétences et mes connaissances sur la façon d'analyser mes données. Jusqu'à ma 5e année en psychologie, je pensais que les modèles de régression (par exemple, ANOVA) supposaient les choses suivantes: normalité des données homogénéité de la variance des données, …
J'exécute un modèle linéaire généralisé, où je dois spécifier une famille différente de la normale. Quelle est la distribution attendue des résidus? Par exemple, les résidus devraient-ils être distribués normalement?
Cette question est en quelque sorte générale et de longue haleine, mais veuillez me supporter. Dans mon application, j'ai de nombreux jeux de données, chacun composé de ~ 20 000 points de données avec ~ 50 fonctionnalités et d'une seule variable binaire dépendante. J'essaie de modéliser les ensembles de données …
Je voulais mieux comprendre le test exact du pêcheur, j'ai donc imaginé l'exemple de jouet suivant, où f et m correspond à l'homme et à la femme, et n et y correspond à la "consommation de soda" comme ceci: > soda_gender f m n 0 5 y 5 0 Évidemment, …
J'ai une régression linéaire qui est assez bonne, je suppose (c'est pour un projet universitaire donc je n'ai pas vraiment besoin d'être super précis). Le fait est que, si je trace les valeurs résiduelles par rapport aux valeurs prédites, il y a (selon mon professeur) une pointe d'hétéroskédasticité. Mais si …
Lorsque vous effectuez une régression OLS et tracez les résidus résultants, comment savoir si les résidus sont autocorrélés? Je sais qu'il existe des tests pour cela (Durbin, Breusch-Godfrey) mais je me demandais si vous pouvez simplement regarder un tracé pour évaluer si l'autocorrélation pourrait être un problème (car pour l'hétéroskédasticité, …
J'essaie d'estimer une régression linéaire multiple dans R avec une équation comme celle-ci: regr <- lm(rate ~ constant + askings + questions + 0) les demandes et les questions sont des séries chronologiques de données trimestrielles, construites avec askings <- ts(...). Le problème est que j'ai obtenu des résidus autocorrélés. …
Il s'agit d'une mosaïque de l'ensemble de données de table de contingence HairEyeColordécrite ici . Comment interpréter les couleurs représentant les résidus? Quelle est la différence entre les résidus de Pearson élevés et positifs (indiqués en bleu) par rapport aux résidus faibles et négatifs indiqués en rouge?
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.