La régression de Poisson est l'un des nombreux modèles de régression pour les variables dépendantes qui sont des nombres (entiers non négatifs). Un modèle plus général est la régression binomiale négative. Les deux ont de nombreuses variantes.
Quelles parcelles de diagnostic (et peut-être des tests formels) trouvez-vous le plus informatif pour les régressions où le résultat est une variable de comptage? Je suis particulièrement intéressé par les modèles de Poisson et binomiaux négatifs, ainsi que par leurs homologues à gonflement nul et à obstacle. La plupart des …
J'ai remarqué que dans R, les régressions de Poisson et binomiales négatives (NB) semblent toujours correspondre aux mêmes coefficients pour les prédicteurs catégoriels, mais non continus. Par exemple, voici une régression avec un prédicteur catégorique: data(warpbreaks) library(MASS) rs1 = glm(breaks ~ tension, data=warpbreaks, family="poisson") rs2 = glm.nb(breaks ~ tension, data=warpbreaks) …
Je comprends que pour certains ensembles de données tels que le vote, les performances sont meilleures. Pourquoi la régression de Poisson est-elle utilisée par rapport à la régression linéaire ordinaire ou à la régression logistique? Quelle est la motivation mathématique pour cela?
J'essaie d'ajuster les données avec un GLM (régression de poisson) dans R. Lorsque j'ai tracé les résidus par rapport aux valeurs ajustées, le tracé a créé plusieurs "lignes" (presque linéaires avec une légère courbe concave). Qu'est-ce que ça veut dire? library(faraway) modl <- glm(doctorco ~ sex + age + agesq …
J'ai une question sur la sémantique sur laquelle j'aimerais avoir l'avis de mes collègues statisticiens. Nous savons que des modèles tels que la logistique, Poisson, etc. tombent sous l'égide de modèles linéaires généralisés. Le modèle comprend des fonctions non linéaires des paramètres, qui peuvent à leur tour être modélisées en …
Version courte: Nous savons que la régression logistique et la régression probit peuvent être interprétées comme impliquant une variable latente continue qui est discrétisée selon un seuil fixe avant l'observation. Une interprétation similaire des variables latentes est-elle disponible pour, disons, la régression de Poisson? Qu'en est-il de la régression binomiale …
J'essaie de me présenter quand il convient d'utiliser quel type de régression (géométrique, Poisson, binôme négatif) avec les données de comptage, dans le cadre GLM (seules 3 des 8 distributions GLM sont utilisées pour les données de comptage, bien que la plupart de ce que J'ai lu des centres autour …
J'essaie d'adapter les modèles linéaires généralisés à certains ensembles de données de comptage qui pourraient ou non être sur-dispersés. Les deux distributions canoniques qui s'appliquent ici sont le binôme de Poisson et négatif (Negbin), avec EV et varianceμμ\mu Vun rP= μVunerP=μVar_P = \mu Vun rNB= μ + μ2θVunerNB=μ+μ2θVar_{NB} = \mu …
J'ai besoin de conseils concernant deux dilemmes principaux dans ma recherche, qui est une étude de cas de 3 grands produits pharmaceutiques et de l'innovation. Le nombre de brevets par an est la variable dépendante. Mes questions sont Quels sont les critères les plus importants pour un bon modèle? Qu'est-ce …
J'essaie de faire une régression pour expliquer le nombre d'homicides dans chaque quartier d'une ville. Bien que je sache que mes données suivent une distribution de Poisson, j'ai essayé d'adapter un OLS comme celui-ci: l o g( y+ 1 ) = α + βX+ ϵlog(y+1)=α+βX+ϵlog(y+1) = \alpha + \beta X …
J'ai récemment découvert comment modéliser des expositions dans le temps en utilisant le log (par exemple) du temps comme décalage dans une régression de Poisson. J'ai compris que le décalage correspond au fait d'avoir le temps comme covariable avec le coefficient 1. J'aimerais mieux comprendre la différence entre utiliser le …
Je suis vraiment stupéfait par le fait que le GLM de Poisson accepte les nombres non entiers! Regardez: Données (contenu de data.txt): 1 2001 0.25 1 1 2002 0.5 1 1 2003 1 1 2 2001 0.25 1 2 2002 0.5 1 2 2003 1 1 Script R: t <- …
J'ai souvent vu les conseils pour vérifier si un ajustement du modèle de Poisson est trop dispersé, ce qui implique de diviser la déviance résiduelle par les degrés de liberté. Le rapport résultant doit être "environ 1". La question est de savoir de quelle plage parlons-nous pour "approximative" - quel …
J'ai des données de comptage (analyse de l'offre / de la demande avec le nombre de clients, en fonction - éventuellement - de nombreux facteurs) J'ai essayé une régression linéaire avec des erreurs normales, mais mon tracé QQ n'est pas vraiment bon. J'ai essayé une transformation logarithmique de la réponse: …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.