J'essaie de me présenter quand il convient d'utiliser quel type de régression (géométrique, Poisson, binôme négatif) avec les données de comptage, dans le cadre GLM (seules 3 des 8 distributions GLM sont utilisées pour les données de comptage, bien que la plupart de ce que J'ai lu des centres autour des distributions binomiales et de Poisson négatives).
Quand utiliser les GLM binomiaux Poisson vs géométrique vs négatif pour les données de comptage?
Jusqu'à présent, j'ai la logique suivante: s'agit-il de compter les données? Si oui, la moyenne et la variance sont-elles inégales? Si oui, régression binomiale négative. Si non, régression de Poisson. Y a-t-il zéro inflation? Si oui, Poisson gonflé zéro ou binôme négatif gonflé zéro.
Question 1 Il ne semble pas y avoir d'indication claire sur laquelle utiliser quand. Y a-t-il quelque chose pour éclairer cette décision? D'après ce que je comprends, une fois que vous êtes passé à ZIP, la variance moyenne étant une supposition égale, elle est assouplie, donc c'est à nouveau assez similaire à NB.
Question 2 Où la famille géométrique s'intègre-t-elle dans ce domaine ou quel genre de questions dois-je poser aux données lorsque je décide d'utiliser une famille géométrique dans ma régression?
Question 3 Je vois des gens qui échangent les distributions binomiale et Poisson négatives tout le temps mais pas géométriques, donc je suppose qu'il y a quelque chose de distinctement différent quand l'utiliser. Si oui, c'est quoi?
PS J'ai fait un diagramme (probablement trop simplifié, à partir des commentaires) ( modifiable ) de ma compréhension actuelle si les gens voulaient le commenter / le modifier pour la discussion.