Pourquoi n'y a-t-il pas de modèles de données de comptage gonflés?


8

Je travaille sur des modèles de données de comptage gonflés à zéro en utilisant le psclpackage. Je me demande simplement pourquoi il n'y a pas de développement de modèles pour les modèles de données de comptage gonflés! Aussi pourquoi il n'y a pas de développement de modèles de données de comptage bimodaux, disons gonflés zéro et 2! Une fois, j'ai généré des données de Poisson gonflées et constaté que ni le modèle glmavec family=poissonni le modèle binomial ( glm.nb) négatif n'étaient assez bons pour bien ajuster les données. Si quelqu'un peut faire la lumière sur ma pensée, aussi excentrique soit-elle, cela me serait très utile.


3
J'ai écrit une proposition de subvention pour travailler sur un logiciel pour cela, mais elle a été refusée.
Peter Flom

3
Je m'attends à ce qu'il y ait peu à dire qu'il y ait moins d'appels, donc les gens n'en parlent pas autant, mais ce n'est pas comme si cela n'aurait jamais été fait; il n'a peut-être pas été beaucoup discuté. Les idées n'introduisent pas vraiment beaucoup de choses qui sont substantiellement différentes du cas 0 commun.
Glen_b -Reinstate Monica

Réponses:


12

Un modèle de Poisson un gonflé pour un compte estYi

Pr(Yi=1)=πi+(1πi)μieμiPr(Yi=yi)=(1πi)μiyieμiyi!when yi1

où la moyenne de Poisson et la probabilité de Bernoulli sont liées aux prédicteurs par le biais de fonctions de liaison appropriées. Vous pouvez définir un modèle similaire pour gonfler les probabilités pour toutes les valeurs que vous choisissez.μiπi

Pourtant, zéro a une place spéciale (et autrefois controversée) parmi les nombres de comptage - dans un sens représentant l'absence de quoi que ce soit à compter. Et c'est la distinction «rien» vs «quelque chose», plutôt que la distinction «un» vs «tout autre compte» qui a tendance à être pertinente pour un large éventail de phénomènes que nous aimons modéliser: il y a un processus qui ne donne rien, un , deux, ... compte et un autre qui ne donne aucun compte.


Merci pour votre réponse. Je suis d'accord avec la façon dont vous avez expliqué pourquoi le dénombrement nul a suscité autant d'intérêt que d'autres dénombrements. Pourtant, je voulais en savoir plus sur les modèles de données de comptage gonflé . Lorsque j'ai essayé d'écrire le code en R pour un modèle de régression gonflé avec des covariables, les estimations étaient fausses. Je suis sûr que j'ai fait des erreurs dans score functionet hessian matrix. Pouvez-vous me recommander un texte / article qui pourrait m'aider à en savoir plus?
submergé

Je ne sais rien sur l'ajustement spécifique de modèles de Poisson à un gonflage. Comme l'inflation unique n'est qu'une légère modification de l'inflation zéro, la lecture de cette dernière devrait aider. Je pense que quelques modifications du zeroinflcode devraient le faire - changer la probabilité et le score de Poisson gonflés à zéro pour correspondre au modèle ci-dessus (ou essayez simplement de changer la probabilité et de ne pas passer le score à optim). Bien sûr, vous pouvez également demander ici ou sur SO, le cas échéant, des références ou de l'aide pour les choses sur lesquelles vous êtes coincé.
Scortchi - Réintégrer Monica

3

Le package R VGAMa une fonction vglmqui peut être utilisée pour s'adapter à toutes sortes de modèles Poisson-esque. Vous pouvez l'utiliser pour spécifier un modèle gonflé, donc quelque chose comme vglm(Y~X,family=oipospoisson(),data=data). Voir ici pour plus de détails.

En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.