J'essaie de modéliser les données de comptage dans R qui sont apparemment sous-dispersées (paramètre de dispersion ~ 0,40). C'est probablement pourquoi un modèle binomial ( ) glm
avec family = poisson
ou négatif glm.nb
n'est pas significatif. Quand je regarde les descriptions de mes données, je n'ai pas le biais typique des données de comptage et les résidus dans mes deux conditions expérimentales sont également homogènes.
Mes questions sont donc:
Dois-je même utiliser des analyses de régression spéciales pour mes données de comptage, si mes données de comptage ne se comportent pas vraiment comme des données de comptage? Je suis parfois confronté à la non-normalité (généralement en raison de la kurtosis), mais j'ai utilisé la méthode du centile bootstrap pour comparer les moyennes ajustées (Wilcox, 2012) pour tenir compte de la non-normalité. Les méthodes de comptage peuvent-elles être remplacées par une méthode robuste suggérée par Wilcox et réalisée dans le package WRS?
Si je dois utiliser des analyses de régression pour les données de dénombrement, comment puis-je tenir compte de la sous-dispersion? Le Poisson et la distribution binomiale négative supposent une dispersion plus élevée, donc cela ne devrait pas être approprié, non? Je pensais à appliquer la distribution quasi-Poisson , mais c'est généralement recommandé pour la sur-dispersion. J'ai lu sur les modèles bêta-binomiaux qui semblent être en mesure de tenir compte de la sur- et de la sous-dispersion sont disponibles dans le
VGAM
package de R. Les auteurs semblent cependant recommander une distribution de Poisson tildée , mais je ne la trouve pas dans le package .
Quelqu'un peut-il recommander une procédure pour les données sous-dispersées et peut-être fournir un exemple de code R pour cela?