Quelle est la stratégie appropriée pour décider quel modèle utiliser avec les données de comptage? J'ai des données de comptage que j'ai besoin de modéliser en tant que modèle à plusieurs niveaux et il m'a été recommandé (sur ce site) que la meilleure façon de le faire soit par le biais de bogues ou de MCMCglmm. Cependant, j'essaie toujours de me renseigner sur les statistiques bayésiennes, et j'ai pensé que je devrais d'abord essayer d'ajuster mes données en tant que modèles linéaires généralisés et ignorer la structure imbriquée des données (juste pour que je puisse avoir une vague idée de ce à quoi s'attendre).
Environ 70% des données sont égales à 0 et le rapport de variance à la moyenne est de 33. Les données sont donc assez dispersées.
Après avoir essayé un certain nombre d'options différentes (y compris le poisson, le modèle binomial négatif, le modèle gonflé quasi et zéro), je vois très peu de cohérence dans les résultats (varier de tout est significatif à rien est significatif).
Comment puis-je prendre une décision éclairée sur le type de modèle à choisir en fonction de l'inflation 0 et de la sur-dispersion? Par exemple, comment puis-je déduire que le quasi-poisson est plus approprié que le binôme négatif (ou vice versa) et comment puis-je savoir que l'utilisation de l'un ou l'autre a traité de manière adéquate (ou non) les zéros en excès? De même, comment puis-je évaluer qu'il n'y a plus de sur-dispersion si un modèle gonflé à zéro est utilisé? ou comment choisir entre un poisson gonflé zéro et un binôme négatif gonflé zéro?