J'ai rencontré un certain nombre de questions pratiques lors de la modélisation des données de comptage issues de la recherche expérimentale à l'aide d'une expérience intra-sujet. Je décris brièvement l'expérience, les données et ce que j'ai fait jusqu'à présent, suivi de mes questions.
Quatre films différents ont été montrés en séquence à un échantillon de répondants. Après chaque film, une interview a été menée, dont nous avons compté le nombre d'occurrences de certaines déclarations qui étaient d'intérêt pour le QR (variable de comptage prédite). Nous avons également enregistré le nombre maximum d'occurrences possibles (unités de codage; variable de décalage). De plus, plusieurs caractéristiques des films ont été mesurées sur une échelle continue, dont l'une a une hypothèse causale d'un effet de la caractéristique du film sur le nombre de déclarations tandis que les autres sont contrôlées (prédicteurs).
La stratégie de modélisation adoptée jusqu'à présent est la suivante:
Estimer un modèle de Poisson à effet aléatoire, où la variable causale est utilisée comme covariable et les autres variables comme covariables de contrôle. Ce modèle a un décalage égal à «log (unités)» (unités de codage). Des effets aléatoires sont pris sur tous les sujets (les décomptes spécifiques aux films sont imbriqués dans les sujets). Nous trouvons l'hypothèse causale confirmée (coefficient sig. De la variable causale). Pour l'estimation, nous avons utilisé le paquet lme4 dans R, en particulier la fonction glmer.
J'ai maintenant les questions suivantes. Un problème courant dans la régression de Poisson est la surdispersion. Je sais que cela peut être testé en utilisant une régression binomiale négative et en évaluant si son paramètre de dispersion améliore l'ajustement du modèle d'un modèle de Poisson simple. Cependant, je ne sais pas comment le faire dans un contexte d'effet aléatoire.
- Comment dois-je tester la surdispersion dans ma situation? J'ai testé la surdispersion dans une simple régression binomiale Poisson / négative (sans effets aléatoires) que je sais ajuster. Le test suggère la présence d'une surdispersion. Cependant, étant donné que ces modèles ne prennent pas en compte le clustering, je suppose que ce test est incorrect. De plus, je ne suis pas sûr du rôle du décalage pour les tests de surdispersion.
- Existe-t-il quelque chose comme un modèle de régression à effet aléatoire binomial négatif et comment dois-je l'adapter à R?
- Avez-vous des suggestions de modèles alternatifs que je devrais essayer sur les données, c'est-à-dire en tenant compte de la structure des mesures répétées, des variables de comptage et de l'exposition (unités de codage)?