J'analyse actuellement les données d'une série d'expériences comportementales qui utilisent toutes la mesure suivante. Les participants à cette expérience sont invités à sélectionner des indices que d'autres personnes (fictives) pourraient utiliser pour résoudre une série de 10 anagrammes. Les participants sont amenés à croire que ces autres personnes gagneront ou perdront de l'argent, selon leur performance dans la résolution des anagrammes. Les indices varient quant à leur utilité. Par exemple, pour l'anagramme NUNGRIN, une anagramme de RUNNING, trois indices pourraient être:
- Se déplacer rapidement (inutile)
- Ce que vous faites dans une course de marathon (utile)
- Pas toujours un passe-temps sain (inutile)
Pour former la mesure, je compte le nombre de fois (sur 10) qu'un participant choisit un indice inutile pour l'autre personne. Dans les expériences, j'utilise une variété de manipulations différentes pour affecter l'utilité des indices que les gens sélectionnent.
Étant donné que la mesure de l'utilité / de l'inutilité est assez fortement biaisée positivement (une grande proportion de personnes choisissent toujours les 10 indices les plus utiles), et parce que la mesure est une variable de comptage, j'ai utilisé un modèle linéaire généralisé de Poisson pour analyser ces données. Cependant, quand j'ai fait un peu plus de lecture sur la régression de Poisson, j'ai découvert que parce que la régression de Poisson n'évalue pas indépendamment la moyenne et la variance d'une distribution, elle sous-estime souvent la variance dans un ensemble de données. J'ai commencé à rechercher des alternatives à la régression de Poisson, telles que la régression quasipoisson ou la régression binomiale négative. Cependant, j'avoue que je suis plutôt nouveau dans ce genre de modèles, alors je viens ici pour des conseils.
Quelqu'un a-t-il des recommandations sur le modèle à utiliser pour ce type de données? Y a-t-il d'autres considérations dont je devrais être conscient (par exemple, un modèle particulier est-il plus puissant qu'un autre?)? Quel type de diagnostic dois-je examiner pour déterminer si le modèle que je sélectionne gère correctement mes données?