Une collègue analyse certaines données biologiques pour sa thèse avec une mauvaise hétéroscédasticité (figure ci-dessous). Elle est en train de l'analyser avec un modèle mixte mais a toujours des problèmes avec les résidus.
La transformation logarithmique des variables de réponse nettoie les choses et sur la base des commentaires sur cette question, cela semble être une approche appropriée. À l'origine, cependant, nous avions pensé qu'il y avait des problèmes à utiliser des variables transformées avec des modèles mixtes. Il s'avère que nous avions mal interprété une déclaration dans Littell & Milliken (2006) SAS pour les modèles mixtes qui montrait pourquoi il était inapproprié de transformer les données de comptage puis de les analyser avec un modèle mixte linéaire normal (la citation complète est ci-dessous) .
Une approche qui a également amélioré les résidus consistait à utiliser un modèle linéaire généralisé avec une distribution de Poisson. J'ai lu que la distribution de Poisson peut être utilisée pour modéliser des données continues (par exemple, comme discuté dans cet article ), et les packages de statistiques le permettent, mais je ne comprends pas ce qui se passe lorsque le modèle est adapté.
Pour comprendre comment les calculs sous-jacents sont effectués, mes questions sont les suivantes: lorsque vous ajustez une distribution de Poisson à des données continues, 1) les données sont-elles arrondies à l'entier le plus proche 2) cela entraîne-t-il une perte d'informations et 3) Quand, le cas échéant, est-il approprié d'utiliser un modèle de Poisson pour les données continues?
Littel & Milliken 2006, pg 529 "transformer les données [count] peut être contre-productif. Par exemple, une transformation peut fausser la distribution des effets du modèle aléatoire ou la linéarité du modèle. Plus important encore, la transformation des données laisse encore ouverte la possibilité des dénombrements prédits négatifs. Par conséquent, l'inférence à partir d'un modèle mixte utilisant des données transformées est hautement suspecte. "