Comparer les ajustements du modèle à la réponse transformée et non transformée

Je veux comparer des données qui se répartissent entre trois groupes différents, par exemple:

 ID Group Prop.Nitrogen
 1    A     0.89
 2    A     0.85
 3    B     0.92
 4    B     0.97

Après Wharton et Hui (doi: 10.1890 / 10-0340.1 1 ) je pensais que je verrais si ces données seraient mieux traitées en utilisant un logit transformé.

Lorsque je regarde des graphiques de diagnostic pour des modèles linéaires sur les données transformées et non transformées, ils se ressemblent beaucoup sans problèmes évidents, et il n'y a que de petites différences dans les paramètres estimés. Cependant, j'aimerais toujours pouvoir dire quelque chose sur la façon dont le modèle s'adapte aux versions transformées et non transformées des données - je sais que je ne peux pas comparer directement les valeurs AIC. Y a-t-il une correction et je peux faire pour l'examiner? Ou devrais-je adopter une approche différente?

data-transformation aic fitting

— david w
source

Vous voudrez peut-être essayer une transformation Box-Cox ( boxcox()dans la bibliothèque MASS), bien que je ne sois pas sûr qu'elle puisse traiter les transformations logit.

— Marius

@Marius: pour clarifier, proposez-vous boxcox()sur les données brutes, ou sur les données transformées?

— Michelle

Qu'en est-il de la transformation des données et des valeurs ajustées à l'échelle pertinente par sujet (vous aurez donc une échelle unifiée), puis de calculer l'AIC pour tous les modèles concurrents que vous avez? Vous devrez calculer les valeurs AIC manuellement pour les modèles qui étaient à l'origine adaptés à une échelle différente, mais je ne pense pas que cela puisse être un problème.

— Richard Hardy

Mon expérience avec les données transformées suggère que la corrélation s'améliore après la transformation ainsi que l'homoscédasticité et / ou la normalité, bien qu'elles ne soient pas nécessairement toutes optimales pour une seule transformation. Une réponse simple peut être de calculer les coefficients de corrélation entre les deux modèles et leurs ensembles de données respectifs. On peut même tester la signification de la différence des coefficients de corrélation corrélés. Les tests d'homoscédasticité et de type de fonction de densité des résidus peuvent également offrir un moyen de les évaluer.

— Carl
source