C'est une bonne question, car "des quantités différentes" ne semblent pas être une grande explication.
Il y a deux raisons importantes de se méfier de l'utilisation de pour comparer ces modèles: il est trop grossier (il n'évalue pas vraiment la qualité de l'ajustement ) et il sera inapproprié pour au moins l'un des modèles. Cette réponse porte sur ce deuxième problème.R2
Traitement théorique
compare la variance des résidus du modèle à la variance des réponses. La variance est un écart additif carré moyen par rapport à un ajustement. En tant que tel, nous pouvons comprendre que R 2 compare deux modèles de la réponse y . R2R2y
Le modèle "de base" est
yi=μ+δi(1)
μδiτ2
xi
yi=β0+xiβ+εi.(2)
β0βεiσ2
R2τ2−σ2τ2
Lorsque vous prenez des logarithmes et utilisez les moindres carrés pour ajuster le modèle , vous comparez implicitement une relation de la forme
log(yi)=ν+ζi(1a)
à l'un des formulaires
log(yi)=γ0+xiγ+ηi.(2a)
(1)(2)(2a)
yi=exp(log(yi))=exp(γ0+xiγ)exp(ηi).
exp(ηi)yi=exp(γ0+xiγ)
Var(yi)=exp(γ0+xiγ)2Var(eηi).
xi(2)σ2
(1a)(2a)(1)(2)R2R2
Une analyse
R2xyεiηi
Un tel modèle (qui se produit généralement) est un ajustement des moindres carrés à une relation exponentielle,
yi=exp(α0+xiα)+θi.(3)
yx(2a)θi(2)R2xy
(3)300xi1.01.6(x,y)(x,log(y))
R20.700.56R2R20.70
log(y)(3)