Le partiel devrait-il s'additionner au total en régression multiple?


12

Voici un modèle créé à partir d'un mtcarsensemble de données:

> ols(mpg~wt+am+qsec, mtcars)

Linear Regression Model

ols(formula = mpg ~ wt + am + qsec, data = mtcars)

                Model Likelihood     Discrimination    
                   Ratio Test           Indexes        
Obs       32    LR chi2     60.64    R2       0.850    
sigma 2.4588    d.f.            3    R2 adj   0.834    
d.f.      28    Pr(> chi2) 0.0000    g        6.456    

Residuals

    Min      1Q  Median      3Q     Max 
-3.4811 -1.5555 -0.7257  1.4110  4.6610 

          Coef    S.E.   t     Pr(>|t|)
Intercept  9.6178 6.9596  1.38 0.1779  
wt        -3.9165 0.7112 -5.51 <0.0001 
am         2.9358 1.4109  2.08 0.0467  
qsec       1.2259 0.2887  4.25 0.0002  

Le modèle semble bon avec un total de 0,85. Cependant, les valeurs partielles de observées sur le graphique suivant ne correspondent pas à cette valeur. Ils totalisent environ 0,28.R2R2

> plot(anova(mod), what='partial R2')

entrez la description de l'image ici

Est - il une relation entre la somme de toutes partielle et le total ? L'analyse se fait avec le package.R2R2rms


1
(En plus de la très bonne réponse par amibes) Une question au sujet proche coefficient de régression normalisé vs corrélation partielle stats.stackexchange.com/q/76815/3277 .
ttnphns

Réponses:


11

Non.

Une façon de comprendre le partiel pour un prédicteur donné est qu'il est égal au que vous obtiendriez si vous régressiez d'abord votre variable indépendante sur tous les autres prédicteurs , prenez les résidus et régressez ceux sur le prédicteur restant.R 2R2R2

Donc, si par exemple tous les prédicteurs sont parfaitement identiques (colinéaires), on peut avoir un décent , mais partiel pour tous les prédicteurs sera exactement nul, car tout prédicteur unique n'a aucun pouvoir explicatif supplémentaire.R 2R2R2

D'un autre côté, si tous les prédicteurs ensemble expliquent parfaitement la variable dépendante, c'est-à-dire , alors partiel pour chaque prédicteur sera également égal à , car tout ce qui n'est pas expliqué par tous les autres prédicteurs peut être parfaitement expliqué par le reste une.R 2 1R2=1R21

Ainsi, la somme de tous les partiels peut facilement être inférieure ou supérieure au total . Ils ne doivent pas nécessairement coïncider même si tous les prédicteurs sont orthogonaux. Le partiel est un peu une mesure étrange.R 2 R 2R2R2R2

Voir ce long fil pour plus de détails: Importance des prédicteurs dans la régression multiple: partiel vs coefficients standardisésR2 .


Merci pour une explication très claire. Cela pourrait se produire dans la situation de cette question également: stats.stackexchange.com/questions/155447/… . Le R ^ 2 partiel est-il alors un indicateur raisonnable de l'importance ou de la contribution des prédicteurs individuels? Ou suggéreriez-vous quelque chose d'autre comme «proportion R ^ 2» ou «reste R ^ 2» ou «chisq» ou «chisq moins df» ou «proportion chisq» ou «aic»? Tous ces éléments sont disponibles dans le package rms. Ou des coefficients standardisés?
rnso

Oui, je ne sais pas pourquoi cette question a été suspendue car elle n'est pas claire; Je pense que c'est clair (et c'est presque un doublon de celui-ci mais sans doute pas tout à fait). Concernant les indicateurs raisonnables de l'importance des prédicteurs: je vous invite fortement à lire le fil auquel j'ai lié dans ma réponse, qui porte précisément sur cette question. Il y a aussi ma propre réponse, où je donne un bref aperçu de plusieurs indicateurs différents. Ils ont tous divers défauts; il semble qu'il n'y ait pas (et ne puisse pas être) une solution parfaite à ce problème.
Amoeba dit Reinstate Monica

Je l' ai mis en attente comme peu claires parce aucune explication du tout a été donné la façon dont les deux modèles diffèrent. J'ai peut-être eu tort de penser qu'une réponse était souhaitée pour cette situation spécifique. Compte tenu de cette réponse, est-ce que vous pensez qu'il doit être rouvert?
Scortchi - Réintégrer Monica

Les R2 partiels sont donc comparables à l'intérieur d'un graphique et non entre 2 graphiques. De plus, «R2 partiel» n'indique pas vraiment la contribution au R2 total et, par conséquent, je pense qu'il s'agit d'un terme inapproprié. Il n'y a pas besoin d'autre question maintenant puisque j'ai la réponse ici.
rnso

J'ai voté pour toutes les réponses. Même alors, j'ai accepté la grande majorité de mes questions.
rnso
En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.