Coefficient de détermination en régression linéaire multiple: Dans la régression linéaire multiple, le coefficient de détermination peut être écrit en termes de corrélations par paires pour les variables en utilisant la forme quadratique:
R2=rTy,xr−1x,xry,x,
où est le vecteur de corrélations entre le vecteur de réponse et chacun des vecteurs explicatifs, et est la matrice de corrélations entre les vecteurs explicatifs (pour en savoir plus, voir cette question connexe ). Dans le cas d'une régression bivariée, vous avez:ry,xrx,x
R2=[rY,X1rY,X2]T[1rX1,X2rX1,X21]−1[rY,X1rY,X2]=11−r2X1,X2[rY,X1rY,X2]T[1−rX1,X2−rX1,X21][rY,X1rY,X2]=11−r2X1,X2(r2Y,X1+r2Y,X2−2rX1,X2rY,X1rY,X2).
Vous n'avez pas spécifié les directions des corrélations univariées dans votre question, donc sans perte de généralité, nous noterons . La substitution de vos valeurs et donne:D≡sgn(rY,X1)⋅sgn(rY,X2)∈{−1,+1}r2Y,X1=0.3r2Y,X2=0.4
R2=0.7−20.12−−−−√⋅D⋅rX1,X21−r2X1,X2.
Il est possible que , car il est possible que les informations combinées des deux variables soient supérieures à la somme de ses parties. Ce phénomène intéressant est appelé «amélioration» (voir par exemple Lewis et Escobar 1986 ).R2>0.7