Supposons que toutes variables sont normalisées par la transformation de corrélation, comme vous l'avez mentionné, version mise à l'échelle de la longueur unitaire de . Le modèle standardisé ne modifie pas la corrélation entre variables peut être calculé lors de la transformation standardisée du modèle linéaire d'origine. Notons la matrice de conception après transformation standardisée comme
Ensuite
XXXVIFX∗=⎡⎣⎢⎢⎢⎢⎢11⋮1X11X21⋮Xn1……⋮…X1,p−1X2,p−1⋮Xn,p−1⎤⎦⎥⎥⎥⎥⎥.
X∗′X∗=[n00′rXX],
où est la matrice de corrélation de variables. Nous savons également que
pour est le ème terme diagonal de .rXXXσ2{β^}=σ2(X∗′X∗)−1=σ2[1n00′r−1XX.]
VIFkk=1,2,…,p−1kr−1XXk=1rXXk . Définissons:
Notez que les deux matrices sont différentes des matrices de conception. Comme nous ne nous soucions que des coefficients des variables , le vecteur d'une matrice de conception peut être ignoré dans notre calcul. Par conséquent, en utilisant le complément de Schur ,
X(−1)=⎡⎣⎢⎢⎢⎢⎢X12X22⋮Xn2……⋮…X1,p−1X2,p−1⋮Xn,p−1⎤⎦⎥⎥⎥⎥⎥,X1=⎡⎣⎢⎢⎢⎢X11X21⋮Xn1⎤⎦⎥⎥⎥⎥.
X1r−1XX(1,1)=(r11−r1X(−1)r−1X(−1)X(−1)rX(−1)1)−1=(r11−[r1X(−1)r−1X(−1)X(−1)]rX(−1)X(−1)[r−1X(−1)X(−1)rX(−1)1])−1=(1−β′1X(−1)X′(−1)X(−1)β1X(−1))−1,
où est les coefficients de régression de sur sauf l'interception. En fait, l'ordonnée à l'origine devrait être l'origine, puisque tous lesβ1X(−1)X1X2,…,Xp−1Xles variables sont normalisées avec une moyenne nulle. D'un autre côté, (ce serait plus simple si nous pouvons tout écrire sous forme de matrice explicite)
Par conséquent
R21=SSRSSTO=β′1X(−1)X′(−1)X(−1)β1X(−1)1=β′1X(−1)X′(−1)X(−1)β1X(−1).
VIF1=r−1XX(1,1)=11−R21.