Étant donné que l'assertion dans la citation est une collection d'instructions sur le redimensionnement des colonnes de , vous pouvez tout aussi bien les prouver en même temps. En effet, il ne faut plus de travail pour prouver une généralisation de l'assertion:X
Lorsque est multiplié à droite par une matrice inversible , alors la nouvelle estimation de coefficient est égale à multipliée à gauche par .XAβ^Aβ^A−1
Les seuls faits algébriques dont vous avez besoin sont ceux (facilement prouvés et bien connus) que pour toutes les matrices et pour les matrices inversibles et . (Une version plus subtile de ce dernier est nécessaire lorsque vous travaillez avec des inverses généralisés: pour et inversible et tout , . )(AB)′=B′A′AB(AB)−1=B−1A−1ABABX(AXB)−=B−1X−A−1
Preuve par algèbre :
β^A=((XA)′((XA))−(XA)′y=A−1(X′X)−(A′)−1A′y=A−1β^,
QED. (Pour que cette preuve soit entièrement générale, le exposant se réfère à un inverse généralisé.)−
Preuve par géométrie :
Étant donné les bases et de et , respectivement, représente une transformation linéaire de à . La multiplication à droite de par peut être considérée comme laissant cette transformation fixe mais en changeant en (c'est-à-dire dans les colonnes de ). Sous ce changement de base, la représentation de tout vecteur doit changer via la multiplication à gauche par ,EpEnRnRpXRpRnXAEpAEpAβ^∈RpA−1QED .
(Cette preuve fonctionne, non modifiée, même lorsque n'est pas inversible.)X′X
La citation se réfère spécifiquement au cas des matrices diagonales avec pour et .AAii=1i≠jAjj=c
Connexion avec les moindres carrés
L'objectif est ici d'utiliser les premiers principes pour obtenir le résultat, le principe étant celui des moindres carrés: estimer les coefficients qui minimisent la somme des carrés des résidus.
Encore une fois, prouver une (énorme) généralisation ne se révèle pas plus difficile et est plutôt révélateur. Supposons est une carte (linéaire ou non) d'espaces vectoriels réels et supposons que est une fonction à valeur réelle sur . Soit l'ensemble (éventuellement vide) de points pour lequel est minimisé.
ϕ:Vp→Wn
QWnU⊂VpvQ(ϕ(v))
Résultat: , qui est déterminé uniquement par et , ne dépend d'aucun choix de base utilisée pour représenter les vecteurs dans .UQϕEpVp
Preuve: QED.
Il n'y a rien à prouver!
Application du résultat: Soit une forme quadratique semi-définie positive sur , soit , et supposons que est une carte linéaire représentée par lorsque les bases de et sont choisis. Définissez . Choisissez une base de et supposez que est la représentation de certains dans cette base. Il s'agit des moindres carrés : minimise la distance au carré . Parce queFRny∈RnϕXVp=RpWn=RnQ(x)=F(y,x)Rpβ^v∈Ux=Xβ^F(y,x)Xest une carte linéaire, en changeant la base de correspond au droit multipliant par une matrice inversible . Cela multipliera à gauche par , QED .RpXAβ^A−1