Pourquoi la trace de est dans la régression des moindres carrés quand le vecteur de paramètre est de p dimensions?


13

Dans le modèle , nous pourrions estimer utilisant l'équation normale:y=Xβ+ϵβ

β^=(XX)1Xy,
et nous pourrions obtenir
y^=Xβ^.

Le vecteur des résidus est estimé par

ϵ^=yXβ^=(IX(XX)1X)y=Qy=Q(Xβ+ϵ)=Qϵ,

Q=IX(XX)1X.

Ma question est de savoir comment obtenir la conclusion de

tr(Q)=np.

Réponses:


12

La conclusion ne fait que compter les dimensions des espaces vectoriels. Cependant, ce n'est généralement pas vrai.

Les propriétés les plus élémentaires de la multiplication matricielle montrent que la transformation linéaire représentée par la matrice satisfaitH=X(XX)X

H2=(X(XX)X)2=X(XX)(XX)(XX)X=H,

l'exposant comme opérateur de projection . Par conséquent, son complément

Q=1H

(comme indiqué dans la question) est également un opérateur de projection. La trace de est son rang (voir ci-dessous), d'où la trace de est égale à .HhQnh

De sa formule même, il apparaît que est la matrice associée à la composition de deux transformations linéaires et lui-même. Le premier ( ) transforme le -vecteur en -vecteur . Le second ( ) est une transformation de en donnée par . Son rang ne peut pas dépasser la plus petite de ces deux dimensions, qui dans un réglage des moindres carrés est toujours (mais pourrait être inférieure àJ = ( X ' X ) - X ' X J n y p β X R p R n y = X β p p J H = X J XH

J=(XX)X
XJnypβ^XRpRny^=Xβ^pp, chaque fois que n'est pas de rang complet). Par conséquent , le rang de la composition ne peut pas dépasser le rang de . La conclusion correcte est doncJH=XJX

J n tr ( Q ) n - p βtr(Q)=np si et seulement si est de rang complet; et en général . Dans le premier cas, le modèle est dit "identifiable" (pour les coefficients de ).Jntr(Q)npβ

X XJ aura un rang complet si et seulement si est inversible.XX


Interprétation géométrique

n y X Q = 1 - H n y y = H ( y ) + Q ( y ) , X p X p H p Q n - p n - pH représente la projection orthogonale de -vecteurs (représentant la "réponse" ou la "variable dépendante") sur l'espace couvert par les colonnes de (représentant les "variables indépendantes" ou les "covariables"). La différence montre comment décomposer tout -vecteur en une somme de vecteurs où le premier peut être "prédit" à partir de et le second lui est perpendiculaire. Lorsque les colonnes de génèrent un espace à dimensions (c'est-à-dire qu'elles ne sont pas colinéaires),nyXQ=1Hny

y=H(y)+Q(y),
XpXpH est et le rang de est , reflétant les dimensions supplémentaires de variation dans la réponse qui ne sont pas représentées dans les variables indépendantes. La trace donne une formule algébrique pour ces dimensions.pQnpnp

Fond d'algèbre linéaire

Un opérateur de projection sur un espace vectoriel (tel que ) est une transformation linéaire (c'est-à-dire un endomorphisme de ) telle que . Cela fait de son complément un opérateur de projection également, carR n P : V V V P 2 = P Q = 1 - PVRnP:VVVP2=PQ=1P

Q2=(1P)2=12P+P2=12P+P=Q.

Toutes les projections corrigent chaque élément de leurs images, car chaque fois que nous pouvons écrire pour certains , d'oùv = P ( w ) w V w = P ( v ) = P 2 ( v ) = P ( P ( v ) ) = P ( w ) .vIm(P)v=P(w)wV

w=P(v)=P2(v)=P(P(v))=P(w).

À tout endomorphisme de sont associés deux sous-espaces: son noyau et son image Chaque vecteur peut être écrit sous la forme où et . On peut donc construire une base pour pour laquelle et . Lorsque V ker ( P ) = { v vPV Im ( P ) = { v v

ker(P)={vv|P(v)=0}
v V v = w + u w Im ( P ) u Ker ( P ) E F V E Ker ( P ) F Im ( P ) V P P E P F f f F f P f ×
Im(P)={vv|wVP(w)=v}.
vV
v=w+u
wIm(P)uKer(P)EFVEKer(P)FIm(P)Vest de dimension finie, la matrice de dans cette base sera donc sous forme diagonale, avec un bloc (correspondant à l'action de sur ) tous zéros et l'autre (correspondant à l'action de sur ) égale à la matrice d'identité par , où la dimension de est . La trace de est la somme des valeurs sur la diagonale et doit donc être égale à . Ce nombre est le rang de : la dimension de son image.PPEPFffFfPPf×1=fP

La trace de est égale à la trace de (égal à , la dimension de ) moins la trace de . 1 n V P1P1nVP

Ces résultats peuvent être résumés avec l'affirmation que la trace d'une projection est égale à son rang.


Merci beaucoup. J'ai appris beaucoup de connaissances approfondies de votre réponse.
zhushun0008

19

@Dougal a déjà donné une réponse, mais en voici une autre, un peu plus simple.

Tout d'abord, utilisons le fait que . Ainsi, nous obtenons:Maintenant, est une matrice d'identité , donc . Utilisons maintenant le fait que , c'est-à-dire que la trace est invariante sous permutations cycliques. Donc, nous avons:Lorsque nous multiplions par , nous obtenons une matrice d'identité , dont la trace est . Ainsi, nous obtenons:tr(AB)=tr(A)tr(B)

tr(Q)=tr(I)tr(X(XX)1X).
In×ntr(I)=ntr(AB)=tr(BA)
tr(Q)=ntr((XX)1(XX)).
(XX)1(XX)p×pp
tr(Q)=np.

6

Supposons que et que soit complet.npX

Considérons la décomposition compacte des valeurs singulières , où est diagonale et ont (mais notez que est au plus donc il ne peut pas être ). alorsX=UΣVTΣRp×pURn×p,VRp×pUTU=VTV=VVT=IpUUTpIn

X(XTX)1XT=UΣVT(VΣUTUΣVT)1VΣUT=UΣVT(VΣ2VT)1VΣUT=UΣVTVΣ2VTVΣUT=UUT.

Maintenant, il existe une matrice telle que est unitaire. On peut écrire Cette forme montre que est semi-défini positif, et comme il s'agit d'un svd valide et que les valeurs singulières sont le carré des valeurs propres pour une matrice symétrique carrée, nous indique également que a des valeurs propres 1 (de multiplicité ) et 0 (de multiplicité ).U2Rn×npUn=[UU2]

IX(XTX)1XT=UnUnTUUT=Un(In[Ip000])UnT=Un[000Inp]UnT.
QQnppQnp.
En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.