Depuis
nous savons que
et ainsi nous savons que pour chaque composant de ,
où est l' élément diagonal de . Ainsi, nous savons que
β^=(XTX)−1XTY=(XTX)−1XT(Xβ+ε)=β+(XTX)−1XTε
β^−β∼N(0,σ2(XTX)−1)
kβ^β^k−βk∼N(0,σ2Skk)
Skkkth(XTX)−1zk=β^k−βkσ2Skk−−−−−√∼N(0,1).
Prenez note de l'énoncé du théorème pour la distribution d'une forme quadratique idempotente dans un vecteur normal standard (théorème B.8 de Greene):
Si et est symétrique et idempotent, alors est distribué où est le rang de .x∼N(0,I)AxTAxχ2ννA
Soit le vecteur résiduel de régression et soit
qui est la matrice maker résiduelle (ie ) . Il est facile de vérifier que est symétrique et idempotent .ε^
M=In−X(XTX)−1XT,
My=ε^M
Soit
un estimateur pour .
s2=ε^Tε^n−p
σ2
Nous devons ensuite faire de l'algèbre linéaire. Notez ces trois propriétés d'algèbre linéaire:
- Le rang d'une matrice idempotente est sa trace.
- Tr(A1+A2)=Tr(A1)+Tr(A2)
- Tr(A1A2)=Tr(A2A1) si est et est ( cette propriété est essentielle pour que ce qui suit fonctionne )A1n1×n2A2n2×n1
Donc
rank(M)=Tr(M)=Tr(In−X(XTX)−1XT)=Tr(In)−Tr(X(XTX)−1XT))=Tr(In)−Tr((XTX)−1XTX))=Tr(In)−Tr(Ip)=n−p
Puis
V=(n−p)s2σ2=ε^Tε^σ2=(εσ)TM(εσ).
En appliquant le théorème pour la distribution d'une forme quadratique idempotente dans un vecteur normal standard (indiqué ci-dessus), nous savons que .V∼χ2n−p
Puisque vous supposez que est normalement distribué, alors est indépendant de , et puisque est une fonction de , alors est également indépendant de . Ainsi, et sont indépendants l'un de l'autre.εβ^ε^s2ε^s2β^zkV
Ensuite,
est le rapport d'une distribution normale standard avec la racine carrée d'une distribution chi carré avec les mêmes degrés de liberté (ie ), qui est une caractérisation de la distribution . Par conséquent, la statistique a une distribution avec degrés de liberté.
tk=zkV/(n−p)−−−−−−−−√
n−pttktn−p
Il peut ensuite être manipulé algébriquement sous une forme plus familière.
tk=β^k−βkσ2Skk√(n−p)s2σ2/(n−p)−−−−−−−−−−−−√=β^k−βkSkk√s2−−√=β^k−βks2Skk−−−−−√=β^k−βkse(β^k)