Oui, la matrice de covariance de toutes les variables - explicatives et réponses - contient les informations nécessaires pour trouver tous les coefficients, à condition qu'un terme d'interception (constant) soit inclus dans le modèle. (Bien que les covariances ne fournissent aucune information sur le terme constant, elles peuvent être trouvées à partir des moyennes des données.)
Une analyse
Que les données pour les variables explicatives être disposés comme vecteurs colonnes de dimension x 1 , x 2 , ... , x p , et la variable de réponse soit le vecteur colonne y , considéré comme une réalisation d'une variable aléatoire Y . Les estimations des moindres carrés ordinaires ß des coefficients dans le modèlenx1,x2,…,xpyYβ^
E(Y)=α+Xβ
sont obtenus en assemblant les vecteurs de colonnes X 0 = ( 1 , 1 , … , 1 ) ′ , X 1 , … , X p en un tableau n × p + 1 X et en résolvant le système d'équations linéairesp+1X0=(1,1,…,1)′,X1,…,Xpn×p+1X
X′Xβ^=X′y.
Il est équivalent au système
1nX′Xβ^=1nX′y.
L'élimination gaussienne résoudra ce système. Il procède en joignant le matrice + 1 1p+1×p+1et lep1nX′Xvecteur + 1 1p+1dans untableaup+1×p+2Aet en le réduisant en ligne. 1nX′yp+1×p+2A
La première étape inspectera 1n(X′X)11=1nX′0X0=1A1nX′0Xi=X¯¯¯¯iAi+1,j+1=X′iXj will equal X¯¯¯¯iX¯¯¯¯j. This is just the formula for the covariance of Xi and Xj. Moreover, the number left in the i+1,p+2 position equals 1nX′iy−Xi¯¯¯¯¯¯y¯¯¯, the covariance of Xi with y.
Thus, after the first step of Gaussian elimination the system is reduced to solving
Cβ^=(Cov(Xi,y))′
and obviously--since all the coefficients are covariances--that solution can be found from the covariance matrix of all the variables.
(When C is invertible the solution can be written C−1(Cov(Xi,y))′. The formulas given in the question are special cases of this when p=1 and p=2. Writing out such formulas explicitly will become more and more complex as p grows. Moreover, they are inferior for numerical computation, which is best carried out by solving the system of equations rather than by inverting the matrix C.)
The constant term will be the difference between the mean of y and the mean values predicted from the estimates, Xβ^.
Example
To illustrate, the following R
code creates some data, computes their covariances, and obtains the least squares coefficient estimates solely from that information. It compares them to the estimates obtained from the least-squares estimator lm
.
#
# 1. Generate some data.
#
n <- 10 # Data set size
p <- 2 # Number of regressors
set.seed(17)
z <- matrix(rnorm(n*(p+1)), nrow=n, dimnames=list(NULL, paste0("x", 1:(p+1))))
y <- z[, p+1]
x <- z[, -(p+1), drop=FALSE];
#
# 2. Find the OLS coefficients from the covariances only.
#
a <- cov(x)
b <- cov(x,y)
beta.hat <- solve(a, b)[, 1] # Coefficients from the covariance matrix
#
# 2a. Find the intercept from the means and coefficients.
#
y.bar <- mean(y)
x.bar <- colMeans(x)
intercept <- y.bar - x.bar %*% beta.hat
The output shows agreement between the two methods:
(rbind(`From covariances` = c(`(Intercept)`=intercept, beta.hat),
`From data via OLS` = coef(lm(y ~ x))))
(Intercept) x1 x2
From covariances 0.946155 -0.424551 -1.006675
From data via OLS 0.946155 -0.424551 -1.006675