Il existe deux "types" de coefficients de régression:
- "Vrai" coefficients de régression (généralement notés ) qui décrivent le processus de génération de données sous-jacent des données. Ce sont des nombres fixes, ou «paramètres». Un exemple serait la vitesse de la lumière , qui (nous supposons) est toujours la même partout dans l'univers accessible.βc
- Coefficients de régression estimés (généralement notés ou ) calculés à partir d'échantillons de données. Les échantillons sont des collections de variables aléatoires, donc les coefficients de régression estimés sont également des variables aléatoires. Un exemple serait une estimation de obtenue dans une expérience.bβ^c
Réfléchissez maintenant à ce que signifie la covariance. Prenez deux variables aléatoires et . Siest élevé, chaque fois que vous dessinez une grande valeur absolue de vous pouvez également vous attendre à dessiner une grande valeur absolue de dans la même direction. Notez que «élevé» ici est relatif à la quantité de variation de et , comme indiqué dans les commentaires.XY|Cov(X,Y)|XYXY
La covariance (estimée) de deux coefficients de régression est la covariance des estimations , . Si la covariance entre les coefficients estimés et est élevée, dans tout échantillon où est élevé, vous pouvez également vous attendre à ce que soit élevé. Dans un sens plus bayésien, contient des informations sur .bb1b2b1b2b1b2
Notez à nouveau que "élevé" est relatif. Ici, " est élevé" signifie que " est élevé par rapport à son erreur standard", et leur covariance étant "élevée" signifie "élevée par rapport au produit de leurs erreurs standard". Une façon de lisser ces hoquets d'interprétation consiste à normaliser chaque entrée de régression en la divisant par son écart-type (ou deux écarts-types dans certains cas).b1b1
Un utilisateur de ce site a décrit comme "un peu fudge", mais je ne suis pas entièrement d'accord. D'une part, vous pourriez utiliser cette interprétation pour trouver des priors informatifs dans la régression bayésienne.Cov(b1,b2)
Quant à ce que cela est réellement utilisé, la réponse de Cliff AB est un bon résumé.