Ce n'est pas un problème pour la modélisation prédictive quand vous ne vous souciez que des prévisions et rien d'autre.
Considérez ce modèle simple:
y= β+βXx +βzz+ ε
Supposer que
z=αx
Nous avons des régresseurs parfaitement colinéaires, et une solution OLS typique n'existera pas car (XTX)−1 a une singularité.
Cependant, connectons une équation à une autre:
y=β+βxx+βzαx+ε=β+β2x+ε,
où
β2≡βx+βzα
Donc, clairement, nous pouvons estimer β^2par les méthodes OLS habituelles, c'est-à-dire qu'il existe une solution. Le seul problème c'est que ce n'est pas unique!
Nous pouvons choisir β^z, ce qui nous donnerait β^x=β2−αβ^x: nous avons un nombre infini de paires (β^x,β^z) qui correspondent à une solution unique β^2. De toute évidence, l'une de ces paires est aussi bonne que toute autre pour la prédiction dey^. De plus, toutes ces paires sont aussi bonnes que l'uniqueβ^2coefficient aux fins de prévision .
Le seul problème est l'inférence. Si vous voulez savoir commentx impacts y votre analyse typique de β^x le coefficient et sa variance seront inutiles.