Les deux principales façons de comprendre un tel phénomène de régression sont algébriques - en manipulant les équations et formules normales pour leur solution - et géométriques. L'algèbre, comme illustré dans la question elle-même, est bonne. Mais il existe plusieurs formulations géométriques utiles de régression. Dans ce cas, visualiser le données espace offre un aperçu( x , y)( x , x2, y) qui pourraient autrement être difficiles à trouver.
Nous payons le prix d'avoir à regarder des objets en trois dimensions, ce qui est difficile à faire sur un écran statique. (Je trouve que les images en rotation sans fin sont ennuyeuses et ne vous infligeront donc aucune de celles-ci, même si elles peuvent être utiles.) Ainsi, cette réponse pourrait ne pas plaire à tout le monde. Mais ceux qui souhaitent ajouter la troisième dimension à leur imagination seront récompensés. Je propose de vous aider dans cette entreprise au moyen de graphiques soigneusement choisis.
Commençons par visualiser les variables indépendantes . Dans le modèle de régression quadratique
yje= β0+ β1( xje) + β2( x2je) + erreur ,(1)
les deux termes et peuvent varier selon les observations: ce sont les variables indépendantes . Nous pouvons tracer toutes les paires ordonnées comme des points dans un plan avec des axes correspondant à et Il est également révélateur de tracer tous les points sur la courbe des paires ordonnées possibles( xje)( x2je)( xje, x2je)XX2.( t , t2) :
Visualisez les réponses (variable dépendante) dans une troisième dimension en inclinant cette figure vers l'arrière et en utilisant la direction verticale pour cette dimension. Chaque réponse est tracée sous forme de symbole ponctuel. Ces données simulées consistent en une pile de dix réponses pour chacun des trois emplacements indiqués sur la première figure; les élévations possibles de chaque pile sont représentées par des lignes verticales grises:( x , x2)
La régression quadratique ajuste un plan à ces points.
(Comment le savons-nous? Parce que pour tout choix de paramètres l'ensemble des points dans l' espace qui satisfont l'équation sont le zéro la fonction qui définit un plan perpendiculaire au vecteur Ce morceau de géométrie analytique nous achète également un support quantitatif pour l'image: parce que les paramètres utilisés dans ces illustrations sont et et les deux sont grands par rapport à ce plan sera presque vertical et orienté en diagonale dans le plan .)( β0, β1, β2) ,( x , x2, y)( 1 )- β1( x ) - β2( x2) + ( 1 ) y- β0,( - β1, - β2, 1 ) .β1= - 55 / 8β2= Quinze / deux ,1 ,( x , x2)
Voici le plan des moindres carrés adapté à ces points:
Sur le plan, que l'on pourrait supposer avoir une équation de la forme j'ai "levé" la courbe à la courbe et dessiné cela en noir.y= f( x , x2) ,( t , t2)
t → ( t , t2, f( t , t2) )
Inclinons tout en arrière pour que seuls les axes et s'affichent, laissant l' axe tomber de manière invisible de votre écran:XyX2
Vous pouvez voir comment la courbe levée est précisément la régression quadratique souhaitée: c'est le lieu de toutes les paires ordonnées où est la valeur ajustée lorsque la variable indépendante est définie sur( x , y^)y^x .
La bande de confiance pour cette courbe ajustée illustre ce qui peut arriver à l'ajustement lorsque les points de données varient de façon aléatoire. Sans changer de point de vue, j'ai tracé cinq plans ajustés (et leurs courbes relevées) en cinq nouveaux ensembles de données indépendants (dont un seul est affiché):
Pour vous aider à mieux voir cela, j'ai également rendu les avions presque transparents. Évidemment, les courbes levées ont tendance à avoir des intersections mutuelles près de etx ≈ 1,75x ≈ 3.
Regardons la même chose en survolant l'intrigue tridimensionnelle et en regardant légèrement vers le bas et le long de l'axe diagonal de l'avion. Pour vous aider à voir comment les plans changent, j'ai également compressé la dimension verticale.
La clôture verticale dorée montre tous les points au-dessus de la courbe afin que vous puissiez voir plus facilement comment elle se soulève sur les cinq plans ajustés. Conceptuellement, la bande de confiance est trouvée en faisant varier les données, ce qui fait varier les plans ajustés, ce qui modifie les courbes levées, d'où elles tracent une enveloppe de valeurs ajustées possibles à chaque valeur de( t , t2)( x , x2) .
Maintenant, je crois qu'une explication géométrique claire est possible. Parce que les points de la forme s'alignent presque dans leur plan, tous les plans ajustés tourneront (et bougeront un tout petit peu) autour d'une ligne commune située au-dessus de ces points. (Soit la projection de cette ligne jusqu'au plan : elle rapprochera étroitement la courbe de la première figure.) Lorsque ces plans varient, la quantité de variation de la courbe levée ( verticalement) à un emplacement donné sera directement proportionnel à la distance se trouve à partir deL ( x , x 2 ) ( x , x 2 ) ( x , x 2 ) L .( xje, x2je)L( x , x2)( x , x2)( x , x2)L .
Cette figure revient à la perspective planaire d'origine pour afficher rapport à la courbe dans le plan des variables indépendantes. Les deux points de la courbe les plus proches de sont marqués en rouge. Ici, approximativement, c'est là que les plans ajustés auront tendance à être les plus proches car les réponses varient de façon aléatoire. Ainsi, les courbes levées aux valeurs correspondantes (autour de et ) auront tendance à varier le moins près de ces points. t → ( t , t 2 ) L x 1,7 2,9Lt → ( t , t2)LX1,72.9
Algébriquement, trouver ces "points nodaux" consiste à résoudre une équation quadratique: ainsi, au plus deux d'entre eux existeront. Nous pouvons donc nous attendre, en règle générale, à ce que les bandes de confiance d'un ajustement quadratique aux données puissent avoir jusqu'à deux endroits où elles se rapprochent - mais pas plus que cela.( x , y)
Cette analyse s'applique conceptuellement à la régression polynomiale de degré supérieur, ainsi qu'à la régression multiple en général. Bien que nous ne puissions pas vraiment «voir» plus de trois dimensions, les mathématiques de la régression linéaire garantissent que l'intuition dérivée des tracés bidimensionnels et tridimensionnels du type montré ici reste exacte dans les dimensions supérieures.