La bande grise est une bande de confiance pour la droite de régression. Je ne connais pas assez ggplot2 pour savoir avec certitude s'il s'agit d'une bande de confiance 1 SE ou d'une bande de confiance à 95%, mais je crois que c'est la première ( Edit: évidemment c'est un IC à 95% ). Une bande de confiance fournit une représentation de l'incertitude concernant votre droite de régression. Dans un sens, vous pourriez penser que la vraie ligne de régression est aussi haute que le haut de cette bande, aussi basse que le bas ou oscille différemment dans la bande. (Notez que cette explication est destinée à être intuitive et n'est pas techniquement correcte, mais l'explication entièrement correcte est difficile à suivre pour la plupart des gens.)
Vous devez utiliser la bande de confiance pour vous aider à comprendre / penser à la ligne de régression. Vous ne devez pas l'utiliser pour penser aux points de données brutes. N'oubliez pas que la droite de régression représente la moyenne de à chaque point de X (si vous avez besoin de mieux comprendre cela, cela peut vous aider à lire ma réponse ici: quelle est l'intuition derrière les distributions gaussiennes conditionnelles? ). D'un autre côté, vous ne vous attendez certainement pas à ce que chaque point de données observé soit égal à la moyenne conditionnelle. En d'autres termes, vous ne devez pas utiliser la bande de confiance pour évaluer si un point de données est une valeur aberrante. OuiX
( Edit: cette note est périphérique à la question principale, mais cherche à clarifier un point pour l'OP. )
Une régression polynomiale n'est pas une régression non linéaire, même si ce que vous obtenez ne ressemble pas à une ligne droite. Le terme «linéaire» a une signification très spécifique dans un contexte mathématique, en particulier, que les paramètres que vous estimez - les bêtas - sont tous des coefficients. Une régression polynomiale signifie simplement que vos covariables sont , X 2 , X 3 , etc., c'est-à-dire qu'elles ont une relation non linéaire entre elles, mais vos bêtas sont toujours des coefficients, donc c'est toujours un modèle linéaire. Si vos bêtas étaient, par exemple, des exposants, vous auriez alors un modèle non linéaire. XX2X3
En somme, le fait qu'une ligne soit droite ou non n'a rien à voir avec le fait qu'un modèle soit linéaire ou non. Lorsque vous ajustez un modèle polynomial (disons avec et X 2 ), le modèle ne «sait» pas que, par exemple, X 2 n'est en fait que le carré de X 1 . Il «pense» que ce ne sont que deux variables (bien qu'il puisse reconnaître qu'il existe une certaine multicolinéarité). Ainsi, en vérité, il ajuste un plan de régression (droit / plat) dans un espace tridimensionnel plutôt qu'une ligne de régression (courbe) dans un espace bidimensionnel. Ce n'est pas utile pour nous de penser, et en fait, extrêmement difficile à voir depuis X 2XX2X2X1X2est une fonction parfaite de . En conséquence, nous ne prenons pas la peine d'y penser de cette façon et nos tracés sont vraiment des projections bidimensionnelles sur le plan ( X , Y ) . Néanmoins, dans l'espace approprié, la ligne est en fait «droite» dans un certain sens. X(X, Y)
D'un point de vue mathématique, un modèle est linéaire si les paramètres que vous essayez d'estimer sont des coefficients. Pour clarifier davantage, considérons la comparaison entre le modèle de régression linéaire standard (OLS) et un modèle de régression logistique simple présenté sous deux formes différentes:
ln ( π ( Y )
Y=β0+β1X+ε
π(Y)=exp(β0+β1X)ln(π(Y)1−π(Y))=β0+β1X
Le modèle supérieur est la régression OLS, et les deux derniers sont la régression logistique, bien que présentés de différentes manières. Dans les trois cas, lorsque vous ajustez le modèle, vous estimez les
βs. Les deux modèles supérieurs sont
linéaires, car tous les
βs sont des coefficients, mais le modèle inférieur est non linéaire (sous cette forme) car les
βs sont des exposants. (Cela peut sembler assez étrange, mais la régression logistique est une instance dumodèle linéaire
généralisé, car il peut être réécrit en tant que modèle linéaire. Pour plus d'informations à ce sujet, il peut être utile de lire ma réponse ici:
π(Y)=exp(β0+β1X)1+exp(β0+β1X)
βββDifférence entre les modèles logit et probit .)