J'ai remarqué que l'intervalle de confiance pour les valeurs prédites dans une régression linéaire tend à être étroit autour de la moyenne du prédicteur et de la graisse autour des valeurs minimale et maximale du prédicteur. Ceci peut être vu dans les graphiques de ces 4 régressions linéaires:
Je pensais au départ que c'était parce que la plupart des valeurs des prédicteurs étaient concentrées autour de la moyenne du prédicteur. Cependant, j’ai alors remarqué que le milieu étroit de l’intervalle de confiance se produirait même si de nombreuses valeurs de étaient concentrées autour des extrêmes du prédicteur, comme dans la régression linéaire inférieure gauche, où de nombreuses valeurs du prédicteur sont concentrées autour du minimum de le prédicteur.
Est-ce que quelqu'un peut expliquer pourquoi les intervalles de confiance pour les valeurs prédites dans une régression linéaire ont tendance à être étroits au milieu et gras aux extrêmes?