Y= β0+ β1X+ εoù ε ∼ N( 0 , σ2ε)
β0+ β1Xσ2ε
σ2εXYεβ0, β 1, σ 2ε)Xσ2ε
Y= β0+ β1X+ εoù ε ∼ N( 0 , f( X) ) où f( X) = exp( γ0+ γ1X)et γ1≠ 0
XF( X) X
X. Cependant, j'ai tendance à penser qu'il est préférable de regarder des parcelles. @Penquin_Knight a réussi à montrer à quoi ressemble une variance constante en traçant les résidus d'un modèle où l'homoscédasticité est obtenue par rapport aux valeurs ajustées. L'hétéroscédasticité peut également éventuellement être détectée dans un graphique des données brutes ou dans un graphique à l'emplacement d'échelle (également appelé graphique au niveau de l'étalement). R trace ce dernier pour vous en appelant plot.lm(model, which=2)
; c'est la racine carrée des valeurs absolues des valeurs résiduelles par rapport aux valeurs ajustées, avec une courbe de faible profondeur superposée. Vous voulez que la coupe lowess soit plate et non en pente.
Examinez les graphiques ci-dessous, qui comparent l'apparence que pourraient avoir les données homoscédastiques et hétéroscédastiques dans ces trois types de figures. Notez la forme d'entonnoir pour les deux tracés supérieurs d'hétéroscédastique et la ligne de faible pente ascendante dans le dernier.
Pour être complet, voici le code que j'ai utilisé pour générer ces données:
set.seed(5)
N = 500
b0 = 3
b1 = 0.4
s2 = 5
g1 = 1.5
g2 = 0.015
x = runif(N, min=0, max=100)
y_homo = b0 + b1*x + rnorm(N, mean=0, sd=sqrt(s2 ))
y_hetero = b0 + b1*x + rnorm(N, mean=0, sd=sqrt(exp(g1 + g2*x)))
mod.homo = lm(y_homo~x)
mod.hetero = lm(y_hetero~x)