Le modèle linéaire général nous permet d'écrire un modèle ANOVA comme modèle de régression. Supposons que nous avons deux groupes avec chacun deux observations, c'est-à-dire quatre observations dans un vecteur . Le modèle original, surparamétrisé est alors E ( y ) = X ⋆ β ⋆ , où X ⋆ est la matrice des prédicteurs, c'est-à-dire des variables indicatrices codées fictivement :
( μ 1 μ 1 μ 2 μ 2 ) = ( 1 1 0 1 1 0 1 0 1 1 0 1yE( y) = X⋆β⋆X⋆
⎛⎝⎜⎜⎜μ1μ1μ2μ2⎞⎠⎟⎟⎟= ⎛⎝⎜⎜⎜111111000011⎞⎠⎟⎟⎟⎛⎝⎜β⋆0β⋆1β⋆2⎞⎠⎟
Les paramètres ne sont pas identifiables comme car X ⋆ a le rang 2 ( (( X ⋆ ) ′ X ⋆ n'est pas inversible). Pour changer cela, nous introduisons la contrainte β ⋆ 1 = 0 (contrastes de traitement), qui nous donne le nouveau modèle E ( μ 1 μ 1 μ 2 μ 2( ( X⋆)′X⋆)- 1( X⋆)′E( y)X⋆( X⋆)′X⋆β⋆1= 0 :
(E( y) = Xβ
⎛⎝⎜⎜⎜μ1μ1μ2μ2⎞⎠⎟⎟⎟= ⎛⎝⎜⎜⎜11110011⎞⎠⎟⎟⎟( β0β2)
μ1= β0β0μ2= β0+ β2β2μ2- μ1
tψ = ∑ cjβjψ0c = ( 0 , 1 )′β2= 0μ2- μ1= 0ψ^= ∑ cjβ^jβ^= ( X′X)- 1X′yψ
t=ψ^−ψ0σ^c′(X′X)−1c−−−−−−−−−√
σ^2=∥e∥2/(n−Rank(X))∥e∥2Rank(X)=2(X′X)−1X′=(.5−.5.5−.50.50.5) , et les estimateurs sont donc et . Avec étant 1 dans notre cas, la statistique de test devient:
β^0=0.5y1+0.5y2=M1β^2=−0.5y1−0.5y2+0.5y3+0.5y4=M2−M1c′(X′X)−1c
t=M2−M1−0σ^=M2−M1∥e∥2/(n−2)−−−−−−−−−−√
t est -distribué avec df (ici ). Lorsque vous équerrez , vous obtenez , la statistique de test de l'ANOVAtn−Rank(X)n−2tFbwFn-Rank(X)(M2−M1)2/1∥e∥2/(n−2)=SSb/dfbSSw/dfw=FF pour deux groupes ( pour entre, pour à l'intérieur des groupes) qui suit un - distribution avec 1 et df.bwFn−Rank(X)
Avec plus de deux groupes, l'hypothèse ANOVA (toutes βj sont simultanément 0, avec ) fait référence à plus d'un paramètre et ne peut pas être exprimée comme une combinaison linéaire , donc les tests ne sont pas équivalents .ψ1≤jψ