Autocorrélations
La corrélation entre deux variables y1,y2 est définie comme:
ρ=E[(y1−μ1)(y2−μ2)]σ1σ2=Cov(y1,y2)σ1σ2,
où E est l'opérateur d'espérance, μ1 et μ2 sont les moyennes respectivement pour y1 et y2 et σ1,σ2 sont leurs écarts-types.
Dans le contexte d'une seule variable, c'est-à - dire l' auto- corrélation, y1 est la série d'origine et y2 est une version retardée. Lors de la définition ci - dessus, l' échantillon autocorrélations d'ordre k=0,1,2,...peut être obtenue en calculant l'expression suivante avec la série observée yt , t=1,2,...,n :
ρ(k)=1n−k∑nt=k+1(yt−y¯)(yt−k−y¯)1n∑nt=1(yt−y¯)2−−−−−−−−−−−−−√1n−k∑nt=k+1(yt−k−y¯)2−−−−−−−−−−−−−−−−−−√,
où y¯ est la moyenne de l'échantillon des données.
Autocorrélations partielles
Les autocorrélations partielles mesurent la dépendance linéaire d'une variable après avoir supprimé l'effet des autres variables affectant les deux variables. Par exemple, l'autocorrélation partielle de l'ordre mesure l'effet (dépendance linéaire) de yt−2 sur yt après avoir supprimé l'effet de yt−1 sur yt et yt−2 .
Chaque autocorrélation partielle peut être obtenue sous la forme d'une série de régressions de la forme:
y~t=ϕ21y~t−1+ϕ22y~t−2+et,
où y~t est la série d'origine moins la moyenne de l'échantillon, yt−y¯ . L'estimation de ϕ22 donnera la valeur de l'autocorrélation partielle d'ordre 2. En étendant la régression avec k décalages supplémentaires, l'estimation du dernier terme donnera l'autocorrélation partielle d'ordre k .
Une autre façon de calculer l'échantillon d'autocorrélations partielles consiste à résoudre le système suivant pour chaque ordre k :
⎛⎝⎜⎜⎜⎜ρ(0)ρ(1)⋮ρ(k−1)ρ(1)ρ(0)⋮ρ(k−2)⋯⋯⋮⋯ρ(k−1)ρ(k−2)⋮ρ(0)⎞⎠⎟⎟⎟⎟⎛⎝⎜⎜⎜⎜ϕk1ϕk2⋮ϕkk⎞⎠⎟⎟⎟⎟=⎛⎝⎜⎜⎜⎜ρ(1)ρ(2)⋮ρ(k)⎞⎠⎟⎟⎟⎟,
où ρ(⋅) sont les autocorrélations de l'échantillon. Cette correspondance entre les autocorrélations d'échantillons et les autocorrélations partielles est connue sous le nom de
récursion de Durbin-Levinson . Cette approche est relativement facile à mettre en œuvre à titre d'illustration. Par exemple, dans le logiciel R, on peut obtenir l'autocorrélation partielle d'ordre 5 comme suit:
# sample data
x <- diff(AirPassengers)
# autocorrelations
sacf <- acf(x, lag.max = 10, plot = FALSE)$acf[,,1]
# solve the system of equations
res1 <- solve(toeplitz(sacf[1:5]), sacf[2:6])
res1
# [1] 0.29992688 -0.18784728 -0.08468517 -0.22463189 0.01008379
# benchmark result
res2 <- pacf(x, lag.max = 5, plot = FALSE)$acf[,,1]
res2
# [1] 0.30285526 -0.21344644 -0.16044680 -0.22163003 0.01008379
all.equal(res1[5], res2[5])
# [1] TRUE
Bandes de confiance
Les bandes de confiance peuvent être calculées comme la valeur des autocorrélations de l'échantillon ±z1−α/2n√ , oùz1−α/2est le quantile1−α/2dans la distribution gaussienne, par exemple 1,96 pour les bandes de confiance à 95%.
Parfois, des bandes de confiance qui augmentent à mesure que l'ordre augmente sont utilisées. Dans ce cas, les bandes peuvent être définies comme ±z1−α/21n(1+2∑ki=1ρ(i)2)−−−−−−−−−−−−−−−−√ .