La corrélation mesure la relation linéaire. Dans un contexte informel, une relation signifie quelque chose de stable. Lorsque nous calculons la corrélation d'échantillon pour les variables stationnaires et augmentons le nombre de points de données disponibles, cette corrélation d'échantillon tend vers la vraie corrélation.
On peut montrer que pour les prix, qui sont généralement des marches aléatoires, la corrélation d'échantillon a tendance à varier de façon aléatoire. Cela signifie que peu importe la quantité de données dont nous disposons, le résultat sera toujours différent.
Remarque J'ai essayé d'exprimer l'intuition mathématique sans les mathématiques. D'un point de vue mathématique, l'explication est très claire: des exemples de moments de processus stationnaires convergent en probabilité en constantes. Des exemples de moments de marches aléatoires convergent vers des intégrales de mouvement brownien qui sont des variables aléatoires. Étant donné que la relation est généralement exprimée sous la forme d'un nombre et non d'une variable aléatoire, la raison du non-calcul de la corrélation pour les variables non stationnaires devient évidente.
Mise à jour Puisque nous sommes intéressés par la corrélation entre deux variables, supposons d'abord qu'elles proviennent du processus stationnaire . La stationnarité implique que et ne dépendent pas de . Donc corrélationE Z t c o v ( Z t , Z t - h ) tZt=(Xt,Yt)EZtcov(Zt,Zt−h)t
corr(Xt,Yt)=cov(Xt,Yt)DXtDYt−−−−−−−√
ne dépend pas non plus de , puisque toutes les quantités de la formule proviennent de la matrice , qui ne dépend pas de . Ainsi, le calcul de la corrélation de l'échantillonc o v ( Z t ) ttcov(Zt)t
ρ=corr(Xt,Yt)ρ→ρT→∞√
ρ^=1T∑Tt=1(Xt−X¯)(Yt−Y¯)1T2∑Tt=1(Xt−X¯)2∑Tt=1(Yt−Y¯)2−−−−−−−−−−−−−−−−−−−−−−−−−−−√
est logique, car nous pouvons raisonnablement espérer que la corrélation d'échantillon estimera . Il s'avère que cet espoir n'est pas infondé, car pour les processus stationnaires satisfaisant à certaines conditions, nous avons que , comme en probabilité. De plus dans la distribution, afin que nous puissions tester les hypothèses sur .
ρ=corr(Xt,Yt)ρ^→ρT→∞ρT−−√(ρ^−ρ)→N(0,σ2ρ)ρ
Supposons maintenant que ne soit pas stationnaire. Alors peut dépendre de . Ainsi, lorsque nous observons un échantillon de taille nous avons potentiellement besoin d'estimer différentes corrélations . Ceci est bien sûr irréalisable, donc dans le meilleur des cas, nous ne pouvons estimer que certaines fonctions de telles que la moyenne ou la variance. Mais le résultat peut ne pas avoir d'interprétation sensée. c o r r ( X t , Y t ) t T T ρ t ρ tZtcorr(Xt,Yt)tTTρtρt
Examinons maintenant ce qui se passe avec la corrélation de la marche aléatoire de processus non stationnaire probablement la plus étudiée. Nous appelons le processus une marche aléatoire si , où est un processus stationnaire. Pour simplifier, supposons que . ensuiteZ t = ∑ t s = 1 ( U t , V t ) C t = ( U t , V t ) E C t = 0Zt=(Xt,Yt)Zt=∑ts=1(Ut,Vt)Ct=(Ut,Vt)ECt=0
corr(XtYt)=EXtYtDXtDYt−−−−−−−√=E∑ts=1Ut∑ts=1VtD∑ts=1UtD∑ts=1Vt−−−−−−−−−−−−−−−−√
Pour simplifier davantage les choses, supposons que est un bruit blanc. Cela signifie que toutes les corrélations sont nulles pour . Notez que cela ne limite pas à zéro.E ( C t C t + h ) h > 0 c o r r ( U t , V t )Ct=(Ut,Vt)E(CtCt+h)h>0corr(Ut,Vt)
Alors
corr(Xt,Yt)=tEUtVtt2DUtDVt−−−−−−−−√=corr(U0,V0).
Jusqu'ici tout va bien, bien que le processus ne soit pas stationnaire, la corrélation a du sens, même si nous avons dû faire les mêmes hypothèses restrictives.
Maintenant, pour voir ce qui arrive à la corrélation d'échantillons, nous devons utiliser le fait suivant concernant les marches aléatoires, appelé théorème de la limite centrale fonctionnelle:
s∈[0,1]Wdes =(W1s,W2s)Ms=(M1s,M2s)=(
1T−−√Z[Ts]=1T−−√∑t=1[Ts]Ct→(cov(C0))−1/2Ws,
dans la distribution, où et est bivarié
Mouvement brownien (processus de Wiener bidimensionnel). Pour plus de commodité, introduisez la définition .
s∈[0,1]Ws=(W1s,W2s)Ms=(M1s,M2s)=(cov(C0))−1/2Ws
Encore une fois pour plus de simplicité, définissons la corrélation d'échantillon comme
ρ^=1T∑Tt=1XtYt1T∑Tt=1X2t1T∑Tt=1Y2t−−−−−−−−−−−−−−−−−−√
Commençons par les variances. On a
E1T∑t=1TX2t=1TE∑t=1T(∑s=1tUt)2=1T∑t=1Ttσ2U=σUT+12.
Cela va à l'infini lorsque augmente, nous avons donc rencontré le premier problème, la variance de l'échantillon ne converge pas. D'autre part , le théorème de cartographie continue en conjonction avec le théorème de limite centrale fonctionnelle nous donneT
T→∞
1T2∑t=1TX2t=∑t=1T1T(1T−−√∑s=1tUt)2→∫10M21sds
où convergence est convergence dans la distribution, comme .
T→∞
De même, nous obtenons
1
1T2∑t=1TY2t→∫10M22sds
et
1T2∑t=1TXtYt→∫10M1sM2sds
Donc, finalement, pour la corrélation de l'échantillon de notre marche aléatoire, nous obtenons
T→∞
ρ^→∫10M1sM2sds∫10M21sds∫10M22sds−−−−−−−−−−−−−−−√
dans la distribution en tant que .
T→∞
Ainsi, bien que la corrélation soit bien définie, la corrélation d'échantillon ne converge pas vers elle, comme dans le cas d'un processus stationnaire. Au lieu de cela, il converge vers une certaine variable aléatoire.