Au-delà de la propriété de Markov (MP), une autre propriété est l' homogénéité temporelle (TH): peut être Markov mais avec sa matrice de transition
P ( t ) en fonction du temps t . Par exemple, cela peut dépendre du jour de la semaine à t si les observations sont quotidiennes, puis une dépendance
X t à X t - 7 conditionnelle à X t - 1 peut être diagnostiquée si TH est indûment supposé.XtP(t)ttXtXt−7Xt−1
En supposant que TH se vérifie, une vérification possible de MP teste que est indépendant de X t - 2 conditionnel à X t - 1 , comme Michael Chernick et StasK l'ont suggéré. Cela peut être fait en utilisant un test pour la table de contingence. On peut construire les n tables de contingence de X t et X t - 2
conditionnellement à { X t - 1 = x j } pour les n valeurs possibles x jXtXt−2Xt−1nXtXt−2{Xt−1=xj}nxjet tester l'indépendance. Cela peut également être fait en utilisant
avec ℓ > 1 à la place de X t - 2 .Xt−ℓℓ>1Xt−2
Dans R, les tableaux de contingence ou les tableaux sont facilement produits grâce au facteur installation et les fonctions apply
,
sweep
. L'idée ci-dessus peut également être exploitée graphiquement. Les packages ggplot2 ou lattice fournissent facilement des tracés conditionnels pour comparer les distributions conditionnelles . Par exemple, définir i comme index de ligne et jp(Xt|Xt−1=xj,Xt−2=xi)ij comme l'index de colonne dans le treillis devrait sous MP conduire à des distributions similaires dans une colonne.
Le chap. 5 du livre L'analyse statistique des processus stochastiques dans le temps par JK Lindsey contient d'autres idées pour vérifier les hypothèses.
[## simulates a MC with transition matrix in 'trans', starting from 'ini'
simMC <- function(trans, ini = 1, N) {
X <- rep(NA, N)
Pcum <- t(apply(trans, 1, cumsum))
X[1] <- ini
for (t in 2:N) {
U <- runif(1)
X[t] <- findInterval(U, Pcum[X[t-1], ]) + 1
}
X
}
set.seed(1234)
## transition matrix
P <- matrix(c(0.1, 0.1, 0.1, 0.7,
0.1, 0.1, 0.6, 0.2,
0.1, 0.3, 0.2, 0.4,
0.2, 0.2, 0.3, 0.3),
nrow = 4, ncol = 4, byrow = TRUE)
N <- 2000
X <- simMC(trans = P, ini = 1, N = N)
## it is better to work with factors
X <- as.factor(X)
levels(X) <- LETTERS[1:4]
## table transitions and normalize each row
Phat <- table(X[1:(N-1)], X[2:N])
Phat <- sweep(x = Phat, MARGIN = 1, STATS = apply(Phat, 1, sum), FUN = "/")
## explicit dimnames
dimnames(Phat) <- lapply(list("X(t-1)=" ,"X(t)="),
paste, sep = "", levels(as.factor(X)))
## transition 3-fold contingency array
P3 <- table(X[1:(N-2)], X[2:(N-1)], X[3:N])
dimnames(P3) <- lapply(list("X(t-2)=", "X(t-1)=" ,"X(t)="),
paste, sep = "", levels(as.factor(X)))
## apply ONE indendence test
fisher.test(P3[ , 1, ], simulate.p.value = TRUE)
## plot conditional distr.
library(lattice)
X3 <- data.frame(X = X[3:N], lag1X = X[2:(N-1)], lag2X = X[1:(N-2)])
histogram( ~ X | lag1X + lag2X, data = X3, col = "SteelBlue3")
]