En supposant que vos matrices sont quelque chose comme
Pij=Pr[j∣i],Qij=∑t=1N[xt=i&xt+1=j]
alors vous pourriez interpréter chaque ligne comme une distribution multinomiale avec les paramètres
ipi=Pi,:,ni=∑j=1KQij
Je ne suis pas sûr que vous puissiez regrouper toutes les lignes ensemble, car le "nombre d'essais" variera entre les lignes.
Par exemple, dites et vos données sont . Il y a donc transitions, avec venant de , mais de et seulement et de . Je pense donc que votre confiance dans devrait généralement être plus élevée que votre confiance dans .K=3x=[1,1,2,1,2,3,1,2]N=7n1=4x=1n2=2x=2n3=1x=3p^1p^3
(Dans le cas extrême, peut-être que pour cet exemple, était en fait , mais vous n'avez aucune donnée sur ces transitions, car Le traitement de "l'absence de preuves comme des preuves d'absence" me semble problématique ici.)K4n4=0
Je ne suis pas très familier avec les tests du chi carré, mais cela suggère que vous voudrez peut-être traiter les lignes indépendamment (c'est-à-dire additionner uniquement sur et utiliser plutôt que ). Ce raisonnement ne semble pas spécifique au test du chi carré, donc devrait également s'appliquer à tout autre test de signification que vous pourriez utiliser (par exemple multinomial exact ).jniN
Le problème clé est que les probabilités de transition sont conditionnelles , donc pour chaque entrée de matrice, seules les transitions qui satisfont à sa condition préalable sont pertinentes. En effet, on suppose que la matrice de transition satisfera , donc la "matrice de transition empirique" devrait être .∑jPij=1P^ij=Qij/ni
Mise à jour: En réponse à la requête de l'OP, une clarification sur les "paramètres de test".
S'il y a états dans la chaîne de Markov, c'est-à-dire , alors pour la ligne , la distribution multinomiale correspondante aura le vecteur de probabilité et nombre d'essais , donnés ci-dessus.KP∈RK×Kipi∈RKni∈N
Il y aura donc catégories, et le vecteur de probabilité aura degrés de liberté, comme . Donc, pour la ligne la statistique correspondante serait
qui sera asymptotiquement suivre un chi carré distribué avec degrés de liberté (comme indiqué ici et ici ). Voir également ici pour une discussion sur le moment où le est approprié, et des tests alternatifs qui peuvent être plus appropriés.KpiK−1∑Kj=1(pi)j=1iχ2
χ2i=∑j(Qij−niPij)2niPij
K−1χ2
Il peut être possible de faire un "test ", en supposant que suit une distribution chi au carré avec dof (c'est-à-dire la somme des dofs sur les lignes). Cependant, je ne suis pas certain que le puisse être traité comme indépendant. Dans tous les cas, les tests en ligne semblent être plus informatifs, ils peuvent donc être préférables à un test en bloc.χ2P=∑iχ2iK(K−1)χ2i