Comment tester si «l'état précédent» a une influence sur «l'état suivant» dans R


10

Imaginez une situation: nous avons des enregistrements historiques (20 ans) de trois mines. La présence d'argent augmente-t-elle la probabilité de trouver de l'or l'année prochaine? Comment tester une telle question?


entrez la description de l'image ici

Voici des exemples de données:

mine_A <- c("silver","rock","gold","gold","gold","gold","gold",
            "rock","rock","rock","rock","silver","rock","rock",
            "rock","rock","rock","silver","rock","rock")
mine_B <- c("rock","rock","rock","rock","silver","rock","rock",
            "silver","gold","gold","gold","gold","gold","rock",
            "silver","rock","rock","rock","rock","rock")
mine_C <- c("rock","rock","silver","rock","rock","rock","rock",
            "rock","silver","rock","rock","rock","rock","silver",
            "gold","gold","gold","gold","gold","gold")
time <- seq(from = 1, to = 20, by = 1)


1
Vous pourriez être intéressé par le calcul des matrices de transition .
Andy W

Salut @AndyW! Merci pour le commentaire. Je connais le paquet de matrices de transition: makkovchain - markovchainFit (). Puis-je utiliser les valeurs de probabilité de la matrice de transition comme valeurs p? Existe-t-il un moyen de tester l'hypothèse: "Il existe une relation" argent-or "". (valeur p = xx)?
Ladislav Naďo

1
Les probabilités de transition @LadislavNado ne peuvent pas être interprétées comme des valeurs p (elles ne vous disent rien sur le rejet de tout H0), voir stats.stackexchange.com/questions/31/… pour en savoir plus sur les valeurs p.
Tim

1
Je vois un problème avec la façon dont vous avez extrait vos données. Considérez votre scénario "argent: non" et "or: oui", vous devriez également compter vos séries consécutives "d'or" car cela répond aux critères logiques.

1
Une cellule étant corrigée de 1 à 14, le modèle devient: Coefficients: Estimation Std. Erreur valeur z Pr (> | z |) (Interception) -1,2528 0,8018 -1,562 0,118 as.factor (c (0, 1)) 1 0,3655 0,8624 0,424 0,672

Réponses:


4

Mon meilleur essai: ... l'utilisation des matrices de transition suggérées par @AndyW n'est probablement pas la solution que je recherche (basée sur le commentaire de @ Tim). J'ai donc essayé une approche différente. J'ai trouvé ce lien qui traite de la façon de faire une régression logistique où la variable de réponse y et une variable prédictive x sont toutes deux binaires .

Selon l'exemple, je devrais créer un tableau 2 × 2 basé sur mes données:

               gold (yes)  gold (no)
silver (yes)       2           7
silver (no)       14          34

Comment j'ai extrait les valeurs: entrez la description de l'image ici

Et construisez un modèle:

response <- cbind(yes = c(2, 14), no = c(7, 34))

mine.logistic <- glm(response ~ as.factor(c(0,1)),
                      family = binomial(link=logit))

summary(mine.logistic)
# Coefficients:
#                     Estimate Std. Error z value Pr(>|z|)
# (Intercept)          -1.2528     0.8018  -1.562    0.118
# as.factor(c(0, 1))1   0.3655     0.8624   0.424    0.672

Est-ce une bonne solution? La valeur de p (0,673) signifie-t-elle que la présence d'argent n'augmente pas la probabilité de trouver de l'or?


Comment avez-vous généré ces jolis graphiques? Tikz?
shadowtalker

Salut @ssdecontrol! Les graphiques ont été créés à la main dans Inkscape.
Ladislav Naďo, le

Oui, c'est une interprétation décente. De plus, si vous regardez simplement les rangées de votre tableau 2x2, sur la rangée du haut (argent: oui), vous avez 9 caisses, dont 2 d'or, donc étant donné la probabilité d'argent d'or l'année prochaine est de 2/9 = 0,222. Sur la rangée du bas (argent: non), vous avez 48 cas, dont 14 avaient de l'or l'année prochaine, donc sans probabilité d'argent, l'or est de 14 / (14 + 34) = 0,292. Compte tenu de tout cela, l'argent semble nuire à vos chances de trouver de l'or, bien que vos valeurs de p ne soient pas "statistiquement significatives".
Gregor Thomas

Faites également attention à votre codage, vous commencez par yes = c(2, 14), no = c(7, 34), ce qui signifie que vous mettez Silver: oui d'abord. Donc quand vous faites as.factor(c(0, 1))le 0 correspond à l'argent: oui, qui est votre niveau de référence et donc votre interception. La valeur de 0,67 p correspond à la petite bosse positive que vous obtenez en probabilité de trouver de l'or passant de l'argent: oui à l'argent: non.
Gregor Thomas

Un dernier commentaire: vous sont en utilisant des matrices de transition. Votre matrice 2, 7, 14, 34 est une matrice de transition.
Gregor Thomas
En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.