Inspiré par la conférence de Peter Donnelly à TED , dans laquelle il explique combien de temps il faudrait pour qu'un certain motif apparaisse dans une série de lancers de pièces, j'ai créé le script suivant dans R. Étant donné deux modèles `` hth '' et `` htt '', il calcule le temps qu'il faut (c'est-à-dire le nombre de lancers de pièces) en moyenne avant de toucher l'un de ces motifs.
coin <- c('h','t')
hit <- function(seq) {
miss <- TRUE
fail <- 3
trp <- sample(coin,3,replace=T)
while (miss) {
if (all(seq == trp)) {
miss <- FALSE
}
else {
trp <- c(trp[2],trp[3],sample(coin,1,T))
fail <- fail + 1
}
}
return(fail)
}
n <- 5000
trials <- data.frame("hth"=rep(NA,n),"htt"=rep(NA,n))
hth <- c('h','t','h')
htt <- c('h','t','t')
set.seed(4321)
for (i in 1:n) {
trials[i,] <- c(hit(hth),hit(htt))
}
summary(trials)
Les statistiques sommaires sont les suivantes,
hth htt
Min. : 3.00 Min. : 3.000
1st Qu.: 4.00 1st Qu.: 5.000
Median : 8.00 Median : 7.000
Mean :10.08 Mean : 8.014
3rd Qu.:13.00 3rd Qu.:10.000
Max. :70.00 Max. :42.000
Dans l'exposé, il est expliqué que le nombre moyen de lancers de pièces serait différent pour les deux modèles; comme on peut le voir dans ma simulation. Malgré avoir regardé le discours à quelques reprises, je ne comprends toujours pas pourquoi ce serait le cas. Je comprends que «hth» se chevauche et intuitivement, je pense que vous frapperiez «hth» plus tôt que «htt», mais ce n'est pas le cas. J'apprécierais vraiment que quelqu'un puisse m'expliquer cela.