Le test de Barnard est utilisé lorsque le paramètre de nuisance est inconnu sous l'hypothèse nulle.
Cependant, dans le test de dégustation de la femme, vous pourriez faire valoir que le paramètre de nuisance peut être fixé à 0,5 sous l'hypothèse nulle (la femme non informée a une probabilité de 50% de deviner correctement une tasse).
Ensuite, le nombre de suppositions correctes, dans l'hypothèse nulle, devient une distribution binomiale: deviner 8 tasses avec une probabilité de 50% pour chaque tasse.
Dans d'autres cas, vous ne pouvez pas avoir cette probabilité triviale de 50% pour l'hypothèse nulle. Et sans marges fixes, vous ne savez peut-être pas quelle devrait être cette probabilité. Dans ce cas, vous avez besoin du test de Barnard.
Même si vous effectuiez le test de Barnard sur le test de dégustation de thé pour femme, cela deviendrait de toute façon 50% (si le résultat est toutes les suppositions correctes) car le paramètre de nuisance avec la valeur p la plus élevée est 0,5 et entraînerait le test binomial trivial ( il s'agit en fait de la combinaison de deux tests binomiaux, l'un pour les quatre premières tasses de lait et l'autre pour les quatre premières tasses de thé).
> library(Barnard)
> barnard.test(4,0,0,4)
Barnard's Unconditional Test
Treatment I Treatment II
Outcome I 4 0
Outcome II 0 4
Null hypothesis: Treatments have no effect on the outcomes
Score statistic = -2.82843
Nuisance parameter = 0.5 (One sided), 0.5 (Two sided)
P-value = 0.00390625 (One sided), 0.0078125 (Two sided)
> dbinom(8,8,0.5)
[1] 0.00390625
> dbinom(4,4,0.5)^2
[1] 0.00390625
Voici comment cela se passerait pour un résultat plus compliqué (si toutes les suppositions ne sont pas correctes, par exemple 2 contre 4), alors le décompte de ce qui est et de ce qui n'est pas extrême devient un peu plus difficile
(Notez également que le test de Barnard utilise, dans le cas d'un résultat 4-2 un paramètre de nuisance p = 0,686 dont vous pourriez dire qu'il n'est pas correct, la valeur de p pour une probabilité de 50% de répondre au `` thé d'abord '' serait de 0,08203125. Cela devient encore plus petit lorsque vous considérez une région différente, au lieu de celle basée sur les statistiques de Wald, bien que la définition de la région ne soit pas si facile )
out <- rep(0,1000)
for (k in 1:1000) {
p <- k/1000
ps <- matrix(rep(0,25),5) # probability for outcome i,j
ts <- matrix(rep(0,25),5) # distance of outcome i,j (using wald statistic)
for (i in 0:4) {
for (j in 0:4) {
ps[i+1,j+1] <- dbinom(i,4,p)*dbinom(j,4,p)
pt <- (i+j)/8
p1 <- i/4
p2 <- j/4
ts[i+1,j+1] <- (p2-p1)/sqrt(pt*(1-pt)*(0.25+0.25))
}
}
cases <- ts < ts[2+1,4+1]
cases[1,1] = TRUE
cases[5,5] = TRUE
ps
out[k] <- 1-sum(ps[cases])
}
> max(out)
[1] 0.08926748
> barnard.test(4,2,0,2)
Barnard's Unconditional Test
Treatment I Treatment II
Outcome I 4 2
Outcome II 0 2
Null hypothesis: Treatments have no effect on the outcomes
Score statistic = -1.63299
Nuisance parameter = 0.686 (One sided), 0.314 (Two sided)
P-value = 0.0892675 (One sided), 0.178535 (Two sided)