Ne pas utiliser l'approximation normale
Beaucoup a été écrit sur ce problème. Un conseil général est de ne jamais utiliser l'approximation normale (l'intervalle de confiance asymptotique / Wald), car elle a des propriétés de couverture terribles. Code R pour illustrer ceci:
library(binom)
p = seq(0,1,.001)
coverage = binom.coverage(p, 25, method="asymptotic")$coverage
plot(p, coverage, type="l")
binom.confint(0,25)
abline(h=.95, col="red")
Pour de petites probabilités de succès, vous pouvez demander un intervalle de confiance de 95%, mais obtenir un intervalle de confiance de 10% par exemple!
Recommandations
Alors, que devrions- nous utiliser? Je crois que les recommandations actuelles sont celles qui figurent dans le document Estimation d'intervalle pour une proportion binomiale de Brown, Cai et DasGupta dans Statistical Science 2001, vol. 16, non. 2, pages 101–133. Les auteurs ont examiné plusieurs méthodes de calcul des intervalles de confiance et sont parvenus à la conclusion suivante.
[W] e recommander l'intervalle Wilson ou la Jeffreys égale à queue intervalle avant pour les petits n et l'intervalle suggéré dans Agresti et Coull pour agrandir n .
L'intervalle de Wilson est aussi parfois appelé intervalle de score , puisqu'il repose sur l'inversion d'un test de score.
Calculer les intervalles
Pour calculer ces intervalles de confiance, vous pouvez utiliser cette calculatrice en ligne ou la binom.confint()
fonction du binom
package dans R. Par exemple, pour 0 succès dans 25 essais, le code R serait:
> binom.confint(0, 25, method=c("wilson", "bayes", "agresti-coull"),
type="central")
method x n mean lower upper
1 agresti-coull 0 25 0.000 -0.024 0.158
2 bayes 0 25 0.019 0.000 0.073
3 wilson 0 25 0.000 0.000 0.133
Voici bayes
l'intervalle de Jeffreys. (L'argument type="central"
est nécessaire pour obtenir l' intervalle égal .)
Notez que vous devez choisir l’une des trois méthodes à utiliser avant de calculer l’intervalle. En regardant les trois et en sélectionnant le plus court, vous aurez naturellement une probabilité de couverture trop faible.
Une réponse rapide et approximative
En guise de conclusion, si vous n’observez aucune réussite dans vos n essais et souhaitez un intervalle de confiance approximatif très rapide, vous pouvez utiliser la règle de trois . Il suffit de diviser le nombre 3 par n . Dans l'exemple ci-dessus, n est 25, la limite supérieure est donc 3/25 = 0,12 (la limite inférieure est bien sûr égale à 0).