Intervalle de confiance de vraisemblance maximale
L’approximation normale de l’échantillon de Bernoulli repose sur une taille d’échantillon relativement grande et des proportions d’échantillon éloignées des queues. L'estimation du maximum de vraisemblance se concentre sur les probabilités transformées en log, ce qui fournit des intervalles efficaces et non symétriques pour qu'il convient d'utiliser.p
Définissez les cotes du journal commeβ^0=log(p^/(1−p^))
Un IC 1- pour est donné par:αβ0
CI(β0)α=β^0±Zα/21/(np^(1−p^)−−−−−−−−−−−√
Et ceci est transformé en un intervalle (non symétrique) pour avec:p
CI(p)α=1/(1+exp(−CI(β0)α)
Cet IC présente l'avantage supplémentaire que les proportions se situent dans l'intervalle compris entre 0 et 1 et qu'il est toujours plus étroit que l'intervalle normal tout en maintenant le niveau correct. Vous pouvez l'obtenir très facilement dans R en spécifiant:
set.seed(123)
y <- rbinom(100, 1, 0.35)
plogis(confint(glm(y ~ 1, family=binomial)))
2.5 % 97.5 %
0.2795322 0.4670450
Intervalles de confiance binomiaux exacts
Dans les petits échantillons, l'approximation normale de la MLE - bien que meilleure que l'approximation normale de la proportion de l'échantillon - peut ne pas être fiable. C'est bon. peut être pris pour suivre une densité binomiale . Les limites de peuvent être trouvées en prenant les 2,5ème et 97,5ème centiles de cette distribution.Y=np^(n,p)p^
CIα=(F−1p^(0.025),F−1p^(0.975))
Rarement, un intervalle de confiance binomial exact peut être obtenu manuellement pour utilisant des méthodes de calcul.p
qbinom(p = c(0.025, 0.975), size = length(y), prob = mean(y))/length(y)
[1] 0.28 0.47
Intervalles de confiance non biaisés médians
Et si est égal à 0 ou 1 exactement, un estimateur médian non biaisé peut être utilisé pour obtenir des estimations d'intervalle non singulier basées sur la fonction de probabilité médiane non biaisée. Vous pouvez trivialement prendre la limite inférieure du cas tout-0 comme 0 WLOG. La limite supérieure est toute proportion qui satisfait:pp1−α/2
p1−α/2:P(Y=0)/2+P(Y>y)>0.975
C'est aussi une routine de calcul.
set.seed(12345)
y <- rbinom(100, 1, 0.01) ## all 0
cil <- 0
mupfun <- function(p) {
0.5*dbinom(0, 100, p) +
pbinom(1, 100, p, lower.tail = F) -
0.975
} ## for y=0 successes out of n=100 trials
ciu <- uniroot(mupfun, c(0, 1))$root
c(cil, ciu)
[1] 0.00000000 0.05357998 ## includes the 0.01 actual probability
Les deux dernières méthodes sont implémentées dans le epitools
package dans R.