De nombreux intervalles de confiance fréquentistes (IC) sont basés sur la fonction de vraisemblance. Si la distribution a priori est vraiment non informative, alors le postérieur bayésien a essentiellement les mêmes informations que la fonction de vraisemblance. Par conséquent, dans la pratique, un intervalle de probabilité bayésien (ou intervalle crédible) peut être très similaire numériquement à un intervalle de confiance fréquentiste. [Bien sûr, même s'ils sont numériquement similaires, il existe des différences philosophiques d' interprétation entre les estimations de l'intervalle fréquentiste et bayésien.]
Voici un exemple simple, estimant la probabilité de réussite binomiale θ.
Supposons que nous ayons n=100 observations (essais) avec X=73 succès.
Frequentist: Les traditionnels intervalle Wald utilise l'estimation ponctuelle
θ = X / n = 73 / 100 = 0,73. Et l'IC à 95% est de la forme
& thetav ± 1,96 √θ^=X/n=73/100=0.73.
θ^±1.96θ^(1−θ^)n−−−−−−−−√,
qui calcule à
(0.643,0.817).
n = 100; x = 73; th.w = x/n; pm = c(-1,1)
ci.w = th.w + pm*1.96*sqrt(th.w*(1-th.w)/n); ci.w
[1] 0.6429839 0.8170161
Cette forme de CI suppose que les distributions binomiales pertinentes peuvent être approximées par des distributions normales et que la marge d'erreur est bien approximé par
√θ(1−θ)/n−−−−−−−−−√En particulier pour les petitsn,ces hypothèses n'ont pas besoin d'être vraies. [Les cas oùX=0ouX=nsont particulièrement problématiques.]θ^(1−θ^)/n−−−−−−−−−√.n,X=0X=n
Il a été démontré que le CI Agresti-Coull a une probabilité de couverture plus précise. Cet intervalle «ajoute deux succès et deux échecs» comme astuce pour obtenir une probabilité de couverture plus proche de 95%. Il commence par l'estimation ponctuelle
où ˜ n + 4. Alors un IC à 95% est de la forme
˜ θ ± 1,96 √θ~=(X+2)/n~,n~+4.
qui calcule à(0,612,0,792). Pourn>100et0,3<˜θ<0,7,la différence entre ces deux styles d'intervalles de confiance est presque négligeable.
θ~±1.96θ~(1−θ~)n~−−−−−−−−√,
(0.612,0.792).n>1000.3<θ~<0.7,
ci.a = th.a + pm*1.96*sqrt(th.a*(1-th.a)/n); ci.a
[1] 0.6122700 0.7915761
Bayésien:
Un avant non informatif populaire dans cette situation est La fonction de vraisemblance est proportionnelle à
θ x ( 1 - θ ) n - x . En multipliant les noyaux de l'a priori et de la vraisemblance, nous avons le noyau de la distribution postérieure
B e t a ( x + 1 ,Beta(1,1)≡Unif(0,1).θX( 1 - θ )n - x.B e t a (x+1,n - x + 1 ) .
Ensuite, une estimation de l'intervalle bayésien à 95% utilise les quantiles 0,025 et 0,975 de la distribution postérieure pour obtenir
Lorsque la distribution antérieure est «plate» ou «non informative», la différence numérique entre l'intervalle de probabilité bayésien et l'intervalle de confiance Agresti-Coull est faible.(0.635,0.807).
qbeta(c(.025, .975), 74, 28)
[1] 0.6353758 0.8072313
Notes: (a) Dans cette situation, certains bayésiens préfèrent l' a priori non (b) Pour des niveaux de confiance autres que 95%, l'IC Agresti-Coull utilise une estimation ponctuelle légèrement différente. (c) Pour les données autres que binomiales, il peut ne pas y avoir d'a priori «plat» disponible, mais on peut choisir un a priori avec une énorme variance (petite précision) qui contient très peu d'informations. (d) Pour une discussion plus approfondie des Agresti-Coull Kis, graphiques des probabilités de couverture, et quelques références, peut - être aussi voir ce Q & A .Beta(.5,.5).