Pourquoi la correction de continuité (disons l'approximation normale de la distribution binomiale) fonctionne-t-elle?

24

Je souhaite mieux comprendre comment la correction de continuité de la distribution binomiale pour l'approximation normale a été dérivée.

Quelle méthode a été utilisée pour décider d'ajouter 1/2 (pourquoi pas un autre nombre?). Toute explication (ou un lien vers une lecture suggérée, autre que celle-ci , serait appréciée).

binomial asymptotics

— Tal Galili
source

29

En fait cela ne "marche" pas toujours (dans le sens de toujours améliorer l'approximation du cdf binomial par la normale en tout $x$ ). Si le binôme $p$ vaut 0,5, je pense que ça aide toujours, sauf peut-être pour la queue la plus extrême. Si $p$ n'est pas trop éloigné de 0,5, pour raisonnablement grand, $n$ il fonctionne généralement très bien sauf dans la queue la plus éloignée, mais si $p$ est proche de 0 ou 1, cela pourrait ne pas aider du tout (voir le point 6. ci-dessous)
Une chose à garder à l'esprit (malgré les illustrations impliquant presque toujours pmfs et pdfs) est que la chose que nous essayons d'approcher est le cdf. Il peut être utile de réfléchir à ce qui se passe avec le cdf du binôme et la normale approximative (par exemple, voici $n=20,p=0.5$ ):

Dans la limite, le cdf d'un binôme normalisé ira à une normale standard (notez que la normalisation affecte l'échelle sur l'axe des x mais pas sur l'axe des y); le long de la façon de plus en plus grand $n$ de sauts de la cdf binomiale ont tendance à enjamber plus uniformément la cdf normale.

Zoomons et regardons cela dans l'exemple simple ci-dessus:

Notez que puisque la normale approximative passe près du milieu des sauts verticaux *, alors qu'à la limite le cdf normal est localement approximativement linéaire et (tout comme la progression du cdf binomial au sommet de chaque saut); en conséquence, le cdf a tendance à traverser les marches horizontales près de . Si vous voulez approximer la valeur du cdf binomial,à l'entier, le cdf normal atteint cette hauteur près de $x+\frac{_1}{^2}$ $F(x)$ $x$ . $x+\frac{_1}{^2}$

* Si nous appliquons Berry-Esseen aux variables de Bernoulli à moyenne corrigée, les limites de Berry-Esseen permettent très peu de marge de manœuvre lorsque est proche de $p$ etest proche de- le cdf normal doit y passer raisonnablement près du milieu des sauts car sinon la différence absolue en cdfs dépassera la meilleure limite Berry-Essen d'un côté ou de l'autre. Cela se rapporte à son tour à quelle distance de $\frac12$ $x$ $\mu$ le cdf normal peut traverser la partie horizontale de la fonction pas à pas du cdf binomial. $x+\frac{_1}{^2}$
En développant la motivation qu'en 1. considérons comment nous utiliserions une approximation normale du cdf binomial pour calculer . Par exemple, (voir le deuxième diagramme ci-dessus). Donc, notre normale avec la même moyenne et sd est $P(X=k)$ $n=20, p=0.5, k=9$ . Notez que nous rapprocherions le saut en cdf à 9 par le changement de cdf normal entre environ 8.5 et 9.5. $N(10,(\sqrt{5})^2)$

$p(x)$ $x$ $p(x)$

$x-\frac12$ $x+\frac12$ $\frac12$

On peut motiver cette approche algébriquement en utilisant une dérivation [le long des lignes de De Moivre - voir ici ou ici par exemple] pour dériver l'approximation normale (bien qu'elle puisse être effectuée un peu plus directement que l'approche de De Moivre).

${n \choose x}$ $\log(1+x)\approx x-x^2/2$

$P (X = X) \approx \frac{1}{\sqrt{2 π n p (1 - p)}} \exp (- \frac{(X - n p)^{2}}{2 n p (1 - p)})$ $P(X=x)\approx \frac{1}{\sqrt{2\pi np(1-p)}}\exp(-\frac{(x-np)^2}{2np(1-p)})$
$\mu=np$ $\sigma^2 = np(1-p)$ $x$ $x$

$Y\sim N(np,np(1-p))$ $F(y+\frac12)-F(y-\frac12) = \int_{y-\frac12}^{y+\frac12}f_Y(u)du\approx f_Y(y)$ $f_Y(x)\approx P(X=x)$ $P(X=x)\approx F(x+\frac12)-F(x-\frac12)$

[Une approximation de type "règle médiane" similaire peut être utilisée pour motiver d'autres approximations de pmfs continues par des densités utilisant une correction de continuité, mais il faut toujours faire attention à l'endroit où il est logique d'invoquer cette approximation]
Note historique: la correction de continuité semble provenir d'Auguste de Morgan en 1838 comme une amélioration de l'approximation de De Moivre. Voir, par exemple, Hald (2007) [1]. D'après la description de Hald, son raisonnement allait dans le sens du point 4. ci-dessus (c'est-à-dire essentiellement en termes d'essayer d'approcher le pmf en remplaçant le pic de probabilité par un "bloc" de largeur 1 centré sur la valeur x).
Une illustration d'une situation où la correction de continuité n'aide pas:

$X$ $Y$ $F_X(x)\approx F_Y(x+\frac12)$ $p(x) \approx F_Y(x+\frac12)-F_Y(x-\frac12)$ $F_X(x)\approx F_Y(x)$ $p(x) \approx F_Y(x)-F_Y(x-1)$

[1]: Hald, Anders (2007),
"A History of Parametric Statistical Inference from Bernoulli to Fisher, 1713-1935",
Sources and Studies in the History of Mathematics and Physical Sciences,
Springer-Verlag New York.

— Glen_b -Reinstate Monica
source

1

Je crois que le facteur découle du fait que nous comparons une distribution continue à un discret. Nous devons donc traduire ce que signifie chaque valeur discrète dans la distribution continue. Nous pourrions choisir une autre valeur, mais celle-ci serait déséquilibrée pour un entier donné. (c.-à-d. vous pondéreriez la probabilité d'être à 6 de plus vers 7 à 5.)

J'ai trouvé un lien utile ici: lien

— Kitter Catter
source