Synopsis
Vous avez redécouvert une partie de la construction décrite dans le théorème de limite centrale pour les médianes d'échantillon , qui illustre une analyse de la médiane d'un échantillon. (L'analyse s'applique évidemment, mutatis mutandis , à tout quantile, pas seulement à la médiane). Par conséquent, il n'est pas surprenant que pour les grands paramètres bêta (correspondant à de grands échantillons) une distribution normale se produit sous la transformation décrite dans la question. Ce qui est intéressant, c'est à quel point la distribution est normale, même pour les petites paramètres bêta. Cela mérite une explication.
Je vais esquisser une analyse ci-dessous. Pour garder ce message à une longueur raisonnable, il implique beaucoup de signes de main suggestifs: je ne vise qu'à souligner les idées clés. Permettez-moi donc de résumer les résultats ici:
Quand est proche de β , tout est symétrique. Cela fait que la distribution transformée a déjà l'air normale.αβ
Les fonctions de la forme semblent assez normales en premier lieu, même pour les petites valeurs de α et β (à condition que les deux dépassent 1 et que leur rapport ne soit pas trop proche de 0 ou 1 ).Φα−1(x)(1−Φ(x))β−1αβ101
La normalité apparente de la distribution transformée est due au fait que sa densité consiste en une densité normale multipliée par une fonction en (2).
À mesure que et β augmentent, l'écart par rapport à la normalité peut être mesuré dans les termes restants dans une série de Taylor pour la densité logarithmique. Le terme d'ordre n décroît proportionnellement aux puissances ( n - 2 ) / 2 de α et β . Cela implique que finalement, pour des α et β suffisamment grands , tous les termes de puissance n = 3 ou plus sont devenus relativement petits, ne laissant qu'un quadratique: qui est précisément la densité logarithmique d'une distribution normale.αβn(n−2)/2αβαβn=3
Collectivement, ces comportements expliquent bien pourquoi même pour les petits et βαβ les quantiles non extrêmes d'un échantillon iid Normal semblent approximativement normaux.
Une analyse
Parce qu'il peut être utile de généraliser, que soit n'importe quelle fonction de distribution, bien que nous ayons à l'espritF .F=Φ
La fonction de densité d'un Beta ( α , βg(y)variable ) est, par définition, proportionnelle à(α,β)
yα−1(1−y)β−1dy.
Soit la transformée intégrale de probabilité de x et l'écriture de f pour la dérivée de Fy=F(x)xfF , il est immédiat que ait une densité proportionnelle àx
G(x;α,β)=F(x)α−1(1−F(x))β−1f(x)dx.
Parce qu'il s'agit d'une transformation monotone d'une distribution fortement unimodale (une Beta), à moins que ne soit plutôt étrange, la distribution transformée sera également unimodale. Pour étudier sa proximité avec la normale, examinons le logarithme de sa densité,F
logG(x;α,β)=(α−1)logF(x)+(β−1)log(1−F(x))+logf(x)+C(1)
où C est une constante de normalisation non pertinente.
Développez les composantes de dans la série de Taylor pour en ordonner trois autour d'une valeur x 0 (qui sera proche d'un mode). Par exemple, nous pouvons écrire l'expansion de log F commelogG(x;α,β)x0logF
logF(x)=cF0+cF1(x−x0)+cF2(x−x0)2+cF3h3
pour certains avec | h | ≤ | x - x 0 | . Utilisez une notation similaire pour log ( 1 - F ) et log f . h|h|≤|x−x0|log(1−F)logf
Termes linéaires
Le terme linéaire dans devient ainsi(1)
g1(α,β)=(α−1)cF1+(β−1)c1−F1+cf1.
Lorsque est un mode de G (x0 , cette expression est nulle. Notez que parce que les coefficients sont des fonctions continues de x 0 , comme α et β varient, le mode x 0 variera également en continu. De plus, une fois que α et β sont suffisamment grands, leterme c f 1 devient relativement sans conséquence. Si nous cherchons à étudier la limite α → ∞ et β → ∞ pour laquelle α : β reste en proportion constante γG(;α,β)x0αβx0αβcf1α→∞β→∞ α:βγ, we may therefore once and for all choose a base point x0 for which
γcF1+c1−F1=0.
A nice case is where γ=1, where α=β throughout, and F is symmetric about 0. In that case it is obvious x0=F(0)=1/2.
We have achieved a method whereby (a) in the limit, the first-order term in the Taylor series vanishes and (b) in the special case just described, the first-order term is always zero.
Quadratic terms
Ce sont la somme
g2(α,β)=(α−1)cF2+(β−1)c1−F2+cf2.
−(1/2)(x−x0)2/σ2, we may estimate that −1/(2g2(α,β)) is approximately the variance of G. Let us standardize G by rescaling x by its square root. we don't really need the details; it suffices to understand that this rescaling is going to multiply the coefficient of (x−x0)n in the Taylor expansion by (−1/(2g2(α,β)))n/2.
Remainder term
Here's the punchline: the term of order n in the Taylor expansion is, according to our notation,
gn(α,β)=(α−1)cFn+(β−1)c1−Fn+cfn.
After standardization, it becomes
g′n(α,β)=gn(α,β)(−2g2(α,β))n/2).
Both of the gi are affine combination of α and β. By raising the denominator to the n/2 power, the net behavior is of order −(n−2)/2 in each of α and β. As these parameters grow large, then, each term in the Taylor expansion after the second decreases to zero asymptotically. In particular, the third-order remainder term becomes arbitrarily small.
The case when F is normal
The vanishing of the remainder term is particularly fast when F is standard Normal, because in this case f(x) is purely quadratic: it contributes nothing to the remainder terms. Consequently, the deviation of G from normality depends solely on the deviation between Fα−1(1−F)β−1 and normality.
This deviation is fairly small even for small α and β. To illustrate, consider the case α=β. G is symmetric, whence the order-3 term vanishes altogether. The remainder is of order 4 in x−x0=x.
Here is a plot showing how the standardized fourth order term changes with small values of α>1:
The value starts out at 0 for α=β=1, because then the distribution obviously is Normal (Φ−1 applied to a uniform distribution, which is what Beta(1,1) is, gives a standard Normal distribution). Although it increases rapidly, it tops off at less than 0.008--which is practically indistinguishable from zero. After that the asymptotic reciprocal decay kicks in, making the distribution ever closer to Normal as α increases beyond 2.