Inverser Chernoff lié


31

Y a-t-il une borne inverse de Chernoff qui limite la probabilité de queue au moins autant.

c'est-à-dire si X1,X2,,Xn sont des variables aléatoires binomiales indépendantes et μ=E[i=1nXi] . Alors peut-on prouver Pr[i=1nXi(1+δ)μ]f(μ,δ,n) pour une fonction f .


1
Votre exemple demande trop: avec p=n2/3 , une norme liée Chernoff montre que Pr[|TS1|1.1n1/3] et Pr[|TS2|1.1n1/3] sont à la plupart des exp(cn1/3) pour certains c .
Colin McQuillan

Vous avez raison, je me suis trompé sur le terme en chernoff lié qui a le carré. J'ai changé la question pour refléter une limite plus faible. Je ne pense pas que cela m'aidera dans ma candidature actuelle, mais cela pourrait être intéressant pour d'autres raisons.
Ashwinkumar BV

Réponses:


28

Voici une preuve explicite qu'une borne de Chernoff standard est serrée à des facteurs constants dans l'exposant pour une plage particulière de paramètres. (En particulier, chaque fois que les variables sont 0 ou 1, et 1 avec une probabilité de 1/2 ou moins, et ϵ(0,1/2) , et que la limite supérieure de Chernoff est inférieure à une constante.)

Si vous trouvez une erreur, faites-le moi savoir.

Lemme 1. (serrage de la borne de Chernoff) Soit X la moyenne de k variables aléatoires indépendantes (0/1) (rv). Pour tout ϵ(0,1/2] et p(0,1/2] , en supposant ϵ2pk3 ,

(i) Si chaque rv est 1 avec une probabilité au plus , alorsp

Pr[X(1ϵ)p]  exp(9ϵ2pk).

(ii) Si chaque rv est 1 avec une probabilité d'au moins , alorsp

Pr[X(1+ϵ)p]  exp(9ϵ2pk).

Preuve. Nous utilisons l'observation suivante:

Revendication 1. Si , alors 1k1(k)  1e2π(k)(kk)k

Preuve de revendication 1. Par approximation de Stirling, oùi!=2πi(i/e)ieλλ[1/(12i+1),1/12i].

Ainsi, , qui est , est au moins QED(k)k!!(k)!

2πk(ke)k2π(e)  2π(k)(ke)kexp(112k+1112112(k))
  12π(k)(kk)ke1.

Preuve du lemme 1 partie (i). Sans perte de généralité, supposons que chaque variable aléatoire 0/1 dans la somme est 1 avec une probabilité exactement . Remarque est égal à la somme , et .X pPr[X(1ϵ)p]i=0(1ϵ)pkPr[X=i/k]Pr[X=i/k]=(ki)pi(1p)ki

Fixez . Les termes dans la somme augmentent, donc les termes d'index ont chacun une valeur au moins , donc leur somme a une valeur totale au moins . Pour compléter la preuve, nous montrons que =(12ϵ)pk+1iPr[X=/k](ϵpk2)Pr[X=/k]

(ϵpk2)Pr[X=/k]  exp(9ϵ2pk).

Les hypothèses et donnent , donc le côté gauche ci-dessus est au moins . En utilisant la revendication 1, pour lier , c'est à son tour au moins où et ϵ2pk3ϵ1/2ϵpk623ϵpk(k)p(1p)k(k)ABA=23eϵpk/2πB=(k)(kk)kp(1p)k.

Pour terminer, nous montrons et .Aexp(ϵ2pk)Bexp(8ϵ2pk)

Revendication 2. Aexp(ϵ2pk)

Preuve de revendication 2. Les hypothèses et impliquent (i) .ϵ2pk3ϵ1/2pk12

Par définition, . Par (i), . Ainsi, (ii) .pk+1pk121.1pk

La substitution du côté droit de (ii) à dans donne (iii) .AA23eϵpk/2.2π

L'hypothèse, , implique , qui avec (iii) donne (iv) .ϵ2pk3ϵpk3A23e3/2.2π0.1

De il s'ensuit que (v) .ϵ2pk3exp(ϵ2pk)exp(3)0.04

(iv) et (v) donnent ensemble la demande. QED

Revendication 3. .Bexp(8ϵ2pk)

Preuve de revendication 3. Fixez telle sorte que . Le choix de implique , donc la revendication restera aussi longtemps que . En prenant chaque côté de cette dernière inégalité à la puissance et en simplifiant, cela équivaut à Substituant et simplifiant, il équivaut à δ=(1δ)pk
δ2ϵBexp(2δ2pk)1/

pk(k(1p)k)k/1  exp(2δ2pk).
=(1δ)pk
(1δ)(1+δp1p)1(1δ)p1  exp(2δ21δ).
En prenant le logarithme des deux côtés et en utilisant deux fois, il tiendra aussi longtemps que Le côté gauche ci-dessus se simplifie en , qui est inférieur à car . QEDln(1+z)z
δ+δp1p(1(1δ)p1)  2δ21δ.
δ2/(1p)(1δ)2δ2/(1δ)p1/2

Les revendications 2 et 3 impliquent . Cela implique une partie (i) du lemme.ABexp(ϵ2pk)exp(8ϵ2pk)

Preuve du lemme 1 partie (ii). Sans perte de généralité, supposons que chaque variable aléatoire est avec une probabilité exactement .1p

Remarque . Fixez .Pr[X(1+ϵ)p]=i=(1ϵ)pknPr[X=i/k]^=(1+2ϵ)pk1

Les derniers termes dans la somme totale au moins , qui est au moins . (La preuve en est la même que pour (i), sauf avec remplacé par et remplacé par telle sorte que .) QEDϵpk(ϵpk2)Pr[X=^/k]exp(9ϵ2pk)^δδ^^=(1+δ^)pk


Plusieurs [erreur de traitement mathématique] - une chance de les corriger?
Aryeh

Ces expressions mathématiques affichaient très bien. Pour une raison quelconque, la commande \ choose ne fonctionne pas dans mathjax. \ Binom non plus. Par exemple, $ a \ choose b $ donne . Vraisemblablement, c'est un bogue dans la configuration mathjax. Espérons que ce sera bientôt corrigé. En attendant, voir le lemme 5.2 dans l'annexe de arxiv.org/pdf/cs/0205046v2.pdf ou cs.ucr.edu/~neal/Klein15Number . (ab)
Neal Young

22

Le théorème de Berry-Esseen peut donner des limites inférieures de probabilité de queue, tant qu'elles sont supérieures à .n1/2

Un autre outil que vous pouvez utiliser est l' inégalité de Paley-Zygmund . Cela implique que pour tout entier pair et toute variable aléatoire de valeur réelle ,kX

Pr[|X|>=12(E[Xk])1/k]E[Xk]24E[X2k]

Avec le théorème multinomial, pour une somme de variables aléatoires rademacher Paley-Zygmund peut vous donner des bornes inférieures assez fortes. Il fonctionne également avec des variables aléatoires d'indépendance bornée. Par exemple , vous obtenez facilement que la somme indépendante 4-sage variables aléatoires est avec une probabilité constante.Xnn±1Ω(n)


14

Si vous êtes en effet d'accord avec les sommes limites des essais de Bernoulli (et non, disons, les variables aléatoires bornées), ce qui suit est assez serré.

Inégalité des boues *. Soit être iid dessine à partir d'un RV de Bernoulli avec , et que l'entier soit donné. Si (a) et , ou (b) , alors où est le cdf d'une normale standard.{Xi}i=1nE(X1)=pknp1/4npknpkn(1p)

Pr[iXik]1Φ(knpnp(1p)),
Φ

(Traiter l'argument de comme transformant la normale standard, cela correspond exactement à ce que le CLT vous dit; en fait, cela nous dit que les binômes satisfaisant aux conditions du théorème domineront leurs gaussiens correspondants sur les queues supérieures.)Φ

À partir d'ici, vous pouvez utiliser des limites sur pour obtenir quelque chose de plus agréable. Par exemple, dans le premier livre de Feller, dans la section sur les Gaussiens, il est indiqué pour chaque que où est la densité d'une normale standard. Il existe également des limites similaires dans l'article de Wikipédia pour la "fonction Q".Φz>0

z1+z2φ(z)<1Φ(z)<1zφ(z),
φ

À part cela, et ce que d'autres personnes ont dit, vous pouvez également essayer d'utiliser le Binomial directement, peut-être avec du Stirling.

(*) Certaines déclarations plus récentes de l'inégalité de Slud omettent certaines de ces conditions; J'ai reproduit celui dans le papier de Slud.


7

Le théorème de Moivre-Laplace montre que des variables comme, après avoir été convenablement normalisé et sous certaines conditions, convergera en distribution vers une distribution normale. C'est suffisant si vous voulez des bornes inférieures constantes.|TS1|

Pour les bornes inférieures comme , vous avez besoin d'un outil légèrement plus fin. Voici une référence que je connais (mais seulement par accident - je n'ai jamais eu l'occasion d'utiliser moi-même une telle inégalité). Certaines limites inférieures explicites sur les probabilités de queue des distributions binomiales sont données comme Théorème 1.5, le livre Graphiques aléatoires de Béla Bollobás, Cambridge, 2e édition, où d'autres références sont données à Une introduction à la probabilité et ses applications par Feller et Foundations of Probability par Rényi.nc


4

Le théorème de Littlewood-Offord généralisé n'est pas exactement ce que vous voulez, mais il donne ce que je pense être un "Tchernoff inversé" lié en montrant que la somme des variables aléatoires est peu susceptible de se situer dans une petite plage autour d'une valeur particulière (y compris l'attente). Ce sera peut-être utile.

Formellement, le théorème est le suivant.

Théorème généralisé de Littlewood-Offord : Soit et des nombres réels tels que pour et soit des variables aléatoires indépendantes qui ont des valeurs zéro et un. Pour , supposons que pour tout . Ensuite, pour tout , Où est une constante ne dépendant que de .a1,,ans>0|ai|s1inX1,,Xn0<p12pPr[Xi=0]1p1inrR

Pr[ri=1naiXi<r+s]cpn
cpp

3
Il peut être utile pour d'autres de savoir que ce type de résultat est également connu comme une "petite inégalité de balle" et Nguyen et Vu ont une excellente enquête people.math.osu.edu/nguyen.1261/cikk/LO-survey.pdf . Ma perspective ici diffère légèrement de la vôtre. Je pense à un "Chernoff inversé" lié comme donnant une estimation inférieure de la masse de probabilité de la petite balle autour de 0. Je pense à une inégalité de petite balle comme disant qualitativement que la probabilité de petite balle est maximisée par la balle à 0. Dans ce il est généralement plus facile de prouver les limites inverses de Chernoff que les petites inégalités de balle.
Sasho Nikolov

3

L'exposant dans la borne Chernoff standard, comme il est indiqué sur Wikipédia, est serré pour les variables aléatoires de valeur 0/1. Soit et soit une séquence de variables aléatoires indépendantes telles que pour chaque , et . Alors pour chaque , 0<p<1X1,X2,iPr[Xi=1]=pPr[Xi=0]=1pε>0

2D(p+εp)nn+1Pr[i=1nXi(p+ε)n]2D(p+εp)n.

Ici, , qui est la divergence de Kullback-Leibler entre Bernoulli aléatoire variables avec les paramètres et .D(xy)=xlog2(x/y)+(1x)log2((1x)/(1y))xy

Comme mentionné, la limite supérieure de l'inégalité ci-dessus est prouvée sur Wikipedia ( https://en.wikipedia.org/wiki/Chernoff_bound ) sous le nom de "Théorème de Chernoff-Hoeffding, forme additive". La borne inférieure peut être prouvée en utilisant par exemple la "méthode des types". Voir Lemme II.2 dans [1]. En outre, cela est couvert dans le manuel classique sur la théorie de l'information par Cover et Thomas.

[1] Imre Csiszár: La méthode des types. Transactions de l'IEEE sur la théorie de l'information (1998). http://dx.doi.org/10.1109/18.720546


Il convient également de noter que , et pour le cas courant de c'est . Cela montre que lorsque la borne typique est nette. (Et quand pour ). D(p+δpp)=p22pδ2+O(δ3)p=1/212δ2+O(δ4)δ=O(n1/3)eCδ2δ=O(n1/4)p=1/2
Thomas Ahle
En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.