Benjamin Doerr donne (dans le chapitre "Analyse de l'heuristique de recherche aléatoire: outils de la théorie des probabilités" dans le livre "Théorie de l'heuristique de recherche aléatoire", voir le lien pour un PDF en ligne) une preuve assez simple de
Proposition Soit l'heure d'arrêt du processus de collecte des coupons. Alors .TPr[T≤(1−ϵ)(n−1)lnn]≤e−nϵ
Cela semble donner l'asymptotique souhaitée (d'après la deuxième réponse de @ cardinal), mais avec l'avantage d'être vrai pour tous les et .nϵ
Voici un croquis de preuve.
Esquisse de preuve: Soit l'événement où le ème coupon est collecté lors des premiers tirages. Ainsi, . Le fait clé est que les sont corrélés négativement, pour tout , . Intuitivement, cela est assez clair, car sachant que le ème coupon dans les premiers tirages rendrait moins probable que le ème coupon soit également tiré dans les premiers tirages. XiitPr[Xi=1]=(1−1/n)tXiI⊆[n]Pr[∀i∈I,Xi=1]≤∏i∈IPr[Xi=1]itjt
On peut prouver la revendication, mais en agrandissant l'ensemble de 1 à chaque étape. Ensuite , il se réduit à montrer que , pour . De manière équivalente, en faisant la moyenne, cela revient à montrer que . Doerr ne donne qu'un argument intuitif pour cela. Une voie vers une preuve est la suivante. On peut observer que conditionnée par le coupon venant après tous les coupons dans , que la probabilité de tirer un nouveau coupon de après avoir tiré jusqu'à présent soit maintenant , au lieu du précédentIPr[∀i∈I,Xi=1|Xj=1]≤Pr[∀i∈I,Xi=1]j∉Ij I I k | Je | - kPr[∀i∈I,Xi=1|Xj=0]≥Pr[∀i∈I,Xi=1]jIIk | Je| -k|I|−kn−1 jI|I|−kn . Ainsi, en décomposant le temps de collecte de tous les coupons sous la forme d'une somme de variables géométriques aléatoires, nous pouvons voir que le conditionnement sur le -coupon à venir après augmente les probabilités de succès, et donc faire le conditionnement ne fait que rendre plus probable la collecte des coupons plus tôt ( par dominance stochastique: chaque variable géométrique aléatoire est augmentée, en termes de dominance stochastique, par le conditionnement, et cette dominance peut alors être appliquée à la somme).jI
Compte tenu de cette corrélation négative, il s'ensuit que , ce qui donne la borne souhaitée avec . t = ( 1 - ϵ ) ( n - 1 ) ln nPr[T≤(1−ϵ)(n−1)lnn]≤(1−(1−1/n)t)nt=(1−ϵ)(n−1)lnn