Analyse des billes et des bacs dans le régime m >> n.

Il est bien connu que si vous lancez n balles dans n cases, le bin le plus chargé est très susceptible d'avoir balles dedans. En général, on peut poser des questions sur balles dans cases. Un article de RANDOM 1998 de Raab et Steger explore cela en détail, montrant qu'à mesure que augmente, la probabilité d'aller même un peu au-dessus de la valeur attendue de diminue rapidement. En gros, en fixant , ils montrent que la probabilité de voir plus de est . $O(\log n)$ $m > n$ $n$ $m$ $m/n$ $r = m/n$ $r + \sqrt{r\log n}$ $o(1)$

Ce document est paru en 1998 et je n'ai rien trouvé de plus récent. Y a-t-il des résultats nouveaux et encore plus concentrés dans ce sens, ou y a-t-il des raisons heuristiques / formelles de soupçonner que c'est le meilleur qu'on puisse obtenir? Je dois ajouter qu'un article sur la variante à choix multiple co-écrit par Angelika Steger en 2006 ne cite pas non plus de travaux plus récents.

Mise à jour : En réponse au commentaire de Peter, permettez-moi de clarifier les choses que j'aimerais savoir. J'ai deux buts ici.

Premièrement, j'ai besoin de savoir quelle référence citer, et il semble que ce soit le travail le plus récent à ce sujet.
Deuxièmement, il est vrai que le résultat est assez serré dans la gamme r = 1. Je m'intéresse à la plage m >> n, et plus particulièrement au domaine où r pourrait être poly log n, ou même n ^ c. J'essaie de placer ce résultat dans un lemme que je prouve, et la limite spécifique de r contrôle d'autres parties de l'algorithme global. Je pense (mais je ne suis pas sûr) que la plage de r fournie par ce document pourrait suffire, mais je voulais juste m'assurer qu'il n'y avait pas de limite plus stricte (cela donnerait un meilleur résultat).

reference-request pr.probability

— Suresh Venkat
source

J'ai appris le nom «problème d'occupation» à partir du tag, donc merci d'avoir posté une question éducative. :)

— Tsuyoshi Ito

En regardant le document de Raab et Steger, il m'est difficile de comprendre quels autres résultats vous souhaiteriez dans ce sens. Y a-t-il une question précise à laquelle vous devez répondre? Si c'est le cas, vous devriez le demander, ici ou sur MathOverflow. En particulier, si , Raab et Steger donnent une limite étroite de où est la constante correcte.

r = m / n

$r=m/n$

r + \sqrt{2 r \log n}

$r + \sqrt{2r \log n}$

2

$2$

— Peter Shor

@Peter Je vais éditer la question: c'est un point valide.

— Suresh Venkat

Pas vraiment une réponse complète (ni une référence utile), mais juste un commentaire plutôt étendu. Pour tout bac donné, la probabilité d'avoir exactement boules dans le bac sera donnée par . On peut utiliser une inégalité due à Sondow, , pour obtenir , où . Notez que cette limite est assez serrée, car a . $B$ $p_B = \binom{m}{B} \left(\frac{1}{n}\right)^B \left(\frac{n-1}{n}\right)^{m-B}$ $\binom{(b+1)a}{a}<\left(\frac{(b+1)^{b+1}}{b^b}\right)^a$ $p_B < \left(\frac{(r+1)^{r+1}}{r^r}\right)^B \left(\frac{1}{n}\right)^B \left(\frac{n-1}{n}\right)^{m-B}$ $r=\frac{m}{B}-1$ $\binom{(b+1)a}{a}>\frac{1}{4ab}\left(\frac{(b+1)^{b+1}}{b^b}\right)^a$

Nous avons donc . Maintenant, comme vous êtes intéressé par la probabilité de trouver ou plusieurs balles dans un bac, nous pouvons considérer . En réorganisant les termes, nous obtenons $p_B < e^{B(r+1)\ln(r+1) - Br\ln r - m\ln n + (m-B)\ln (n-1)}$ $B$ $p_{\geq B} = \sum_{b=B}^{m} p_b < \sum_{b=B}^{m} e^{b(r+1)\ln(r+1) - br\ln r - m\ln n + (m-b)\ln (n-1)}$

p_{\geq B} < e^{- m \ln \frac{n}{n - 1}} \times e^{B (r + 1) \ln (r + 1) - B r \ln r - B \ln (n - 1)} \sum_{b = 0}^{m - B} e^{b (r + 1) \ln (r + 1) - b r \ln r - b \ln (n - 1)} .

$p_{\geq B} < e^{-m\ln \frac{n}{n-1}} \times e^{B(r+1)\ln(r+1) - Br\ln r - B\ln (n-1)} \sum_{b=0}^{m-B} e^{b(r+1)\ln(r+1) - br\ln r - b\ln (n-1)}.$

Notez que la sommation ci-dessus n'est qu'une série géométrique, nous pouvons donc la simplifier pour donnerSi nous réécrivons les termes utilisant des exponentielles, nous obtenons qui devient alors

p_{\geq B} < e^{- m \ln \frac{n}{n - 1}} \times e^{B (r + 1) \ln (r + 1) - B r \ln r - B \ln (n - 1)} \times \frac{1 - {(\frac{(r + 1)^{r + 1}}{r^{r} (n - 1)})}^{m - B + 1}}{1 - (\frac{(r + 1)^{r + 1}}{r^{r} (n - 1)})} .

$p_{\geq B} < e^{-m\ln \frac{n}{n-1}} \times e^{B(r+1)\ln(r+1) - Br\ln r - B\ln (n-1)} \times \frac{1-\left(\frac{(r+1)^{r+1}}{r^r (n-1)}\right)^{m-B+1}}{1-\left(\frac{(r+1)^{r+1}}{r^r (n-1)}\right)}.$

\frac{(r + 1)^{r + 1}}{r^{r} (n - 1)}

$\frac{(r+1)^{r+1}}{r^r (n-1)}$

p_{\geq B} < e^{- m \ln \frac{n}{n - 1}} \times e^{B (r + 1) \ln (r + 1) - B r \ln r - B \ln (n - 1)} \times \frac{1 - {(e^{(r + 1) \ln (r + 1) - r \ln r - \ln (n - 1)})}^{m - B + 1}}{1 - e^{(r + 1) \ln (r + 1) - r \ln r - \ln (n - 1)}},

$p_{\geq B} < e^{-m\ln \frac{n}{n-1}} \times e^{B(r+1)\ln(r+1) - Br\ln r - B\ln (n-1)} \times \frac{1-\left(e^{(r+1)\ln (r+1) - r \ln r - \ln(n-1)}\right)^{m-B+1}}{1-e^{(r+1)\ln (r+1) - r \ln r - \ln(n-1)}},$

p_{\geq B} < \frac{e^{- m \ln \frac{n}{n - 1}} \times (e^{B ((r + 1) \ln (r + 1) - r \ln r - \ln (n - 1))} - e^{(m + 1) ((r + 1) \ln (r + 1) - r \ln r - \ln (n - 1))})}{1 - e^{(r + 1) \ln (r + 1) - r \ln r - \ln (n - 1)}} .

$p_{\geq B} < \frac{e^{-m\ln \frac{n}{n-1}} \times \left(e^{B((r+1)\ln(r+1) - r\ln r - \ln (n-1))} -e^{(m+1)((r+1)\ln (r+1) - r \ln r - \ln(n-1))}\right)}{1-e^{(r+1)\ln (r+1) - r \ln r - \ln(n-1)}}.$

Maintenant, je suppose que vous vous souciez de trouver un tel que pour un constant , car cela donne la probabilité totale de tout bac ayant ou plusieurs boules comme borné à partir de ci - dessus par . Ce critère est satisfait en prenant qui peut être réécrit comme $B$ $p_{\geq B} < \frac{C}{n}$ $C$ $B$ $C$

\frac{e^{- m \ln \frac{n}{n - 1}} \times (e^{B ((r + 1) \ln (r + 1) - r \ln r - \ln (n - 1))} - e^{(m + 1) ((r + 1) \ln (r + 1) - r \ln r - \ln (n - 1))})}{1 - e^{(r + 1) \ln (r + 1) - r \ln r - \ln (n - 1)}} = \frac{C}{n},

$\frac{e^{-m\ln \frac{n}{n-1}} \times \left(e^{B((r+1)\ln(r+1) - r\ln r - \ln (n-1))} -e^{(m+1)((r+1)\ln (r+1) - r \ln r - \ln(n-1))}\right)}{1-e^{(r+1)\ln (r+1) - r \ln r - \ln(n-1)}} = \frac{C}{n},$

B = \frac{\ln (\frac{C}{n} e^{m \ln \frac{n}{n - 1}} (1 - e^{(r + 1) \ln (r + 1) - r \ln r - \ln (n - 1)}) + e^{(m + 1) ((r + 1) \ln (r + 1) - r \ln r - \ln (n - 1))})}{(r + 1) \ln (r + 1) - r \ln r - \ln (n - 1)} .

$B = \frac{\ln\left(\frac{C}{n} e^{m\ln \frac{n}{n-1}} \left(1-e^{(r+1)\ln (r+1) - r \ln r - \ln(n-1)}\right) + e^{(m+1)((r+1)\ln (r+1) - r \ln r - \ln(n-1))}\right)}{(r+1)\ln(r+1) - r\ln r - \ln (n-1)}.$

Je ne suis pas entièrement sûr de l'utilité de ce commentaire (il est tout à fait possible que j'ai fait une erreur quelque part), mais j'espère qu'il peut être utile.

— Joe Fitzsimons
source

c'est assez génial. merci pour le contour.

— Suresh Venkat

@Suresh: Heureux que ce soit utile.

— Joe Fitzsimons