Laissez un ensemble fini et supposons que nous voulons calculer la taille de certains sous - ensemble .
Motivation : si nous pouvons générer des éléments de uniformément au hasard, alors nous pouvons estimer la taille de par échantillonnage aléatoire. Autrement dit, nous prenons échantillons aléatoires de , si d'entre eux appartiennent à , alors . Malheureusement, pour ce que je fais, généralementest massif et(bien qu'énorme) est assez petit par rapport à. Donc, si j'essaie d'effectuer l'estimation ci-dessus, je suis susceptible d'obtenir , ce qui, bien qu'il ne soit pas inutile, n'est pas vraiment satisfaisant.
Donc, j'ai une idée que j'espère accélérer ce processus. Au lieu de lancer des fléchettes sur un jeu de fléchettes massif, pourquoi je ne lance pas de balles? Autrement dit, au lieu d'éléments d' échantillonnage , nous sous - ensembles de l' échantillon . Je devrais sûrement être en mesure de déduire quelque chose sur la densité de dans partir de cette expérience.
Supposons que est équipé d'une métrique (je pense à la distance de Hamming). Pour tout soit soit la boule fermée de rayon dans centrée sur . Puisque nous pouvons échantillonner les éléments uniformément au hasard, nous pouvons échantillonner k- boules Y_k (t) uniformément au hasard.
Supposons que (a) chaque appartient exactement au même nombre de balles et (b) que chaque ball ait la même taille .
Supposons maintenant que je génère boules uniformément au hasard et supposons. Il semble que nous pouvons estimerd'une manière similaire, c'est-à-dire .
Mes questions sont donc:
Ai-je raison de dire que nous pouvons approximerpar ici? Si oui, je doute que je sois le premier à y penser, alors y a-t-il un nom pour cette méthode?
J'ai effectivement testé cela sur certains sets, et cela semble correspondre à ce que je prétends.
Y a-t-il des inconvénients à cette approche? (par exemple, est-il moins précis? ai-je besoin de plus d'échantillons?)