J'ai une cuve bien mélangée contenant un nombre infini de billes. Il y a une quantité infinie de billes dans la cuve, mais elles ne viennent que dans un nombre inconnu mais fini de variétés : k est inconnu, et pour i \ neq j , dessiner une bille de type v_i pourrait être plus probable que dessiner une bille de type v_j .
Dans une expérience, une machine échantillonne la cuve en utilisant une procédure inconnue. La machine rapporte un ensemble décrivant variétés de billes de son échantillon:
Les essais de cette expérience sont répétés ( est fixé d'un essai à l'autre) et nous obtenons une séquence de sous-ensembles de , .
Les seules autres choses que nous connaissons sont:
- les essais sont indépendants et identiques
- la machine signale les variétés les plus fréquemment rencontrées dans son échantillon
Nous ne savons pas précisément comment la machine échantillonne les billes. Il pourrait cueillir un grand nombre de billes, puis signaler le plus fréquent. Alternativement, il pourrait continuer à ramasser des billes jusqu'à ce qu'il y ait variétés. Il pourrait aussi faire autre chose.
La distribution de nos essais sera-t-elle affectée par la procédure d'échantillonnage de la machine?