La méthode bootstrap a connu une grande diffusion ces dernières années, je l'utilise également beaucoup, notamment parce que le raisonnement derrière est assez intuitif.
Mais c'est une chose que je ne comprends pas. Pourquoi Efron a choisi d'effectuer un rééchantillonnage avec remplacement au lieu de simplement sous-échantillonner en incluant ou en excluant au hasard des observations uniques?
Je pense que le sous-échantillonnage aléatoire a une très bonne qualité, qui représente idéalement la situation de la vie réelle dans laquelle les observations que nous avons dans notre étude sont un sous-ensemble d'une population hypothétique. Je ne vois pas l'avantage d'avoir multiplié les observations lors du rééchantillonnage. Dans un contexte réel, aucune observation n'est semblable à une autre, en particulier pour les situations multivariées complexes.