Je viens d'apprendre le concept de bootstrap, et une question naïve m'est venue à l'esprit: si nous pouvons toujours générer de nombreux échantillons bootstrap de nos données, pourquoi se donner la peine d'obtenir davantage de données "réelles"?
Je pense avoir une explication, dites-moi si j'ai raison: je pense que le processus d'amorçage réduit la variance, MAIS si mon jeu de données d'origine est faussé, alors je suis coincé avec une faible variance et un biais élevé, peu importe le nombre de répliques Je prends.