Ma question est la suivante: quelle technique de ré-échantillonnage a gagné le plus de popularité
? Les tests Bootstrapping ou Permutation?
L'amorçage consiste principalement à générer des erreurs-types ou des intervalles de confiance de grand échantillon. les tests de permutation, comme son nom l'indique, concernent principalement les tests. (Chacun peut être adapté pour être utilisé pour l'autre tâche cependant.)
Comment pourrions-nous juger de la popularité? Si nous examinons des domaines tels que la psychologie et l'éducation, nous pouvons trouver de nombreuses utilisations de tests basés sur les rangs tels que Wilcoxon-Mann-Whitney, le test de rangs signé, les tests de corrélation de rangs, etc. Ce sont tous des tests de permutation (en revanche, il existe de nombreux cas où des tests de permutation des données d'origine pourraient être utilisés à la place mais ne le sont généralement pas). Dans certains autres domaines d'application, les tests de permutation seraient rarement utilisés, mais la popularité variable d'un domaine d'application à l'autre en dit parfois plus sur la culture locale de chaque région que sur son utilité.
plus facile à mettre en œuvre?
Dans de nombreux cas - en particulier les plus simples - ils sont presque aussi faciles à utiliser - c'est essentiellement la différence entre échantillonnage avec remplacement et échantillonnage sans remplacement.
Dans certains cas plus complexes, l’amorçage est plus facile à faire car (vu du point de vue des tests), il fonctionne sous l’alternative plutôt que de façon nulle (au moins des implémentations naïves le seront - le faire pour qu’il fonctionne bien peut être beaucoup plus compliqué).
Les tests de permutation exacts peuvent être difficiles dans les cas les plus complexes, car une quantité échangeable appropriée peut ne pas être observable - souvent, une quantité presque échangeable peut être substituée au prix de l'exactitude (et de l'absence totale de distribution).
Bootstrapping abandonne essentiellement le critère d’exactitude correspondant (couverture exacte des intervalles) dès le départ, et se concentre plutôt sur l’obtention d’une couverture relativement bonne sur de grands échantillons (parfois avec moins de succès qu'on ne pourrait le comprendre; si vous n'avez pas coché, supposez que votre bootstrap donne la couverture que vous attendez).
Les tests de permutation peuvent fonctionner sur de petits échantillons (bien que le choix limité de niveaux de signification puisse parfois poser problème avec de très petits échantillons), alors que le bootstrap est une technique utilisant un grand échantillon (si vous l'utilisez avec de petits échantillons, les résultats risquent de ne pas être très utile).
Je les vois rarement comme des concurrents sur le même problème et je les ai utilisés pour résoudre des problèmes réels (différents) - il est souvent naturel de choisir.
Il y a des avantages pour les deux, mais ni dans un panacaea. Si vous espérez réduire les efforts d'apprentissage en vous concentrant sur l'un d'eux, vous risquez d'être déçu - les deux sont des éléments essentiels de la boîte à outils de rééchantillonnage.