Notez que chaque position d'observation ( ) , on peut choisir l' une des n observations, donc il y a n n rééchantillons possibles (maintenir l'ordre dans lequel ils sont tirés) dont n ! sont le "même échantillon" (c.-à-d. contiennent les n observations originales sans répétition; cela explique toutes les façons de classer l'échantillon avec lequel nous avons commencé).i = 1 , 2 , . . . , nnnnn !n
Par exemple, avec trois observations, a, b et c, vous avez 27 échantillons possibles:
aaa aab aac aba abb abc aca acb acc
baa bab bac bba bbb bbc bca bcb bcc
caa cab cac cba cbb cbc cca ccb ccc
Six d'entre eux contiennent chacun a, b et c.
Alors est la probabilité de récupérer l'échantillon d'origine.n ! / nn
Mis à part - une approximation rapide de la probabilité:
Considérez que :
2 π--√ nn + 12e- n≤ n ! ≤ e n n + 12e- n
donc
2 π--√ n12e- n≤ n ! / nn≤ e n 12e- n
La borne inférieure étant la limite habituelle donnée pour l'approximation de Stirling (qui présente une faible erreur relative pour les grands ).n
[Gosper a suggéré d' utiliser qui donnerait l'approximation √n ! ≈ ( 2 n + 13)π---------√nne- n pour cette probabilité, qui fonctionne raisonnablement bien jusqu'à n = 3 , voire jusqu'à n = 1 selon la rigueur de vos critères.]( 2 n + 13) π--------√e- nn = 3n = 1
( 1 - 1n)nne- 1
Pour plus de détails, voir
Pourquoi chaque échantillon bootstrap contient-il environ les deux tiers des observations?