Cette question est dérivée de celle-ci à propos de la "règle .632". J'écris avec une référence particulière à la réponse / notation de user603 dans la mesure où cela simplifie les choses.
Cette réponse commence par un échantillon de taille avec remplacement, à partir de éléments distincts dans la collection (appelez-le) N. La probabilité que l' échantillon soit différent d'un élément particulier de N est alors
Dans cette réponse, tous les éléments de N ont une chance égale d'être tirés au hasard.
Ma question est la suivante: supposons plutôt que dans la question ci-dessus les éléments à dessiner soient tels qu'ils soient normalement distribués. Autrement dit, nous subdivisons la courbe normale standard de à en (disons) 100 sous-intervalles de longueur égale. Chacun des 100 éléments de N a une probabilité d'être dessinée qui est égale à la zone sous-tendue par la courbe dans son intervalle respectif.
Ma pensée était la suivante:
Le raisonnement est similaire à celui de la réponse liée, je pense. La probabilité que , avec un élément de N, soit dans laquelle est la probabilité de dessiner
La probabilité qu'un élément particulier m soit dans l'échantillon S de taille n est
= 1 - n ∏ 1 ( 1 - F i ) .
Un calcul semble montrer qu'à mesure que la longueur des sous-intervalles devient petite, la réponse converge vers le même nombre que dans le premier cas (probabilités de toutes égales).
Cela semble contre-intuitif (pour moi) car la construction semble inclure des éléments de N qui sont rares, donc je m'attendrais à un nombre inférieur à 0,632.
Aussi, si cela est correct, je suppose que nous aurions
que je ne sais pas encore être vrai ou faux.
Edit: Si c'est vrai, cela en généraliserait probablement.
Merci pour toutes informations.