Réponse courte: Oui, de manière probabiliste. Il est possible de montrer que, pour toute distance , tout sous- ensemble fini de l'espace d'échantillonnage et toute «tolérance» prescrite , pour des tailles d'échantillon convenablement grandes, nous pouvons être sûr que la probabilité qu'il y ait un point d'échantillon à une distance de est pour tout .{ x 1 , … , x m } δ > 0 ϵ x i > 1 - δ i = 1 , … , mϵ>0{x1,…,xm}δ>0ϵxi>1−δi=1,…,m
Réponse longue: Je n'ai connaissance d'aucune citation directement pertinente (mais voir ci-dessous). La plupart de la littérature sur l'échantillonnage des hypercubes latins (LHS) concerne ses propriétés de réduction de la variance. L'autre problème est, qu'est-ce que cela signifie de dire que la taille de l'échantillon a tendance à ? Pour un échantillonnage aléatoire IID simple, un échantillon de taille peut être obtenu à partir d'un échantillon de taille en ajoutant un autre échantillon indépendant. Pour le LHS, je ne pense pas que vous puissiez le faire car le nombre d'échantillons est spécifié à l'avance dans le cadre de la procédure. Il semble donc que vous devez prendre une succession d' indépendants échantillons de LHS de taille .n n - 1 1 , 2 , 3 , . . .∞nn−11,2,3,...
Il doit également y avoir un moyen d'interpréter «dense» dans la limite, car la taille de l'échantillon a tendance à . La densité ne semble pas tenir de manière déterministe pour le LHS, par exemple en deux dimensions, vous pouvez choisir une séquence d'échantillons LHS de taille sorte qu'ils collent tous à la diagonale de . Une sorte de définition probabiliste semble donc nécessaire. Soit, pour tout , un échantillon de taille généré selon un mécanisme stochastique. Supposons que, pour différents , ces échantillons soient indépendants. Ensuite, pour définir la densité asymptotique, nous pourrions exiger que, pour chaque , et pour chaque∞1,2,3,...[0,1)2nXn=(Xn1,Xn2,...,Xnn)nnϵ>0x dans l'espace échantillon (supposé être ), nous avons ( comme ).[0,1)dP(min1≤k≤n∥Xnk−x∥≥ϵ)→0n→∞
Si l'échantillon est obtenu en prenant échantillons indépendants de la distribution ('échantillonnage aléatoire IID') alors où est le volume de la boule dimensionnelle de rayon . Il est donc certain que l'échantillonnage aléatoire IID est asymptotiquement dense.XnnU([0,1)d)
P(min1≤k≤n∥Xnk−x∥≥ϵ)=∏k=1nP(∥Xnk−x∥≥ϵ)≤(1−vϵ2−d)n→0
vϵdϵ
Considérons maintenant le cas où les échantillons sont obtenus par LHS. Le théorème 10.1 dans ces notes stipule que les membres de l'échantillon sont tous distribués comme . Cependant, les permutations utilisées dans la définition de LHS (bien qu'indépendantes pour différentes dimensions) induisent une certaine dépendance entre les membres de l'échantillon ( ), il est donc moins évident que la propriété de densité asymptotique est vraie.XnXnU([0,1)d)Xnk,k≤n
Fixez et . Définissez . Nous voulons montrer que . Pour ce faire, nous pouvons utiliser la proposition 10.3 dans ces notes , qui est une sorte de théorème central limite pour l'échantillonnage en hypercube latin. Définissez par si est dans la boule de rayon autour de , sinon. Alors la proposition 10.3 nous dit que où etϵ>0x∈[0,1)dPn=P(min1≤k≤n∥Xnk−x∥≥ϵ)Pn→0f:[0,1]d→Rf(z)=1zϵxf(z)=0Yn:=n−−√(μ^LHS−μ)→dN(0,Σ)μ=∫[0,1]df(z)dzμ^LHS=1n∑ni=1f(Xni) .
Prenez . Finalement, pour assez grand , nous aurons . Donc, finalement, nous aurons . Par conséquent , où est le cdf normal standard. Puisque était arbitraire, il s'ensuit que comme requis.L>0n−n−−√μ<−LPn=P(Yn=−n−−√μ)≤P(Yn<−L)lim supPn≤lim supP(Yn<−L)=Φ(−LΣ√)ΦLPn→0
Cela prouve la densité asymptotique (telle que définie ci-dessus) à la fois pour l'échantillonnage aléatoire iid et le LHS. De manière informelle, cela signifie que compte tenu de tout et de tout dans l'espace d'échantillonnage, la probabilité que l'échantillon atteigne de peut être rendue aussi proche de 1 que vous le souhaitez en choisissant la taille de l'échantillon suffisamment grande. Il est facile d'étendre le concept de densité asymptotique afin de l'appliquer à des sous-ensembles finis de l'espace d'échantillonnage - en appliquant ce que nous savons déjà à chaque point du sous-ensemble fini. Plus formellement, cela signifie que nous pouvons montrer: pour tout et tout sous-ensemble fini de l'espace échantillon,ϵxϵxϵ>0{x1,...,xm}min1≤j≤mP(min1≤k≤n∥Xnk−xj∥<ϵ)→1 (comme ).n→∞