Comme n'est qu'un facteur d'échelle, sans perte de généralité, choisissez les unités de mesure qui font , ce qui rend la fonction de distribution sous-jacente avec la densité .λλ=1F(x)=1−exp(−x)f(x)=exp(−x)
D'après des considérations parallèles à celles du théorème de la limite centrale pour les médianes de l'échantillon , est asymptotiquement normal avec la moyenne et la varianceX(m)F−1(p)=−log(1−p)
Var(X(m))=p(1−p)nf(−log(1−p))2=pn(1−p).
En raison de la propriété sans mémoire de la distribution exponentielle , les variables agissent comme les statistiques d'ordre d'un échantillon aléatoire de tirées de , auquel a été ajouté. L'écriture(X(m+1),…,X(n))n−mFX(m)
Y=1n−m∑i=m+1nX(i)
pour leur moyenne, il est immédiat que la moyenne de est la moyenne de (égale à ) et que la variance de est multipliée par la variance de (également égale à ). Le théorème central limite implique que le normalisé est asymptotiquement Standard Normal. De plus, parce que est conditionnellement indépendante de , nous avons en même temps la version normalisée de devient asymptotiquement standard normal et décorrélé . C'est,YF1Y1/(n−m)F1YYX(m)X(m)Y
(X(m)+log(1−p)p/(n(1−p))−−−−−−−−−−√,Y−X(m)−1n−m−−−−−√)(1)
a asymptotiquement une distribution bivariée Standard Normal.
Les graphiques rapportent des données simulées pour des échantillons de ( itérations) et . Une trace d'asymétrie positive demeure, mais l'approche de la normalité bivariée est évidente dans le manque de relation entre et et la proximité des histogrammes à la densité normale normale (illustrée dans points rouges).
n=1000500p=0.95Y−X(m)X(m)
La matrice de covariance des valeurs standardisées (comme dans la formule ) pour cette simulation était confortablement proche de la matrice unitaire dont elle se rapproche.(1)
(0.967−0.021−0.0211.010),
Le R
code qui a produit ces graphiques est facilement modifié pour étudier d'autres valeurs de , et de taille de simulation.np
n <- 1e3
p <- 0.95
n.sim <- 5e3
#
# Perform the simulation.
# X_m will be in the first column and Y in the second.
#
set.seed(17)
m <- floor(p * n)
X <- apply(matrix(rexp(n.sim * n), nrow = n), 2, sort)
X <- cbind(X[m, ], colMeans(X[(m+1):n, , drop=FALSE]))
#
# Display the results.
#
par(mfrow=c(2,2))
plot(X[,1], X[,2], pch=16, col="#00000020",
xlab=expression(X[(m)]), ylab="Y",
main="Y vs X", sub=paste("n =", n, "and p =", signif(p, 2)))
plot(X[,1], X[,2]-X[,1], pch=16, col="#00000020",
xlab=expression(X[(m)]), ylab=expression(Y - X[(m)]),
main="Y-X vs X", sub="Loess smooth shown")
lines(lowess(X[,2]-X[,1] ~ X[,1]), col="Red", lwd=3, lty=1)
x <- (X[,1] + log(1-p)) / sqrt(p/(n*(1-p)))
hist(x, main="Standardized X", freq=FALSE, xlab="Value")
curve(dnorm(x), add=TRUE, col="Red", lty=3, lwd=2)
y <- (X[,2] - X[,1] - 1) * sqrt(n-m)
hist(y, main="Standardized Y-X", freq=FALSE, xlab="Value")
curve(dnorm(x), add=TRUE, col="Red", lty=3, lwd=2)
par(mfrow=c(1,1))
round(var(cbind(x,y)), 3) # Should be close to the unit matrix