Aucun estimateur non biaisé de ou de n'existe pour partir d'une classe non paramétrique assez large de distributions.H 2 fHH2f
Nous pouvons le montrer avec l'argument magnifiquement simple de
Bickel et Lehmann (1969). Estimation impartiale dans les familles convexes . The Annals of Mathematical Statistics, 40 (5) 1523–1535. ( projet euclide )
Corrige certaines distributions , et , avec les densités correspondantes , et . Soient représentent , et laisser est un estimateur de sur la base de échantillons iid . F G f 0 f g H ( F ) H ( f , f 0 ) H ( X ) H ( F ) n X i ~ FF0FGf0fgH(F)H(f,f0)H^(X)H(F)nXi∼F
Supposons que soit sans biais pour les échantillons de toute distribution de la forme
Mais alors
pour que doit être un polynôme dans Ma:=αF+(1-α)G. Q ( α )H^
Mα:=αF+(1−α)G.
Q(α)αQ(α)=H(Mα)=∫x1⋯∫xnH^(X)dMα(x1)⋯dMα(xn)=∫x1⋯∫xnH^(X)[αdF(x1)+(1−α)dG(x1)]⋯[αdF(xn)+(1−α)dG(xn)]=αnEX∼Fn[H^(X)]+⋯+(1−α)nEX∼Gn[H^(X)],
Q(α)αde degré au plus .
n
Maintenant, spécialisons-nous dans un cas raisonnable et montrons que le correspondant n'est pas polynomial.Q
Soit une distribution de densité constante sur : pour tout . (Son comportement en dehors de cette plage n'a pas d'importance.) Soit une distribution prise en charge uniquement sur , et une distribution prise en charge uniquement sur . [ - 1 , 1 ] f 0 ( x ) = c | x | ≤ 1 F [ - 1 , 0 ] G [ 0 , 1 ]F0[−1,1]f0(x)=c|x|≤1F[−1,0]G[0,1]
Maintenant
où et de même pour . Notez que , pour toutes les distributions , qui ont une densité.BF:=∫R√
Q(α)=H(mα,f0)=1−∫Rmα(x)f0(x)−−−−−−−−−√dx−−−−−−−−−−−−−−−−−−−√=1−∫0−1cαf(x)−−−−−−√dx−∫10c(1−α)g(x)−−−−−−−−−−√dx−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−√=1−α−−√BF−1−α−−−−−√BG−−−−−−−−−−−−−−−−−−−√,
BF:=∫Rf(x)f0(x)−−−−−−−−√dxBGBF>0BG>0FG
1−α−−√BF−1−α−−−−−√BG−−−−−−−−−−−−−−−−−−−√ n'est pas un polynôme de degré fini. Ainsi, aucun estimateur ne peut être sans biais pour sur toutes les distributions avec un nombre fini d'échantillons.H^HMα
De même, comme n'est pas non plus un polynôme, il n'y a pas d'estimateur pour qui est sans biais sur toutes les distributions avec un nombre fini d'échantillons.1−α−−√BF−1−α−−−−−√BGH2Mα
Cela exclut à peu près toutes les classes de distributions non paramétriques raisonnables, à l'exception de celles dont les densités sont limitées ci-dessous (une hypothèse que les analyses non paramétriques font parfois). Vous pourriez probablement aussi tuer ces classes avec un argument similaire en rendant simplement les densités constantes ou quelque chose.