Je présenterai les conditions dans lesquelles un estimateur sans biais reste sans biais, même après avoir été borné. Mais je ne suis pas sûr qu'ils représentent quelque chose d'intéressant ou d'utile.
Soit un estimateur θ^ du paramètre inconnu θ d'une distribution continue, et E(θ^) = θ.
Supposons que, pour certaines raisons, sous échantillonnage répété, nous voulons que l’estimateur produise des estimations [δl,δu]. Nous supposons queθ ∈ [δl,δu] et nous pouvons donc écrire quand cela est commode l'intervalle comme [ θ - a , θ + b ] avec { a , b } nombres positifs mais bien sûr inconnus.
Alors l'estimateur contraint est
θ^c=⎧⎩⎨⎪⎪⎪⎪δlθ^δuθ^<δlδl≤θ^≤δuδu<θ^⎫⎭⎬⎪⎪⎪⎪
et sa valeur attendue est
E(θ^c)=δl⋅ P[θ^≤δl]+ E(θ^∣δl≤θ^≤δu) ⋅ P[δl≤θ^≤δu]+δu⋅ P[θ^>δu]
Définissez maintenant les fonctions d'indicateur
jel= Je(θ^≤δl),Im=I(δl≤θ^≤δl),Iu=I(θ^>δu)
et notez que
Il+Iu=1−Im(1)
en utilisant ces fonctions d'indicateur et intégrales, nous pouvons écrire la valeur attendue de l'estimateur contraint comme (F(θ^) est la fonction de densité de θ^),
E(θ^c) =∫∞- ∞δlF(θ^)jelréθ^+∫∞- ∞θ^F(θ^)jemréθ^+∫∞- ∞δuF(θ^)jeuréθ^
=∫∞- ∞F(θ^) [δljel+θ^jem+δujeu] dθ^
= E[δljel+θ^jem+δujeu](2)
En décomposant les bornes supérieure et inférieure, nous avons
E(θ^c) = E[ (θ-a)jel+θ^jem+ ( θ + b )jeu]
= E[ θ⋅(jel+jeu) +θ^jem] -unE(jel) + b E(jeu)
et en utilisant ( 1 ),
= E[ θ⋅(1-jem) +θ^jem] -unE(jel) + b E(jeu)
⇒ E(θ^c) = θ + E[ (θ^- θ )jem] -unE(jel) + b E(jeu)(3)
Maintenant, depuis E(θ^) = θ on a
E[ (θ^- θ )jem] =E(θ^jem) -E(θ^) E(jem)
Mais
E(θ^jem) = E(θ^jem∣jem=1)E(Im)=E(θ^)E(Im)
Par conséquent, E[(θ^−θ)Im]=0 et donc
E(θ^c)=θ−aE(Il)+bE(Iu)=θ−aP(θ^≤δl)+bP(θ^>δu)(4)
Ou bien
E(θ^c)=θ−(θ−δl)P(θ^≤δl)+(δu−θ)P(θ^>δu)(4a)
Par conséquent, à partir de (4), nous voyons que pour que l'estimateur contraint soit également sans biais, nous devons avoir
aP(θ^≤δl)=bP(θ^>δu)(5)
Quel est le problème avec la condition (5)? Il implique les nombres inconnus{a,b}, donc en pratique nous ne pourrons pas réellement déterminer un intervalle pour délimiter l'estimateur et le garder sans biais.
Mais disons qu'il s'agit d'une expérience de simulation contrôlée, où nous voulons étudier d'autres propriétés des estimateurs, étant donné l'impartialité. Ensuite, nous pouvons "neutraliser"a et b en définissant a=b, ce qui crée essentiellement un intervalle symétrique autour de la valeur de θ... Dans ce cas, pour atteindre l'impartialité, nous devons plus P(θ^≤δl)=P(θ^>δu), c'est-à-dire que nous devons avoir que la masse de probabilité de l' estimateur non contraint est égale à la gauche et à la droite de la (symétrique autour deθ) intervalle ...
... et nous apprenons donc que (comme conditions suffisantes), si la distribution de l'estimateur non contraint est symétrique autour de la valeur vraie, alors l'estimateur contraint dans un intervalle symétrique autour de la valeur vraie sera également non biaisé ... mais c'est presque trivialement évident ou intuitif, n'est-ce pas?
Cela devient un peu plus intéressant, si nous réalisons que la condition nécessaire et suffisante (étant donné un intervalle symétrique) a) ne nécessite pas une distribution symétrique , seulement une masse de probabilité égale "dans la queue" (et cela n'implique pas à son tour que le la distribution de la masse dans chaque queue doit être identique) et b) permet qu'à l'intérieur de l'intervalle, la densité de l'estimateur puisse avoir n'importe quelle forme non symétrique compatible avec le maintien de l'impartialité - cela rendra l'estimateur contraint sans biais.
APPLICATION: Le cas du PO
Notre estimateur estθ^=θ+w,w∼N(0,1) et donc θ^∼N(θ,1). Ensuite, en utilisant(4) en écrivant a,b en terme de θ,δ, nous avons, pour l'intervalle de délimitation [0,1],
E[θ^c]=θ−θP(θ^≤0)+(1−θ)P(θ^>1)
La distribution est symétrique autour θ. Transformer (Φ() est le CDF normal standard)
E[θ^c]=θ−θP(θ^−θ≤−θ)+(1−θ)P(θ^- θ > 1 - θ )
= θ - θ Φ ( - θ ) + ( 1 - θ ) [ 1 - Φ ( 1 - θ ) ]
On ne peut vérifier que les conditions supplémentaires ne s’annulent que si θ = une / deux, à savoir uniquement si l'intervalle de délimitation est également symétrique autour de θ.