Votre raisonnement est généralement correct.
La densité conjointe de l'échantillon (X1,X2,…,Xn) est
fθ(x1,x2,…,xn)⟹lnfθ(x1,x2,…,xn)⟹∂∂θlnfθ(x1,x2,…,xn)=θn(∏ni=1(1+xi))1+θ1x1,x2,…,xn>0,θ>0=nln(θ)−(1+θ)∑i=1nln(1+xi)+ln(1min1≤i≤nxi>0)=nθ−∑i=1nln(1+xi)=−n(∑ni=1ln(1+xi)n−1θ)
Ainsi, nous avons exprimé la fonction de score sous la forme
∂∂θlnfθ(x1,x2,…,xn)=k(θ)(T(x1,x2,…,xn)−1θ)(1)
, qui est la condition d'égalité dans l'inégalité de Cramér-Rao.
Il n'est pas difficile de vérifier que E(T)=1n∑i=1nE(ln(1+Xi))=1/θ=1θ(2)
De (1) et (2) nous pouvons conclure que
- La statistique T(X1,X2,…,Xn) est un estimateur non biaisé de 1/θ .
- T satisfait la condition d'égalité de l'inégalité de Cramér-Rao.
Ces deux faits ensemble impliquent que T est l'UMVUE de 1/θ .
La deuxième puce nous dit en fait que la variance de T atteint la borne inférieure de Cramér-Rao pour 1/θ .
En effet, comme vous l'avez montré,
Eθ[∂2∂θ2lnfθ(X1)]=−1θ2
Cela implique que la fonction d'information pour tout l'échantillon est I(θ)=−nEθ[∂2∂θ2lnfθ(X1)]=nθ2
Ainsi, la borne inférieure de Cramér-Rao pour 1/θ et donc la variance de l'UMVUE est
Var(T)=[ddθ(1θ)]2I(θ)=1nθ2
Ici, nous avons exploité un corollaire de l'inégalité de Cramér-Rao, qui dit que pour une famille de distributions f paramétrée par θ (en supposant que les conditions de régularité de l'inégalité CR soient vérifiées ), si une statistique T est sans biais pour g(θ) pour une fonction g et s'il satisfait à la condition d'égalité dans l'inégalité CR, à savoir ∂∂θlnfθ(x)=k(θ)(T(x)−g(θ))
, alorsTdoit être l'UMVUE deg(θ) . Cet argument ne fonctionne donc pas dans tous les problèmes.
Alternativement, en utilisant le théorème de Lehmann-Scheffe, vous pourriez dire que T=1n∑ni=1ln(1+Xi) est l'UMVUE de1/θcar il est sans biais pour1/θet est une statistique complète suffisante pour la famille de distributions. Le fait queTsoit suffisamment compétitif ressort clairement de la structure de la densité conjointe de l'échantillon en termes de famille exponentielle à un paramètre. Mais la variance deTpourrait être un peu difficile à trouver directement.