La fonction de distribution cumulative conjointe pour le minimum x(1) et le maximum x(n) pour un échantillon de n d'une distribution gaussienne avec la moyenne μ et l'écart type σ est
F(x(1),x(n);μ,σ)=Pr(X(1)<x(1),X(n)<x(n))=Pr(X(n)<x(n))−Pr(X(1)>x(1),X(n)<x(n)=Φ(x(n)−μσ)n−[Φ(x(n)−μσ)−Φ(x(1)−μσ)]n
où Φ(⋅) est le CDF gaussien standard. La différenciation par rapport à x(1) et x(n) donne la fonction de densité de probabilité conjointe
f(x(1),x(n);μ,σ)=n(n−1)[Φ(x(n)−μσ)−Φ(x(1)−μσ)]n−2⋅ϕ(x(n)−μσ)⋅ϕ(x(1)−μσ)⋅1σ2
où ϕ(⋅) est le PDF gaussien standard. Prendre les termes log & drop qui ne contiennent pas de paramètres donne la fonction log-vraisemblance
ℓ(μ,σ;x(1),x(n))=(n−2)log[Φ(x(n)−μσ)−Φ(x(1)−μσ)]+logϕ(x(n)−μσ)+logϕ(x(1)−μσ)−2logσ
Cela ne semble pas très traitable mais il est facile de voir qu'il est maximisée quelle que soit la valeur de par le réglage μ = μ = x ( n ) + x ( 1 )σ , c'est-à-dire le point médian - le premier terme est maximisé lorsque l'argument d'un CDF est le négatif de l'argument de l'autre; les deuxième et troisième termes représentent la probabilité conjointe de deux variables normales indépendantes.μ=μ^=x(n)+x(1)2
Substituant μ dans la log-vraisemblance et écriture r = x ( n ) - x ( 1 ) donne
ℓ ( σ , x ( 1 ) , x ( n ) , μ ) = ( n - 2 ) log [ 1 - 2 Φ ( - rμ^r=x(n)−x(1)
ℓ(σ;x(1),x(n),μ^)=(n−2)log[1−2Φ(−r2σ)]−r24σ2−2logσ
Cette expression doit être numériquement maximisé (par exemple avec optimizede R de statpaquet) pour trouver σ . (Il se trouve que σ = k ( n ) ⋅ r , où k est une constante ne dépendant que de n -perhaps quelqu'un mathématiquement plus adroite que je ne pouvais montrer pourquoi.)σ^σ^=k(n)⋅rkn
Les estimations ne sont pas utiles sans une mesure de précision qui l'accompagne. Les informations de Fisher observées peuvent être évaluées numériquement (par exemple avec hessianle numDerivpackage de R ) et utilisées pour calculer des erreurs standard approximatives:
I(σ)=-∂2ℓ(σ, μ )
I(μ)=−∂2ℓ(μ;σ^)(∂μ)2∣∣∣μ=μ^
I(σ)=−∂2ℓ(σ;μ^)(∂σ)2∣∣∣σ=σ^
Il serait intéressant de comparer la probabilité et les estimations de la méthode des moments pour en termes de biais (la MLE est-elle cohérente?), De variance et d'erreur quadratique moyenne. Il y a aussi la question de l'estimation pour les groupes où la moyenne de l'échantillon est connue en plus du minimum et du maximum.σ