Considérons toute famille d'échelle d' emplacement déterminée par une distribution "standard" ,F
ΩF={F(μ,σ):x→F(x−μσ)∣σ>0}.
En supposant que différenciable, nous trouvons facilement que les fichiers PDF sont .1F1σf((x−μ)/σ)dx
La troncature de ces distributions pour restreindre leur prise en charge entre et , , signifie que les PDF sont remplacés parb a < baba<b
f(μ,σ;a,b)(x)=f(x−μσ)dxσC(μ,σ,a,b),a≤x≤b
(et sont nuls pour toutes les autres valeurs de ) où est le facteur de normalisation nécessaire pour garantir que s'intègre à l'unité. (Notez que est identique à en l'absence de troncature.) La probabilité logarithmique pour les données iid est doncxC(μ,σ,a,b)=F(μ,σ)(b)−F(μ,σ)(a)f(μ,σ;a,b)C1xi
Λ(μ,σ)=∑i[logf(xi−μσ)−logσ−logC(μ,σ,a,b)].
Les points critiques (y compris les minima globaux) se trouvent là où soit (un cas spécial que j'ignorerai ici) soit le gradient disparaît. En utilisant des indices pour désigner des dérivées, nous pouvons calculer formellement le gradient et écrire les équations de vraisemblance commeσ=0
00=∂Λ∂μ=∂Λ∂σ=∑i⎡⎣⎢−fμ(xi−μσ)f(xi−μσ)−Cμ(μ,σ,a,b)C(μ,σ,a,b)⎤⎦⎥=∑i⎡⎣⎢−fσ(xi−μσ)σ2f(xi−μσ)−1σ−Cσ(μ,σ,a,b)C(μ,σ,a,b)⎤⎦⎥
Parce et sont fixes, supprimez-les de la notation et écrivez comme et comme . (Sans troncature, les deux fonctions seraient identiques à zéro.) La séparation des termes impliquant les données des autres donneabnCμ(μ,σ,a,b)/C(μ,σ,a,b)A(μ,σ)nCσ(μ,σ,a,b)/C(μ,σ,a,b)B(μ,σ)
−A(μ,σ)−σ2B(μ,σ)−nσ=∑ifμ(xi−μσ)f(xi−μσ)=∑ifσ(xi−μσ)f(xi−μσ)
En les comparant à la situation sans troncature, il est évident que
Toutes les statistiques suffisantes pour le problème d'origine sont suffisantes pour le problème tronqué (car les côtés droits n'ont pas changé).
Notre capacité à trouver des solutions de forme fermée repose sur la docilité de et . Si celles-ci n'impliquent pas et de manière simple, nous ne pouvons pas espérer obtenir des solutions de forme fermée en général.ABμσ
Dans le cas d'une famille normale, est bien sûr donné par le PDF normal cumulatif, qui est une différence de fonctions d'erreur: il n'y a aucune chance qu'une solution de forme fermée puisse être obtenu en général. Cependant, il n'y a que deux statistiques suffisantes (la moyenne et la variance de l'échantillon feront l'affaire) et le CDF est aussi lisse que possible, de sorte que les solutions numériques seront relativement faciles à obtenir.C(μ,σ,a,b)