Eh bien, si vous avez un échantillon d'une distribution de Pareto avec les paramètres et (où est le paramètre de limite inférieure et est le paramètre de forme), la probabilité logarithmique de cela l'échantillon est: m > 0 α > 0 m αX1,...,Xnm>0α>0mα
nlog(α)+nαlog(m)−(α+1)∑i=1nlog(Xi)
il s'agit d'une augmentation monotone de , de sorte que le maximiseur est la plus grande valeur cohérente avec les données observées. Puisque le paramètre définit la borne inférieure du support pour la distribution de Pareto, l'optimum estmmm
m^=miniXi
qui ne dépend pas de . Ensuite, en utilisant des astuces de calcul ordinaires, le MLE pour doit satisfaireααα
nα+nlog(m^)−∑i=1nlog(Xi)=0
une algèbre simple nous dit que le MLE de estα
α^=n∑ni=1log(Xi/m^)
Dans de nombreux sens importants (par exemple, efficacité asymptotique optimale en ce qu'elle atteint la limite inférieure de Cramer-Rao), c'est la meilleure façon d'ajuster les données à une distribution de Pareto. Le code R ci - dessous calcule le MLE pour un ensemble de données, X
.
pareto.MLE <- function(X)
{
n <- length(X)
m <- min(X)
a <- n/sum(log(X)-log(m))
return( c(m,a) )
}
# example.
library(VGAM)
set.seed(1)
z = rpareto(1000, 1, 5)
pareto.MLE(z)
[1] 1.000014 5.065213
Edit: Sur la base du commentaire de @cardinal et I ci-dessous, nous pouvons également noter que est l'inverse de la moyenne de l'échantillon des , ce qui arrive à ont une distribution exponentielle. Par conséquent, si nous avons accès à un logiciel qui peut s'adapter à une distribution exponentielle (ce qui est plus probable, car il semble se produire dans de nombreux problèmes statistiques), l'ajustement d'une distribution de Pareto peut être accompli en transformant l'ensemble de données de cette manière et en l'adaptant à une distribution exponentielle à l'échelle transformée. log(Xi/ m )α^log(Xi/m^)