νt
νt
set.seed(1234)
n <- 10
x <- rt(n, df=2.5)
make_loglik <- function(x)
Vectorize( function(nu) sum(dt(x, df=nu, log=TRUE)) )
loglik <- make_loglik(x)
plot(loglik, from=1, to=100, main="loglikelihood function for df parameter", xlab="degrees of freedom")
abline(v=2.5, col="red2")
n
Essayons quelques simulations:
t_nu_mle <- function(x) {
loglik <- make_loglik(x)
res <- optimize(loglik, interval=c(0.01, 200), maximum=TRUE)$maximum
res
}
nus <- replicate(1000, {x <- rt(10, df=2.5)
t_nu_mle(x) }, simplify=TRUE)
> mean(nus)
[1] 45.20767
> sd(nus)
[1] 78.77813
L'affichage de l'estimation est très instable (en regardant l'histogramme, une partie importante des valeurs estimées est à la limite supérieure donnée pour optimiser de 200).
Répéter avec un échantillon plus grand:
nus <- replicate(1000, {x <- rt(50, df=2.5)
t_nu_mle(x) }, simplify=TRUE)
> mean(nus)
[1] 4.342724
> sd(nus)
[1] 14.40137
ce qui est beaucoup mieux, mais la moyenne est toujours bien supérieure à la valeur réelle de 2,5.
N'oubliez pas qu'il s'agit d'une version simplifiée du problème réel où les paramètres de localisation et d'échelle doivent également être estimés.
tν