La réponse ci-dessus est correcte. Pour référence, voici un code R élaboré élaboré pour le calculer. J'ai la liberté d'ajouter une interception, car vous en voulez probablement une.
## make some data
set.seed(1234)
N <- 2000
x1 <- rnorm(N)
x2 <- rnorm(N)
## create linear predictor
lpred <- 0.5 + 0.5 * x1 + 0.25 * x2
## apply inverse link function
ey <- 1/(1 + exp(-lpred))
## sample some dependent variable
y <- rbinom(N, prob=ey, size=rep(1,N))
dat <- matrix(c(x1, x2, y), nrow=N, ncol=3)
colnames(dat) <- c('x1', 'x2', 'y')
Construisez maintenant une fonction de vraisemblance logarithmique à maximiser, en l'utilisant ici dbinom
parce qu'elle est là, et en additionnant les résultats
## the log likelihood function
log.like <- function(beta, dat){
lpred <- beta[1] + dat[,'x1'] * beta[2] + dat[,'x2'] * beta[2]**2
ey <- 1/(1 + exp(-lpred))
sum(dbinom(dat[,'y'], prob=ey, size=rep(1,nrow(dat)), log=TRUE))
}
et ajuster le modèle par maximum de vraisemblance. Je n'ai pas pris la peine d'offrir un dégradé ou de choisir une méthode d'optimisation, mais vous voudrez peut-être faire les deux.
## fit
res <- optim(par=c(1,1), ## starting values
fn=log.like,
control=list(fnscale=-1), ## maximise not minimise
hessian=TRUE, ## for SEs
dat=dat)
Jetez maintenant un œil aux résultats. Les estimations des paramètres ML et les SE asymptotiques sont:
## results
data.frame(coef=res$par,
SE=sqrt(diag(solve(-res$hessian))))
qui devrait être
## coef SE
## 1 0.4731680 0.04828779
## 2 0.5799311 0.03363505
ou il y a un bug (ce qui est toujours possible).
Les mises en garde habituelles concernant les erreurs standard dérivées de la Hesse s'appliquent.