Pour développer mon commentaire - cela dépend. Si vous essayez seulement de comprendre les bases, être en mesure de trouver des fonctions extrêmes vous permet d'obtenir un moyen équitable (bien que dans de nombreux cas pratiques de MLE, la probabilité soit maximisée numériquement, auquel cas vous avez besoin d'autres compétences ainsi que d'autres calcul de base).
Je laisse de côté les beaux cas simples où vous obtenez des solutions algébriques explicites. Même ainsi, le calcul est souvent très utile.
Je vais assumer l'indépendance tout au long. Prenons le cas le plus simple possible de l'optimisation à 1 paramètre. Nous allons d'abord examiner un cas où nous pouvons prendre des dérivées et séparer une fonction du paramètre et une statistique.
Considérons la densité G a m m a (α,1)
FX( x ; α ) = 1Γ ( α )Xα - 1exp( - x ) ;x > 0 ;α > 0
Ensuite, pour un échantillon de taille n , la probabilité est
L (α; x )= ∏i = 1nFX( xje; α )
et donc la log-vraisemblance est
l (α; x )= ∑i = 1nlnFX( xje; α )= ∑i = 1nln( 1Γ ( α )Xα - 1jeexp( - xje) )
= ∑i = 1n- lnΓ ( α ) +(α-1)lnXje- xje
= - n lnΓ ( α ) +(α-1) SX- n x¯
SX= ∑ni = 1lnXje
réréαl (α; x )= dréα( - n lnΓ ( α ) +(α-1) SX- n x¯)
= - n Γ′( α )Γ ( α )+ SX
= - n ψ ( α ) + SX
α^ψ ( α^) = lnG ( x )
ψ ( ⋅ )G ( ⋅ )
α^
ψ ( α^) = g
g= lnG ( x )
Cela n'a pas de solution en termes de fonctions élémentaires, il faut le calculer numériquement; au moins, nous avons pu obtenir une fonction du paramètre d'un côté et une fonction des données de l'autre. Il existe différents algorithmes de recherche de zéro qui peuvent être utilisés si vous ne disposez pas d'un moyen explicite de résoudre l'équation (même si vous êtes sans dérivées, il y a une section binaire, par exemple).
F( x ; μ ) = 14sech2( x - μ2) .
μ
θ
FX( x ; θ ) = 1π( 1 + ( x - θ )2).
En général, la probabilité ici n'a pas un maximum local unique, mais plusieurs maxima locaux. Si vous trouvez un maximum local, il peut y en avoir un autre, plus grand ailleurs. (Parfois, les gens se concentrent sur l'identification du maximum local le plus proche de la médiane, ou quelque chose du genre.)
( 0 , θ )
Dans d'autres cas, l'espace des paramètres peut être discret.
Parfois, trouver le maximum peut être assez compliqué.
Et ce n'est qu'un échantillon des problèmes avec un seul paramètre. Lorsque vous avez plusieurs paramètres, les choses sont à nouveau plus impliquées.