Quelle est la méthode des moments?
Il y a un bel article à ce sujet sur Wikipedia.
https://en.m.wikipedia.org/wiki/Method_of_moments_(statistics)
Cela signifie que vous estimez les paramètres de la population en sélectionnant les paramètres de sorte que la distribution de la population ait des moments équivalents aux moments observés dans l'échantillon.
En quoi est-ce différent de MLE
L'estimation du maximum de vraisemblance minimise la fonction de vraisemblance. Dans certains cas, ce minimum peut parfois être exprimé en termes de définition de paramètres de population égaux aux paramètres d'échantillon.
Par exemple, lorsque nous estimons le paramètre moyen d'une distribution et utilisons MLE, nous finissons souvent par utiliser . Cependant, cela ne doit pas toujours être le cas (lié: https://stats.stackexchange.com/a/317631/164061 bien que dans le cas de l'exemple là-bas, la distribution de Poisson, l'estimation MLE et MoM coïncident et le il en va de même pour beaucoup d'autres). Par exemple, la solution MLE pour l'estimation de dans une distribution log normale est:μ=x¯μ
μ=1/n∑ln(xi)=ln(x)¯¯¯¯¯¯¯¯¯¯¯
Alors que la solution MoM résout
exp(μ+12σ2)=x¯
menant à
μ=ln(x¯)−12σ2
Le MoM est donc un moyen pratique d'estimer les paramètres, conduisant souvent au même résultat exact que le MLE (car les moments de l'échantillon coïncident souvent avec les moments de la population, par exemple une moyenne d'échantillon est distribuée autour de la moyenne de la population, et jusqu'à un certain facteur / biais, cela fonctionne très bien). Le MLE a une base théorique plus solide et permet par exemple d'estimer les erreurs en utilisant la matrice de Fisher (ou ses estimations), et c'est une approche beaucoup plus naturelle dans le cas de problèmes de régression (je ne l'ai pas essayé mais je suppose que un MoM pour résoudre les paramètres dans une régression linéaire simplene fonctionne pas facilement et peut donner de mauvais résultats. Dans la réponse de superpronker, il semble que cela se fasse par une minimisation d'une fonction. Pour MLE, cette minimisation exprime une probabilité plus élevée, mais je me demande si cela représente une chose similaire pour MoM).