Quelles distributions ont des solutions sous forme fermée pour les estimations du maximum de vraisemblance des paramètres à partir d'un échantillon d'observations indépendantes?
Quelles distributions ont des solutions sous forme fermée pour les estimations du maximum de vraisemblance des paramètres à partir d'un échantillon d'observations indépendantes?
Réponses:
Sans perte de généralité appréciable, nous pouvons supposer que la densité de probabilité (ou masse) pour toute observation (sur observations) est strictement positive, ce qui nous permet de l'écrire comme exponentiellex i n
pour un vecteur de paramètre .
L'égalisation du gradient de la fonction log de vraisemblance à zéro (qui trouve les points stationnaires de la vraisemblance, parmi lesquels seront tous les maxima globaux intérieurs s'il en existe un) donne un ensemble d'équations de la forme
un pour chaque . Pour l'un de ces d'avoir une solution prête, nous voudrions pouvoir séparer les termes de la termes . (Tout découle de cette idée clé, motivée par le principe de la paresse mathématique : faites le moins de travail possible; réfléchissez avant de calculer; abordez d'abord les versions faciles des problèmes difficiles.) La façon la plus générale de le faire est de prendre les équations la formex i θ
pour les fonctions connues , et , car alors la solution est obtenue en résolvant les équations simultanéesτ j α j
pour . En général, ceux-ci seront difficiles à résoudre, mais à condition que l'ensemble des valeurs de donne des informations complètes sur , nous pourrions utilisez simplement ce vecteur à la place de lui-même (généralisant ainsi quelque peu l'idée d'une solution de "forme fermée", mais d'une manière très productive). Dans un tel cas, l'intégration en ce qui rendements( n α j ( θ )θθθj
(où représente tous les composants de sauf ). Parce que le côté gauche est fonctionnellement indépendant de , nous devons avoir cela pour une fonction fixe ; que ne doit pas du tout dépendre de ; et les sont des dérivés d'une fonction et les sont des dérivés d'une autre fonction , tous deux fonctionnellement indépendants des données. D'où θ θ j θ j τ j ( x ) = T ( x ) T B θ η j H ( θ ) α j A ( θ )
Les densités qui peuvent être écrites sous cette forme constituent la fameuse famille Koopman-Pitman-Darmois , ou exponentielle . Il comprend d'importantes familles paramétriques, à la fois continues et discrètes, y compris Gamma, Normal, Chi-carré, Poisson, Multinomial et bien d'autres .
Je ne sais pas si je pourrais tous les énumérer. Les exponentielles, normales et binomiales viennent à l'esprit et elles entrent toutes dans la classe des familles exponentielles. La famille exponentielle a sa statistique suffisante dans l'exposant et le mle est souvent une belle fonction de cette statistique suffisante.