Je vois que ces termes sont utilisés et que je continue à les mélanger. Existe-t-il une explication simple des différences entre eux?
Je vois que ces termes sont utilisés et que je continue à les mélanger. Existe-t-il une explication simple des différences entre eux?
Réponses:
La fonction de vraisemblance dépend généralement de nombreux paramètres. En fonction de l'application, nous ne sommes généralement intéressés que par un sous-ensemble de ces paramètres. Par exemple, en régression linéaire, l’intérêt réside généralement dans les coefficients de la pente et non dans la variance de l’erreur.
Notons les paramètres qui nous intéressent en tant que et les paramètres qui ne sont pas d'intérêt principal en tant que . La manière habituelle d'aborder le problème d'estimation consiste à maximiser la fonction de vraisemblance de manière à obtenir des estimations de et . Cependant, puisque l'intérêt principal réside dans partiel, le profil et la vraisemblance marginale offrent d'autres moyens d'estimer sans estimer .
Afin de voir la différence, notons la vraisemblance standard par .
Plausibilité maximum
Trouver et qui maximise .
Probabilité partielle
Si nous pouvons écrire la fonction de vraisemblance comme:
Probabilité de profil
Probabilité marginale
Tous les trois sont utilisés pour traiter des paramètres de nuisance dans la fonction de vraisemblance complètement spécifiée.
La probabilité marginale est la méthode principale pour éliminer les paramètres de nuisance en théorie. C'est une vraie fonction de vraisemblance (c'est-à-dire qu'elle est proportionnelle à la probabilité (marginale) des données observées).
La probabilité partielle n'est pas une probabilité réelle en général. Cependant, dans certains cas, il peut être traité comme une probabilité d'inférence asymptotique. Par exemple, dans les modèles à risques proportionnels de Cox, où il a été créé, nous nous intéressons au classement observé dans les données (T1> T2> ..) sans spécifier le risque de base. Efron a montré que la probabilité partielle ne perd que peu d'informations, voire aucune, pour diverses fonctions de risque.
La probabilité de profil est pratique lorsque nous avons une fonction de vraisemblance multidimensionnelle et un seul paramètre d’intérêt. Elle est spécifiée en remplaçant la nuisance S par sa MLE à chaque T fixe (paramètre d'intérêt), c'est-à-dire L (T) = L (T, S (T)). Cela peut bien fonctionner dans la pratique, bien qu'il y ait un biais potentiel dans le MLE obtenu de cette manière; la probabilité marginale corrige ce biais.