Quelle est la différence entre une probabilité partielle, une probabilité de profil et une probabilité marginale?

56

Je vois que ces termes sont utilisés et que je continue à les mélanger. Existe-t-il une explication simple des différences entre eux?

estimation maximum-likelihood

— Rob Hyndman
source

57

La fonction de vraisemblance dépend généralement de nombreux paramètres. En fonction de l'application, nous ne sommes généralement intéressés que par un sous-ensemble de ces paramètres. Par exemple, en régression linéaire, l’intérêt réside généralement dans les coefficients de la pente et non dans la variance de l’erreur.

Notons les paramètres qui nous intéressent en tant que $\beta$ et les paramètres qui ne sont pas d'intérêt principal en tant que $\theta$ . La manière habituelle d'aborder le problème d'estimation consiste à maximiser la fonction de vraisemblance de manière à obtenir des estimations de $\beta$ et $\theta$ . Cependant, puisque l'intérêt principal réside dans $\beta$ partiel, le profil et la vraisemblance marginale offrent d'autres moyens d'estimer $\beta$ sans estimer $\theta$ .

Afin de voir la différence, notons la vraisemblance standard par $L(\beta, \theta|\mathrm{data})$ .

Plausibilité maximum

Trouver $\beta$ et $\theta$ qui maximise $L(\beta, \theta|\mathrm{data})$ .

Probabilité partielle

Si nous pouvons écrire la fonction de vraisemblance comme:

L (β, θ | d a t a) = L_{1} (β | d a t a) L_{2} (θ | d a t a)

$L(\beta, \theta|\mathrm{data}) = L_1(\beta|\mathrm{data}) L_2(\theta|\mathrm{data})$

$L_1(\beta|\mathrm{data})$

Probabilité de profil

$\theta$ $\beta$ $\theta$

$\theta = g(\beta)$

L (β, g (β) | d a t a)

$L(\beta, g(\beta)|\mathrm{data})$

Probabilité marginale

$\theta$ $\theta$ $\beta$

— febstar
source

2

Notez que la dernière définition ici est une probabilité intégrée (ou bayésienne) et non une probabilité marginale.

— ars

Est-ce correct dans la RHS pour une vraisemblance partielle: "L2 (θ | thêta)"?

— jpalecek

@ars, voudriez-vous modifier la réponse et donner la définition de la probabilité marginale alors?

— Waldir Leoncio

13

Tous les trois sont utilisés pour traiter des paramètres de nuisance dans la fonction de vraisemblance complètement spécifiée.

La probabilité marginale est la méthode principale pour éliminer les paramètres de nuisance en théorie. C'est une vraie fonction de vraisemblance (c'est-à-dire qu'elle est proportionnelle à la probabilité (marginale) des données observées).

La probabilité partielle n'est pas une probabilité réelle en général. Cependant, dans certains cas, il peut être traité comme une probabilité d'inférence asymptotique. Par exemple, dans les modèles à risques proportionnels de Cox, où il a été créé, nous nous intéressons au classement observé dans les données (T1> T2> ..) sans spécifier le risque de base. Efron a montré que la probabilité partielle ne perd que peu d'informations, voire aucune, pour diverses fonctions de risque.

La probabilité de profil est pratique lorsque nous avons une fonction de vraisemblance multidimensionnelle et un seul paramètre d’intérêt. Elle est spécifiée en remplaçant la nuisance S par sa MLE à chaque T fixe (paramètre d'intérêt), c'est-à-dire L (T) = L (T, S (T)). Cela peut bien fonctionner dans la pratique, bien qu'il y ait un biais potentiel dans le MLE obtenu de cette manière; la probabilité marginale corrige ce biais.

— ars
source