Les interprétations bayésiennes n'existent que dans le cadre de l'analyse bayésienne, pour les estimateurs qui se rapportent à une distribution postérieure. Par conséquent, la seule façon de donner à l'estimateur REML une interprétation bayésienne (c.-à-d. Une interprétation en tant qu'estimateur prise à partir de la position postérieure) est de prendre la log-vraisemblance restreinte dans l'analyse REML comme étant la valeur log-postérieure d'une valeur correspondante. Analyse bayésienne; dans ce cas, l'estimateur REML serait un estimateur MAP de la théorie bayésienne, avec son interprétation bayésienne correspondante.
Définition de l'estimateur REML comme estimateur MAP: Il est relativement simple de voir comment définir la log-vraisemblance restreinte dans l'analyse REML pour être le log-postérieur dans une analyse Bayes. Pour ce faire, nous exigeons que le log-prior soit le négatif de la partie du log-vraisemblance qui est supprimée par le processus REML. Supposons que nous ayons une vraisemblance où est la log-vraisemblance résiduelle et est le paramètre d'intérêt (avec étant notre paramètre de nuisance). La définition de l'avant sur donne le postérieur correspondant:ℓx(θ,ν)=ℓ∗(θ,ν)+ℓRE(θ)ℓRE(θ)θνπ(θ,ν)∝exp(−ℓ∗(θ,ν))
π(θ|x)∝∫Lx(θ,ν)π(θ,ν)dν∝∫exp(ℓx(θ,ν))exp(−ℓ∗(θ,ν))dν=∫exp(ℓx(θ,ν)−ℓ∗(θ,ν))dν=∫exp(ℓ∗(θ,ν)+ℓRE(θ)−ℓ∗(θ,ν))dν=∫exp(ℓRE(θ))dν=∫LRE(θ)dν∝LRE(θ).
Cela nous donne:
θ^MAP=argmaxθπ(θ|x)=argmaxθLRE(θ)=θ^REML.
Ce résultat nous permet d'interpréter l'estimateur REML comme un estimateur MAP, donc l'interprétation bayésienne correcte de l'estimateur REML est que c'est l'estimateur qui maximise la densité postérieure sous le précédent ci-dessus .
Après avoir illustré la méthode pour donner une interprétation bayésienne à l'estimateur REML, nous notons maintenant qu'il y a de gros problèmes avec cette approche. Un problème est que l'a priori est formé en utilisant la composante log-vraisemblance , qui dépend des données. Par conséquent, le «prior» nécessaire pour obtenir cette interprétation n'est pas un véritable prior, dans le sens d'être une fonction qui peut être formée avant de voir les données. Un autre problème est que l'a priori sera souvent incorrect (c'est-à-dire qu'il ne s'intègre pas à un) et qu'il peut en fait augmenter en poids lorsque les valeurs des paramètres deviennent extrêmes. (Nous en montrerons un exemple ci-dessous.)ℓ∗(θ,ν)
Sur la base de ces problèmes, on pourrait soutenir qu'il n'y a pas d'interprétation bayésienne raisonnable pour l'estimateur REML. Alternativement, on pourrait faire valoir que l'estimateur REML maintient toujours l'interprétation bayésienne ci-dessus, étant un estimateur maximum a posteriori sous un "a priori" qui doit coïncider par coïncidence avec les données observées sous la forme spécifiée, et peut être extrêmement impropre.
Illustration avec des données normales: L'exemple classique d'estimation REML est pour le cas de données normales où vous êtes intéressé par la précision et la moyenne est un paramètre de nuisance. Dans ce cas, vous avez la fonction log-vraisemblance:x1,...,xn∼N(ν,1/θ)θν
ℓx(ν,θ)=−n2lnθ−θ2∑i=1n(xi−ν)2.
Dans REML, nous divisons cette log-vraisemblance en deux composantes:
ℓ∗(ν,θ)ℓRE(θ)=−n2lnθ−θ2∑i=1n(xi−ν)2=−n−12lnθ−θ2∑i=1n(xi−x¯)2.
Nous obtenons l'estimateur REML pour le paramètre de précision en maximisant la vraisemblance résiduelle, ce qui donne un estimateur sans biais pour la variance:
1θ^REML=1n−1∑i=1n(xi−x¯)2.
Dans ce cas, l'estimateur REML correspondra à un estimateur MAP pour la densité "antérieure":
π(θ)∝θn/2exp(θ2∑i=1n(xi−ν)2).
Comme vous pouvez le voir, cet «avant» dépend en fait des valeurs de données observées, il ne peut donc pas être formé avant de voir les données. De plus, nous pouvons voir que c'est clairement un a priori "incorrect" qui met de plus en plus de poids sur les valeurs extrêmes de et . (En fait, cet a priori est assez fou.) Si par "coïncidence" vous deviez former un a priori qui correspondait à ce résultat, alors l'estimateur REML serait un estimateur MAP sous cet a priori, et aurait donc une interprétation bayésienne comme estimateur qui maximise le postérieur sous cet a priori.νθν