Comment puis-je compléter le carré avec une probabilité normale et une priorité normale?


8

Comment puis-je compléter le carré à partir du point où je me suis arrêté, et est-ce correct jusqu'à présent?

J'ai un avant normal pour β de la forme p(β|σ2)N(0,σ2V), obtenir:

p(β|σ2)=(2πσ2V)p2exp[-12σ2βTβ]

βTβ est je=1pβje2.

Ma probabilité a une distribution normale pour les points de données y du formulaire p(y|β,σ2)N(Bβ,σ2je)

p(y|β,σ2)=(2πσ2V)n2exp[-12σ2(y-Bβ)T(y-Bβ)]

(Notez que β est aussi une matrice / vecteur, \ bf ne fonctionne pas.)

Pour obtenir mon postérieur pour β J'ai combiné ce qui précède, pris uniquement les parties exponentielles, puis développé pour obtenir:

exp[-12σ2(yTy-yTBβ-βBTy-βTBTBβ)]exp[-12σ2(βTB)].

J'ai laissé tomber le (yTy) terme, car il n’est pas fonction β.

Mettre en une seule expression sans l'exponentielle:

-12σ2(-yTBβ-βBTy-βTBTBβ+βTB).

Je sais que je dois combiner les termes similaires et prendre la forme de la distribution normale multivariée, ce que je vise, mais je ne sais pas comment faire? Je dois probablement ajouter un terme supplémentaire à l'expression pour la mettre sous la bonne forme?

Remarque: Ce ne sont pas des devoirs, c'est un projet, mais mes connaissances professionnelles bayésiennes ne sont pas bonnes du tout et j'ai donc besoin de comprendre le travail. J'ai l'intention d'intégrer leβ puis le σ2 après être entré dans la forme multivariée.


2
Si vous êtes uniquement intéressé par le calcul, ce lien peut vous intéresser.

Ce n'est peut-être pas vos devoirs, mais je pense que je me souviens de ce problème dans le manuel d'analyse de données de Gelman et al Bayesian
David LeBauer

Le lien pour la page wikipedia ci-dessus est ce que j'essaie de faire, mais c'est le travail réel que je ne sais pas faire.
Ellie

Je regarde le livre 'Bayesian data analysis' et j'ai trouvé au chapitre 15 que c'est en effet une disposition similaire à ce que j'essaie de faire, mais encore une fois il n'y a pas de travail à suivre.
Ellie

Réponses:


13

Je vais recommencer à zéro, car le message d'origine contient des fautes de frappe comme des signes erronés, laissant tomber le V matrice, etc.

Vous avez spécifié avant p(β)=N(0,σ2V) et probabilité: p(y|β)=N(Bβ,σ2je).

Nous pouvons écrire chacun de ceux-ci purement comme des expressions de termes à l'intérieur du exp qui dépendent de β, regroupant tous les termes sans rapport avec β en une seule constante:

Journalp(β)+const=-12σ2βTV-1β

Journalp(y|β)+const=-12σ2(βTBTBβ-2yTBβ) (Notez que yTBβ=βTBTy toujours)

L'ajout de ceux-ci dans l'espace journal et la collecte de termes similaires donne le journal non normalisé postérieur

Journalp(β|y)+const=-12σ2(βT(V-1+BTB)β-2yTBβ) (1)

... ici, nous avons utilisé l'identité standard XTUNEX+XTCX=XT(UNE+C)X pour tous les vecteurs X et matrices UNE,C de taille appropriée.

OK, notre objectif est maintenant de "compléter" le carré. Nous aimerions une expression du formulaire ci-dessous, qui indiquerait que le postérieur deβ est gaussien.

Journalp(β|y)+const=(β-μp)TΛp(β-μp)=βTΛpβ-2μpTΛpβ+μpTΛpμp

où les paramètres μp,Λp définir respectivement la matrice postérieure de la moyenne et la covariance inverse.

Eh bien, par inspection eqn. (1) ressemble beaucoup à ce formulaire si nous définissons

Λp=V-1+BTB et μp=Λp-1BTy

En détail, nous pouvons montrer que cette substitution crée chaque terme nécessaire à partir de (1):

terme quadratique: βTΛpβ=βT(V-1+BTB)β

terme linéaire: μpTΛpβ=(Λp-1BTy)TΛpβ=yTBΛp-1Λpβ=yTBβ

.... ici nous avons utilisé des faits (UNEB)T=BTUNET et (Λp-1)T=Λp-1 en raison de la symétrie (Λp est symétrique, alors son inverse aussi).

Cependant, cela nous laisse avec un terme supplémentaire embêtant μpTΛpμp. Pour éviter cela, nous soustrayons simplement ce terme de notre résultat final. Ainsi, nous pouvons directement remplacer notreμp,Λp paramètres dans (1) pour obtenir

Journalp(β|y)+const=-12σ2[(β-μp)TΛp(β-μp)-μpΛpμp]

puisque ce dernier terme est constant par rapport à β, nous pouvons simplement l'écraser dans la grande constante de normalisation sur le côté gauche et nous avons atteint notre objectif.


Le dernier terme de la dernière équation doit être μpTΛpμp
alberto
En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.