Régression bayésienne au singulier


8

Communauté SE, j'espère avoir un aperçu du problème suivant. Étant donné un modèle de régression linéaire simple

Y=Xβ+ϵ , where YRT,XRT×N.
Sous une fonction de vraisemblance gaussienne avec des termes d'erreur homoscédastiques, la distribution conditionnelle de la variable dépendante prend la forme
Y|β,hN(Xβ,h1I).
J'attribue un conjugué conditionnel (non informatif) avant pour β et h
β|hN(0,cI),hG(s2,v)
étaient c,v0. C’est un résultat standard que la distribution marginale postérieure deβ est t multivarié avec
β|DtN(β^,Σ^,T).
Ce qui se passe si (XX)est singulier? Dans la régression standard, je choisirais le pseudoinverse généralisé de Moore-Penrose(XX)+ à la place d'utiliser (XX)1. Cependant, dans ce cas, la variance postérieureΣ^:=c(XX)1 serait également singulier et je doute que le t-La distribution est encore bien définie. Est-ce correct?

Et encore plus distrayant pour moi: supposons que je ne suis pas vraiment intéressé par la distribution postérieure de β mais juste une combinaison linéaire z:=AβARN1×N, et |AΣ^A|0. Je pourrais échantillonner à partir de cette distribution bien que sa construction soit basée sur quelque chose qui n'est pas vraiment défini (la distribution deβ). Existe-t-il un moyen de gérer cela? Ou y a-t-il une erreur essentielle dans ma question qui rend mon argument obsolète?


2
Au mieux, les priorités non informatives fournissent des résultats utiles lorsque les données identifient de manière unique les paramètres du modèle - Cette observation est essentiellement la raison pour laquelle nous avons une régression de crête et ses apparentés au lieu de nous fier uniquement à l'OLS. Mais si les données ne sont pas suffisamment informatives, on choisira généralement la voie de régression régularisée (crête, etc.) ou la voie entièrement bayésienne. Dans l'itinéraire complet des Bayes, définissez simplement des distributions préalables appropriées et informatives sur vos données et le problème sera résolu.
Sycorax dit Réintégrer Monica

1
Merci pour vos commentaires jusqu'à présent! Je comprends que le postérieur deβn'est pas correctement défini. Cependant, cela pose-t-il vraiment des problèmes pour la variable aléatoire zqui est au moins théoriquement bien défini?
muffin1974

1
Bien. ce qui me dérange, c'est que le postérieur dezsemble plausible bien que la voie vers une solution ne soit pas du tout satisfaisante. Je recherche actuellement un moyen de réécrire l'équation de régression, car je suis optimiste quant à la possibilité d'obtenir directement des paramètres de régressionz au lieu de perdre du temps à chercher β. Cependant, bien que cela semble possible dans mon cas spécifique, je me pose toujours la question de savoir ce que cela signifie si un «mauvais» modèle est imbriqué dans un modèle fonctionnel ...
muffin1974

Réponses:


2

Le problème majeur de votre question est que la prise de limites ne s'étend pas directement aux mesures et aux distributions de probabilité. Il existe de nombreux types de convergence différents associés aux mesures.

Par conséquent, compte tenu du conjugué

β|hN(0,cI),hG(s2,ν)
et laisser ν et c aller à 0 et , respectivement, n'a pas de signification mathématique propre ou unique.

Maintenant, si vous considérez le mauvais avant

π(β,h)1h
il n'y a pas de distribution postérieure associée à la probabilité
L(β,h|X,y)=exp{h(yXβ)T(yXβ)/2}hT/2
parce que le potentiel postérieur ne s'intègre pas dans β sur conditionnelle h. Il n'y a pas
Σ^=(XTX)1
soit parce que l'inverse n'existe pas et pas de distribution bien définie sur Aβ.
En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.