Mes vraies questions se trouvent dans les deux derniers paragraphes, mais pour les motiver:
Si j'essaie d'estimer la moyenne d'une variable aléatoire qui suit une distribution normale avec une variance connue, j'ai lu que le fait de mettre un uniforme avant sur la moyenne donne une distribution postérieure proportionnelle à la fonction de vraisemblance. Dans ces situations, l'intervalle crédible bayésien chevauche parfaitement l'intervalle de confiance fréquentiste, et l'estimation maximale bayésienne a posteriori est égale à l'estimation du maximum de vraisemblance fréquentiste.
Dans un simple paramètre de régression linéaire,
mettre un a priori uniforme sur et un a priori gamma inverse sur avec de petites valeurs de paramètres donne un postérieur qui sera très similaire au fréquentiste , et un intervalle crédible pour la distribution postérieure de qui sera très similaire à l'intervalle de confiance autour de l'estimation du maximum de vraisemblance. Ils ne seront pas exactement les mêmes car le précédent sur exerce une petite quantité d'influence, et si l'estimation postérieure est effectuée via une simulation MCMC qui introduira une autre source de divergence, mais l'intervalle crédible bayésien autour duσ 2 β M A P de M L E β | X σβ M A P β M L Eet l'intervalle de confiance fréquentiste autour de sera assez proche les uns des autres, et bien sûr, à mesure que la taille de l'échantillon augmente, ils devraient converger à mesure que l'influence de la probabilité augmente pour dominer celle de l'a priori.
Mais j'ai lu qu'il y a aussi des situations de régression où ces quasi-équivalences ne tiennent pas. Par exemple, les régressions hiérarchiques avec des effets aléatoires, ou la régression logistique - ce sont des situations où, si je comprends bien, il n'y a pas de «bons» objectifs ou références a priori.
Donc ma question générale est la suivante - en supposant que je veux faire une inférence suret que je n'ai pas d'informations préalables que je souhaite intégrer, pourquoi ne puis-je pas procéder à une estimation fréquentielle du maximum de vraisemblance dans ces situations et interpréter les estimations de coefficient et les erreurs-types résultantes comme des estimations et des écarts-types du MAP bayésien et les traiter implicitement des estimations "postérieures" résultant d'un a priori qui devait être "non informatif" sans chercher à trouver la formulation explicite du prieur qui conduirait à un tel postérieur? En général, dans le domaine de l'analyse de régression, quand est-il acceptable de procéder dans ce sens (de traiter la probabilité comme un postérieur) et quand n'est-il pas acceptable? Qu'en est-il des méthodes fréquentistes qui ne sont pas basées sur la vraisemblance, telles que les méthodes de quasi-vraisemblance,
Les réponses dépendent-elles si mon objectif d'inférence est une estimation ponctuelle des coefficients, ou la probabilité qu'un coefficient se situe dans une plage particulière, ou des quantités de la distribution prédictive?