La proportionnalité est utilisée pour simplifier l'analyse
L'analyse bayésienne se fait généralement via un énoncé encore plus simple du théorème de Bayes, où nous ne travaillons qu'en termes de proportionnalité par rapport au paramètre d'intérêt. Pour un modèle IID standard avec une densité d'échantillonnage nous pouvons exprimer ceci comme:f(X|θ)
p(θ|x)∝Lx(θ)⋅p(θ)Lx(θ)∝∏i=1nf(xi|θ).
Cette déclaration de mise à jour bayésienne fonctionne en termes de proportionnalité par rapport au paramètre . Il utilise deux simplifications de proportionnalité: une dans l'utilisation de la fonction de vraisemblance (proportionnelle à la densité d'échantillonnage) et une dans la partie postérieure (proportionnelle au produit de vraisemblance et a priori). Puisque le postérieur est une fonction de densité (dans le cas continu), la règle de normalisation définit alors la constante multiplicative qui est nécessaire pour produire une densité valide (c'est-à-dire pour la faire s'intégrer à une).θ
Cette méthode d'utilisation de la proportionnalité a l'avantage de nous permettre d'ignorer tous les éléments multiplicatifs des fonctions qui ne dépendent pas du paramètre . Cela tend à simplifier le problème en nous permettant de balayer les parties inutiles des mathématiques et d'obtenir des déclarations plus simples du mécanisme de mise à jour. Ce n'est pas une exigence mathématique (puisque la règle de Bayes fonctionne aussi sous sa forme non proportionnelle), mais cela rend les choses plus simples pour nos petits cerveaux d'animaux.θ
Un exemple appliqué: considérons un modèle IID avec les données observées . Pour faciliter notre analyse, nous définissons les statistiques et , qui sont les deux premiers moments de l'échantillon. Pour ce modèle, nous avons une densité d'échantillonnage:X1,...,Xn∼IID N(θ,1)x¯=1n∑ni=1xix¯¯=1n∑ni=1x2i
f(x|θ)=∏i=1nf(xi|θ)=∏i=1nN(xi|θ,1)=∏i=1n12π−−√exp(−12(xi−θ)2)=(2π)n/2exp(−12∑i=1n(xi−θ)2).=(2π)n/2exp(−n2(θ2−2x¯θ+x¯¯))=(2π)n/2exp(−nx¯¯2)⋅exp(−n2(θ2−2x¯θ))
Maintenant, nous pouvons travailler directement avec cette densité d'échantillonnage si nous le voulons. Mais notez que les deux premiers termes de cette densité sont des constantes multiplicatives qui ne dépendent pas de . Il est ennuyeux de devoir garder une trace de ces termes, alors débarrassons-nous-en, nous avons donc la fonction de vraisemblance:θ
Lx(θ)=exp(−n2(θ2−2x¯θ)).
Cela simplifie un peu les choses, car nous n'avons pas à suivre un terme supplémentaire. Maintenant, nous pourrions appliquer la règle de Bayes en utilisant sa version d'équation complète, y compris le dénominateur intégral. Mais encore une fois, cela nous oblige à garder une trace d'une autre constante multiplicative ennuyeuse qui ne dépend pas de (plus ennuyeux car nous devons résoudre une intégrale pour l'obtenir). Appliquons donc simplement la règle de Bayes sous sa forme proportionnelle. En utilisant le conjugué précédent , avec un paramètre de précision connu , nous obtenons le résultat suivant (en complétant le carré ):θθ∼N(0,λ0)λ0>0
p(θ|x)∝Lx(θ)⋅p(θ)=exp(−n2(θ2−2x¯θ))⋅N(θ|0,λ0)∝exp(−n2(θ2−2x¯θ))⋅exp(−λ02θ2)=exp(−12(nθ2−2nx¯θ+λ0θ2))=exp(−12((n+λ0)θ2−2nx¯θ))=exp(−n+λ02(θ2−2nx¯n+λ0θ))∝exp(−n+λ02(θ−nn+λ0⋅x¯)2)∝N(θ∣∣nn+λ0⋅x¯,n+λ0).
Ainsi, à partir de ce travail, nous pouvons voir que la distribution postérieure est proportionnelle à une densité normale. Puisque le postérieur doit être une densité, cela implique que le postérieur est cette densité normale:
p(θ|x)=N(θ∣∣nn+λ0⋅x¯,n+λ0).
On voit donc qu'a posteriori le paramètre est normalement distribué avec la moyenne et la variance postérieures données par:θ
E(θ|x)=nn+λ0⋅x¯V(θ|x)=1n+λ0.
Maintenant, la distribution postérieure que nous avons dérivée a une constante d'intégration à l'avant de celle-ci (que nous pouvons trouver facilement en recherchant la forme de la distribution normale ). Mais notez que nous n'avons pas eu à nous soucier de cette constante multiplicative - tout notre travail a supprimé (ou introduit) des constantes multiplicatives chaque fois que cela simplifiait les mathématiques. Le même résultat peut être dérivé tout en gardant une trace des constantes multiplicatives, mais c'est beaucoup plus compliqué.