Un a priori pour un paramètre aura presque toujours une forme fonctionnelle spécifique (écrite en termes de densité, généralement). Disons que nous nous limitons à une famille particulière de distributions, auquel cas le choix de notre a priori se réduit au choix des paramètres de cette famille.
Par exemple, considérons un modèle normal Yi∼iidN(μ,σ2) . Pour simplifier, prenons aussi σ2 comme connu. Cette partie du modèle - le modèle des données - détermine la fonction de vraisemblance.
Pour compléter notre modèle bayésien, nous avons besoin ici d'un a priori pour μ .
Comme mentionné ci-dessus, nous pouvons généralement spécifier une famille de distribution pour notre a priori pour μ , puis nous n'avons qu'à choisir les paramètres de cette distribution (par exemple, souvent les informations antérieures peuvent être assez vagues - comme à peu près où nous voulons que la probabilité se concentre - plutôt que de forme fonctionnelle très spécifique, et nous pouvons avoir assez de liberté pour modéliser ce que nous voulons en choisissant les paramètres - disons pour correspondre à une moyenne et une variance antérieures).
S'il s'avère que le postérieur de μ appartient à la même famille que le précédent, alors ce prior est dit «conjugué».
(Ce qui fait qu'il est conjugué, c'est la façon dont il se combine avec la probabilité)
Donc dans ce cas, prenons un a priori gaussien pour μ (disons μ ∼ N( θ , τ2) ). Si nous faisons cela, nous voyons que le postérieur de μ est également gaussien. Par conséquent, le prieur gaussien était un prieur conjugué pour notre modèle ci-dessus.
C'est tout ce qu'il y a vraiment - si le postérieur est de la même famille que le prieur, c'est un prieur conjugué.
Dans les cas simples, vous pouvez identifier un conjugué avant en inspectant la probabilité. Par exemple, considérons une vraisemblance binomiale; en laissant tomber les constantes, cela ressemble à une densité bêta en ; et en raison de la façon dont les puissances de p et ( 1 - p ) se combinent, il se multipliera par une bêta avant de donner également un produit des puissances de p et ( 1 - p ) ... afin que nous puissions voir immédiatement de la probabilité que la bêta sera un conjugué a priori pour p dans la vraisemblance binomiale.pp( 1 - p )p( 1 - p )p
Dans le cas gaussien, il est plus facile de voir que cela se produira en considérant les log-densités et la log-vraisemblance; la log-vraisemblance sera quadratique en et la somme de deux quadratiques est quadratique, donc une log-vraisemblance quadratique antérieure + quadratique log donne une quadratique postérieure (chacun des coefficients du terme d'ordre le plus élevé sera bien sûr négatif).μ