Identique ou différent? La voie bayésienne

Disons que j'ai le modèle suivant:

Poisson (λ) \sim {\begin{cases} λ_{1} & si t < τ \\ λ_{2} & si t \geq τ \end{cases}

$\text{Poisson}(\lambda) \sim \begin{cases} \lambda_1 & \text{if } t \lt \tau \\ \lambda_2 & \text{if } t \geq \tau \end{cases}$

Et je déduis les postérieurs de et montrés ci-dessous à partir de mes données. Existe-t-il une manière bayésienne de dire (ou de quantifier) si et sont identiques ou différents ? $\lambda_1$ $\lambda_2$ $\lambda_1$ $\lambda_2$

Peut-être mesurer la probabilité que soit différent de $\lambda_1$ $\lambda_2$ ? Ou peut-être en utilisant des divergences KL?

Par exemple, comment puis-je mesurer , ou au moins, ? $p(\lambda_2 \neq \lambda_1)$ $p(\lambda_2 \gt \lambda_1)$

En général, une fois que vous avez les postérieurs illustrés ci-dessous (supposez des valeurs PDF non nulles partout pour les deux), quelle est une bonne façon de répondre à cette question?

entrez la description de l'image ici

Mettre à jour

Il semble que l'on puisse répondre à cette question de deux manières:

Si nous avons des échantillons des postérieurs, nous pourrions regarder la fraction des échantillons où (ou de manière équivalente ). @ Cam.Davidson.Pilon a inclus une réponse qui résoudrait ce problème en utilisant de tels exemples. $\lambda_1 \neq \lambda_2$ $\lambda_2 > \lambda_1$
Intégrer une sorte de différence des postérieurs. Et c'est une partie importante de ma question. À quoi ressemblerait cette intégration? On peut supposer que l'approche d'échantillonnage se rapprocherait de cette intégrale, mais j'aimerais connaître la formulation de cette intégrale.

Remarque: les tracés ci-dessus proviennent de ce matériau .

distributions bayesian poisson-distribution

— Amelio Vazquez-Reina
source

Vous pouvez simplement calculer la variance des deux distributions et les ajouter. C'est la variance de la différence des moyennes. Ensuite, calculez la différence dans les moyennes et voyez combien il y a d'écarts-types. Vous pouvez approximer les deux distributions avec un début normal et utiliser les intervalles de confiance habituels pour une distribution normale. Ce sont clairement des moyens différents.

— Dave31415

Le test d'hypothèse intrinsèque est une réponse

— Stéphane Laurent

Tous les calculs requis sont fournis dans mon article mais je n'ai pas étudié le cas de

(

est le rapport des deux taux de Poisson)

H_{0} : {ϕ = 1}

$H_0:\{\phi=1\}$

ϕ

$\phi$

— Stéphane Laurent

Merci @ StéphaneLaurent. Votre article est un excellent pointeur, mais il semble être spécifique aux processus de Poisson. Quelle est la comparaison, à un niveau élevé, qu'un bayésien peut faire pour estimer si

est identique ou différent de

? L'analyse doit-elle être spécifique à la distribution?

λ_{2}

$\lambda_2$

λ_{1}

$\lambda_1$

— Amelio Vazquez-Reina

Désolé @ user023472 Je n'ai pas d'énergie ces jours-ci. Voir les articles de Bernardo cités dans mon article. "Intrinsèque" signifie que la méthode est dérivée et uniquement du modèle.

— Stéphane Laurent

Réponses:

Je pense qu'une meilleure question est, sont-ils significativement différents?

Pour répondre à cela, nous devons calculer . Appelez cette quantité . Si , alors il y a une chance égale que l'un soit plus grand que l'autre. En revanche, si est vraiment proche de 1, alors on peut être sûr que oui est plus grand (lire: différent) que . $P(\lambda_2 > \lambda_1)$ $p$ $p \approx 0.50$ $p$ $\lambda_2$ $\lambda_1$

Comment calcule-t-on ? C'est trivial dans un cadre bayésien MCMC. Nous avons des échantillons de la partie postérieure, donc calculons simplement le fait que les échantillons de sont plus grands que : $p$ $\lambda_2$ $\lambda_1$

 p = np.mean( lambda_2_samples > lambda_1_samples )
 print p

Je m'excuse de ne pas avoir inclus cela dans le livre, je vais certainement l'ajouter car je pense que c'est l'une des idées les plus utiles de l'inférence bayésienne

— Cam.Davidson.Pilon
source

La probabilité est de 1,0, elles sont différentes, car ce sont toutes deux des variables aléatoires continues. Considérez: quelle est votre supposition préalable que

? Pensez-vous vraiment qu'ils sont réellement égaux? (Ignorer les tests d'hypothèse: nous vivons dans le monde réel où les variables ne sont jamais réellement égales). Voir cet article de mon héros, Gelman. Calculativement, vous pouvez tester cela en calculant .

λ_{1} = λ_{2}

$\lambda_1 = \lambda_2$ np.mean( lambda_2_samples != lambda_1_samples)

— Cam.Davidson.Pilon

P (| λ_{1} - λ_{2} | > 1)

$P(|\lambda_1-\lambda_2| > 1)$

P (λ_{1} \neq λ_{2})

$P(\lambda_1 \ne \lambda_2)$

λ_{1}

$\lambda_1$

λ_{2}

$\lambda_2$

λ_{2}

$\lambda_2$

λ_{1}

$\lambda_1$

oh mon dieu, je détesterais être dans cette situation! Cela implique des intégrales désagréables. Pour la plupart des modèles, vous ne pouvez pas réellement dériver les postérieurs. Même si vous le pouviez, il serait toujours préférable d'utiliser un ordinateur, juste pour obtenir des échantillons. En résumé, des exemples> des formules pour des calculs comme celui-ci.

— Cam.Davidson.Pilon

Vous ne mesurez pas "suffisamment plus grand". Considérons une distribution avec un pic à zéro et une autre avec des masses égales aux pics -10, 10. Votre statistique - la valeur attendue de l'indicateur qu'un échantillon est plus grand que l'autre - donne 0,5, mais les distributions sont clairement totalement différentes.

— Neil G

$\lambda_1$ $\lambda_2$ $\Pr(\lambda_1=\lambda_2)=0$

$\lambda_1$ $\lambda_2$ $\epsilon$ $[-\epsilon/2, \epsilon/2]$

$\lambda_2>\lambda_1$

— Sycorax dit de réintégrer Monica
source

Merci. Comment votre réponse se rapporte-t-elle à certaines des idées discutées dans les commentaires du PO?

— Amelio Vazquez-Reina

Toutes mes excuses, mais je ne connais aucune de ces méthodes, je ne peux donc pas faire de commentaire significatif. @ Stéphane_Laurent est assez intelligent, donc je recommanderais de regarder le lien, au minimum.

— Sycorax dit Réintégrer Monica

@ user023472 Désolé, je n'ai pas l'énergie aujourd'hui pour répondre à l'approche des différences intrinsèques. Elle est basée sur la divergence Kullback-Leibler.

— Stéphane Laurent

ϵ

$\epsilon$

p (λ_{2} > λ_{1})

$p(\lambda_2 \gt \lambda_1)$

p (λ_{2} \neq λ_{1})

$p(\lambda_2 \neq \lambda_1)$

Merci @ user777. Je m'intéresse au cas où nous n'avons pas accès aux échantillons. Vous aviez une intégrale dans votre message plus tôt, mais vous semblez l'avoir supprimée. À quoi ressemblerait cette intégrale?

— Amelio Vazquez-Reina