Comment formaliser une distribution de probabilité antérieure? Y a-t-il des règles générales ou des conseils à utiliser?


9

Bien que j'aime à penser que j'ai une bonne compréhension du concept de l'information préalable dans l'analyse statistique et la prise de décision bayésienne, j'ai souvent du mal à comprendre ma demande. Je pense à quelques situations qui illustrent mes luttes et je pense qu'elles ne sont pas correctement traitées dans les manuels de statistiques bayésiens que j'ai lus jusqu'à présent:

Disons que j'ai mené une enquête il y a quelques années qui indique que 68% des personnes seraient intéressées à acheter un produit ACME. Je décide de relancer l'enquête. Bien que j'utilise la même taille d'échantillon que la dernière fois (disons, n = 400), les opinions des gens ont probablement changé depuis lors. Cependant, si j'utilise au préalable une distribution bêta dans laquelle 272 des 400 répondants ont répondu «oui», j'accorderais un poids égal à l'enquête que j'ai menée il y a quelques années et à celle que j'exécuterais maintenant. Existe-t-il une règle empirique pour établir la plus grande incertitude que j'aimerais placer sur le prieur en raison du fait que ces données datent de quelques années? Je comprends que je peux simplement réduire le précédent de 272/400 à, disons, 136/200, mais cela semble extrêmement arbitraire, et je me demande s'il y a une certaine forme de justification, peut-être dans la littérature,

Pour un autre exemple, disons que nous sommes sur le point de mener un essai clinique. Avant de lancer l'essai, nous effectuons des recherches secondaires que nous pourrions utiliser comme informations préalables, y compris des opinions d'experts, les résultats d'essais cliniques précédents (de pertinence variable), d'autres faits scientifiques de base, etc. Comment procéder pour combiner ce spectre d'informations (dont certains sont de nature non quantitative) à une distribution de probabilité antérieure? S'agit-il simplement de décider quelle famille choisir et de la rendre suffisamment diffuse pour qu'elle soit submergée par les données, ou y a-t-il beaucoup de travail pour établir une distribution préalable assez informative?


Réponses:


4

Votre idée de traiter vos informations antérieures de 272 succès en 400 tentatives a une justification bayésienne assez solide.

θ

π(θ)=Γ(α0+β0)Γ(α0)Γ(β0)θα01(1θ)β01
n_=α0+β02n_α01
π(θ)=Γ(α0+β0)Γ(α0)Γ(β0)θα01(1θ)n_(α01)
α0+β02=400α01=272α0=273β0=129α0=137β0=65
μ=αα+βandσ2=αβ(α+β)2(α+β+1)
alpha01 <- 273
beta01 <- 129
(mean01 <- alpha01/(alpha01+beta01))

alpha02 <- 137
beta02 <- 65
(mean02 <- alpha02/(alpha02+beta02))

mais augmente la variance antérieure de

(priorvariance01 <- (alpha01*beta01)/((alpha01+beta01)^2*(alpha01+beta01+1)))
[1] 0.0005407484

à

(priorvariance02 <- (alpha02*beta02)/((alpha02+beta02)^2*(alpha02+beta02+1)))
[1] 0.001075066

comme voulu.

En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.