Un estimateur de Bayes exige-t-il que le vrai paramètre soit une variable possible de l'a priori?


9

Cela pourrait être un peu d'une question philosophique, mais on y va: En théorie de la décision, le risque d'un estimateur Bayes θ ( x ) pour θ Θ est défini par rapport à une distribution avant π sur Θ .θ^(x)θΘπΘ

Maintenant, d'une part, pour que le vrai ait généré les données (c'est-à-dire "existe"), θ doit être une variable possible sous π , par exemple avoir une probabilité non nulle, une densité non nulle, etc .; d'autre part, θ n'est pas connu, d'où le choix d'un a priori, donc nous n'avons aucune garantie que le vrai θ soit une variable possible sous le π que nous avons choisi.θθπθθπ

Maintenant, il me semble que nous devons en quelque sorte sélectionner telle sorte que θ soit une variable possible. Sinon, certains théorèmes ne tiendraient pas. Par exemple, l'estimation minimax ne serait pas une estimation bayésienne pour un a priori le moins favorable, car nous pourrions rendre cet a priori arbitrairement mauvais en excluant une grande région autour et en incluant θ de son domaine. Cependant, il peut être difficile de garantir que θ est bien dans le domaine.πθθθ

Mes questions sont donc:

  1. Est-il généralement supposé que le réel est une variable possible de π ?θπ
  2. Cela peut-il être garanti?
  3. Les cas violant cela peuvent-ils au moins être détectés d'une manière ou d'une autre, donc on ne s'appuie pas sur des théorèmes tels que minimax lorsque les conditions ne sont pas réunies?
  4. Si ce n'est pas nécessaire, pourquoi les résultats standard de la théorie de la décision sont-ils valables?

Réponses:


6

Très belle question! Il serait en effet logique qu'une "bonne" distribution antérieure donne une probabilité positive ou une valeur de densité positive au "vrai" paramètre , mais d'un point de vue purement décisionnel, cela n'a pas à être le cas. Un simple contre-exemple de cette "intuition" selon laquelle π ( θ 0 ) > 0 devrait être nécessaire, lorsque π ( ) est la densité antérieure et θ 0 est la valeur "vraie" du paramètre, est le résultat de la minimaxité brillante de Casella et Strawderman (1981): lors de l'estimation d'une moyenne normale μ basée sur une seule observation xθ0

π(θ0)>0
π()θ0μ avec la contrainte supplémentaire que | μ | < ρ , si ρ est suffisamment petit, ρ 1,0567 en particulier, l'estimateur minimax correspond à un a priori uniforme (le moins favorable) sur { - ρ , ρ } , ce qui signifie que π donne un poids égal à - ρ et ρ (et aucun à aucun autre valeur de la moyenne μ ) π ( θ ) = 1xN(μ,1)|μ|<ρρρ1.0567{ρ,ρ}πρρμ Lorsqueρaugmente, l'a priori le moins favorable voit son support croître, mais en restant un ensemble fini de valeurs possibles. Cependant l'espérance postérieure,E[μ| x], peut prendre n'importe quelle valeur sur(-ρ,ρ).
π(θ)=12δρ(θ)+12δρ(θ)
ρE[μ|x](ρ,ρ)

Le cœur de la discussion (voir les commentaires) pourrait être que, si l'estimateur de Bayes devait être contraint d'être un point dans le support de , ses propriétés seraient très différentes.π()

De même, lorsque l'on considère des estimateurs admissibles, les estimateurs de Bayes associés à un a priori approprié sur un ensemble compact sont généralement admissibles, bien qu'ils aient un support restreint.

ΘL(θ,δ)π(θ|x)dθ
XΘL(θ,δ)π(θ)f(x|θ)dθdx
θ0

θ^π(x)=Θθπ(θ|x)dθ
L2π

En passant, lors de la lecture

pour que le vrai θ ait généré les données (c'est-à-dire "existe"), θ doit être une variable possible sous π, par exemple avoir une probabilité non nulle, une densité non nulle

θ0πxf(x|θ0)πAAθ^π


μ[0,+)μ

1
Habituellement, cf Berger (1985), un a priori le moins favorable correspond au risque minimax.
Xi'an

1
θπ(θ)Θ=[m,m]Θ

1
Le risque intégré n'implique à aucun moment le "vrai" paramètre. Donc, dans ce sens, cela n'a pas d'importance.
Xi'an

1
Donc, dans un sens, le risque capture la perte que nous attendons, pas celle que nous subissons réellement. Cela a été extrêmement utile, merci beaucoup!
user32849

8
  1. θ

  2. (,)[0,1](0,)

  3. Si votre postérieur est "empilé" à un bord du domaine du prieur et que votre prieur impose une restriction inutile au domaine à ce même bord, c'est un indicateur ad hoc que la restriction inutile peut vous causer des problèmes. Mais cela ne devrait se produire que si a) vous avez construit un a priori dont la forme est largement motivée par la commodité au lieu de connaissances préalables réelles, et b) la forme induite par la commodité de l'a priori restreint le domaine du paramètre à un sous-ensemble de ce que son " naturel "peut être considéré comme.

Un exemple de ceci est une vieille pratique, espérons-le depuis longtemps obsolète, de limiter l'a priori sur un terme de variance légèrement éloigné de zéro afin d'éviter des difficultés de calcul potentielles. Si la vraie valeur de la variance se situe entre la borne et zéro, eh bien ... mais en fait, penser aux valeurs potentielles de la variance compte tenu des données, ou (par exemple) mettre le prior sur le journal de la variance à la place, permettra vous pour éviter ce problème, et une intelligence légère similaire devrait vous permettre d'éviter les prieurs limitant le domaine en général.

  1. Répondu par # 1.

2
Si par hasard celui qui a rétrogradé la réponse revient - pourquoi le "pas utile"?
jbowman

3

θ

θ

En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.