Les itérations MCMC après brûlage peuvent-elles être utilisées pour l'estimation de la densité?

Après le rodage, pouvons-nous utiliser directement les itérations MCMC pour l'estimation de la densité, par exemple en traçant un histogramme ou une estimation de la densité du noyau? Ma préoccupation est que les itérations MCMC ne sont pas nécessairement indépendantes, bien qu'elles soient tout au plus identiques.

Que se passe-t-il si nous appliquons un éclaircissement supplémentaire aux itérations MCMC? Ma préoccupation est que les itérations MCMC sont tout au plus non corrélées et pas encore indépendantes.

Le motif que j'ai appris pour utiliser une fonction de distribution empirique comme estimation de la vraie fonction de distribution est basé sur le théorème de Glivenko – Cantelli , où la fonction de distribution empirique est calculée sur la base d'un échantillon iid. J'ai semblé voir quelques raisons (résultats asymptotiques?) D'utiliser des histogrammes ou des estimations de densité de noyau comme estimations de densité, mais je ne m'en souviens pas.

distributions mcmc asymptotics

— Tim
source

Réponses:

Vous pouvez - et les gens le font - estimer les densités à partir de l'échantillonnage MCMC.

Une chose à garder à l'esprit est que, bien que les histogrammes et les KDE soient pratiques, au moins dans des cas simples (comme l'échantillonnage de Gibbs), des estimations beaucoup plus efficaces de la densité peuvent être disponibles.

Si nous considérons l'échantillonnage de Gibbs en particulier, la densité conditionnelle à partir de laquelle vous échantillonnez peut être utilisée à la place de la valeur de l'échantillon elle-même pour produire une estimation moyenne de la densité. Le résultat a tendance à être assez lisse.

L'approche est discutée dans

Gelfand et Smith (1990), «Sampling-Based Approaches to Calculating Marginal Densities»,
Journal de l'American Statistical Association , vol. 85, n ° 410, pp. 398-409

(bien que Geyer prévienne que si la dépendance de l'échantillonneur est suffisamment élevée, elle ne réduit pas toujours la variance et donne les conditions pour qu'elle le fasse)

Cette approche est également discutée, par exemple, dans Robert, CP et Casella, G. (1999) Monte Carlo Statistical Methods .

Vous n'avez pas besoin d'indépendance, vous calculez en fait une moyenne. Si vous voulez calculer une erreur standard d'une estimation de densité (ou d'un cdf), alors vous devez tenir compte de la dépendance.

Bien entendu, la même notion s'applique à d'autres attentes et peut donc être utilisée pour améliorer les estimations de nombreux autres types de moyenne.

— Glen_b -Reinstate Monica
source

Merci! Voulez-vous dire que, comme les distributions marginales sont des attentes par rapport à la distribution conjointe, il n'est pas important d'utiliser des itérations MCMC corrélées pour estimer les distributions marginales? Et si vous utilisiez les itérations corrélées pour estimer la distribution conjointe? Toujours d'accord?

— Tim

Non, c'est ce que je veux dire. Je veux dire que les estimateurs auxquels nous avons affaire sont des moyennes de choses et sont utilisés pour estimer des quantités de population qui peuvent être interprétées à leur tour comme des attentes de ces choses. Oui, vous pouvez utiliser des tirages dépendants pour estimer une distribution conjointe dans le même sens.

— Glen_b -Reinstate Monica

Pourquoi pouvons-nous utiliser les itérations corrélées pour estimer la distribution conjointe? Je pense que non, car la distribution conjointe n'est pas l'attente de quelque chose. Notez que dans le théorème de Glivenko – Cantelli, le cdf empirique est calculé sur un échantillon iid.

— Tim

Pour la densité, vous pourriez considérer quelque chose comme l'estimation de l'échantillon décrite ici par exemple (et pourrait être considérée comme la limite d'un histogramme avec des cases de plus en plus étroites); c'est une moyenne, et je crois que son attente est la densité. En ce qui concerne le cdf, vous pourriez vous demander si vous pouvez faire quelque chose avec le cdf empirique pour le faire sous forme de moyenne. Les deux idées semblent fonctionner avec des échantillons d'une distribution conjointe.

— Glen_b -Reinstate Monica

Reprendre

Vous pouvez utiliser directement les itérations MCMC pour n'importe quoi car la valeur moyenne de votre observable approchera asymptotiquement la vraie valeur (parce que vous êtes après le rodage).

Cependant, gardez à l'esprit que la variance de cette moyenne est influencée par les corrélations entre les échantillons. Cela signifie que si les échantillons sont corrélés, comme cela est courant dans MCMC, le stockage de chaque mesure n'apportera aucun avantage réel.

En théorie, vous devez mesurer après N étapes, où N est de l'ordre du temps d'autocorrélation de l'observable que vous mesurez.

Explication détaillée

$x_t$ $t$ $f$

$x_t \in \mathbb{R}$ $f=f_a(x)$ $x\in[a,a+\Delta]$ $x_t$ $P(x)$

$f$

F = \frac{1}{N} \sum_{je = 1}^{N} F (X_{je})

$F = \frac{1}{N}\sum_{i=1}^N f(x_i)$

$\langle F\rangle$ $P(x)$

⟨ F ⟩ = \frac{1}{N} \sum_{je = 1}^{N} ⟨ F (X_{je}) ⟩ = ⟨ F (X) ⟩

$\langle F \rangle = \frac{1}{N}\sum_{i=1}^N \langle f(x_i)\rangle = \langle f(x)\rangle$

c'est ce que vous voulez obtenir.

$\langle F^2 \rangle - \langle F \rangle^2$

\sum_{je = 1}^{N} \sum_{j = 1}^{N} ⟨ F (X_{je}) F (X_{j}) ⟩

$\sum_{i=1}^N\sum_{j=1}^N \langle f(x_i)f(x_j)\rangle$

$x_t$ $j=i+\Delta$ $f$ $R(\Delta)$

Donc, pour récapituler:

Si le calcul ne coûte rien pour stocker chaque mesure, vous pouvez le faire, mais gardez à l'esprit que la variance ne peut pas être calculée à l'aide de la formule habituelle.
$\tau$ $\tau$

— Jorge Leitao
source

\sqrt{n}

$\sqrt n$

L'amincissement n'est qu'un gaspillage de données utiles. Cela ne réduit pas la variance de l'estimation. Voir les commentaires sur cette question: stats.stackexchange.com/a/258529/58675

— DeltaIV

@DeltaIV, oui. Mon point ici était que l'amincissement ou non, l'échelle de temps pertinente est toujours le temps d'autocorrélation.

— Jorge Leitao