Que sont les contrôles prédictifs postérieurs et qu'est-ce qui les rend utiles?


33

Je comprends ce qu'est la distribution prédictive postérieure , et j'ai lu sur les vérifications prédictives postérieures , bien que je ne sache pas encore ce qu'elle fait.

  1. Quelle est exactement la vérification prédictive postérieure?
  2. Pourquoi certains auteurs affirment que l'exécution de vérifications prédictives postérieures «utilise les données deux fois» et ne devrait pas être abusée? (ou même que ce n'est pas bayésien)? (par exemple voir ceci ou cela )
  3. À quoi sert cette vérification exactement? Peut-il vraiment être utilisé pour la sélection de modèles? (p. ex. tient-il compte à la fois de la forme physique et de la complexité du modèle?)

Réponses:


36

Les vérifications prédictives postérieures consistent, en termes simples, à «simuler des données répliquées sous le modèle ajusté puis à les comparer aux données observées» ( Gelman et Hill, 2007, p. 158 ). Ainsi, vous utilisez la prédiction postérieure pour «rechercher des écarts systématiques entre les données réelles et simulées» ( Gelman et al. 2004, p. 169 ).

L'argument à propos de "l'utilisation des données deux fois" est que vous utilisez vos données pour estimer le modèle et ensuite, pour vérifier si le modèle correspond aux données, alors qu'en général c'est une mauvaise idée et qu'il serait préférable de valider votre modèle sur des données externes , qui n'a pas été utilisé pour l'estimation.

Les vérifications prédictives postérieures sont utiles pour évaluer si votre modèle vous donne des prédictions «valides» sur la réalité - correspondent-elles ou non aux données observées? C'est une phase utile de construction et de vérification de modèles. Il ne vous donne pas une réponse définitive sur si votre modèle est "ok" ou s'il est "meilleur" qu'un autre modèle, cependant, il peut vous aider à vérifier si votre modèle a du sens.

Ceci est bien décrit dans LaplacesDemon vignette Inférence Bayésienne :

yreprésentanty

Les contrôles prédictifs postérieurs (via la distribution prédictive) impliquent une double utilisation des données, ce qui viole le principe de vraisemblance. Cependant, des arguments ont été avancés en faveur des vérifications prédictives postérieures, à condition que l'utilisation soit limitée aux mesures de l'écart pour étudier l'adéquation du modèle, et non pour la comparaison et l'inférence du modèle (Meng 1994).

yreprésentantyyyreprésentant


3
en ce qui concerne votre côté que les PPC pourraient ne pas être bayésiens, notez que Gelman discute beaucoup de ce qu'est exactement une analyse de données bayésienne / bayésienne Gelman et Shalizi
N Brouwer

2
Gelman & Shalizi discutent de ce qu'est l'analyse des données bayésiennes selon leur point de vue. Il existe de nombreux points de vue différents, tous bien motivés - de Jeffreys à Savage, de De Finetti à Gaifman, Scott & Krauss & Hailperin , sans parler de points de vue encore plus différents, comme celui de Dempster-Shafer .
pglpm
En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.