Dans le cadre de la reproduction d'un modèle que j'ai décrit partiellement dans cette question sur Stack Overflow, je souhaite obtenir un tracé d'une distribution postérieure. Le modèle (spatial) décrit le prix de vente de certaines propriétés comme une distribution de Bernoulli selon que la propriété est chère (1) ou bon marché (0). Dans les équations:
où est le résultat binaire 1 ou 0, est la probabilité d'être bon marché ou cher, est une variable spatiale aléatoire où représente sa position . Tout cela pour chaque car il y a 70 propriétés dans l'ensemble de données. est une matrice de covariance basée sur la position géographique des points de données. Si vous êtes curieux de connaître ce modèle, l'ensemble de données peut être trouvé ici .
Le tracé que je veux obtenir est le tracé de contour suivant:
La figure est décrite comme "Tracé d'image de la surface médiane postérieure du processus latent , modèle spatial binaire ". Le livre dit aussi ceci:
La figure 5.8 montre le tracé de l'image avec des lignes de contour superposées pour la surface moyenne postérieure de la latente processus.
Cependant, il n'y a que 70 paires de points dans l'ensemble de données. Je suppose que, pour produire un tracé de contour, je dois estimeren 70 * 70 points. Donc, ma question est: comment puis-je produire cette surface médiane postérieure? Jusqu'à présent, j'ai des échantillons de distributions postérieures pour tous les paramètres impliqués (en utilisant PyMC) et je sais que je peux prédireà un nouveau point en utilisant la distribution prédictive postérieure. Cependant, je ne sais pas prédire les valeurs à un nouveau point . Peut-être que je me trompe et l'intrigue n'a pas été construite par prédiction mais par interpolation.
MISE À JOUR :
Tout d'abord, c'est la médiane de la distribution postérieure de à chaque endroit où il y a une propriété. Ceci est basé sur la trace MCMC pour.
Et voici l'interpolation (avec un tracé de contour) en utilisant une fonction de base radiale:
(Si vous êtes intéressé par le code, faites le moi savoir)
Comme vous pouvez le voir, il existe des différences importantes dans les parcelles. Quelques questions:
Comment savoir si ces différences s'expliquent par la procédure d'interpolation?
Peut-être, il existe des variations importantes dans la distribution postérieure de que j'ai calculé et celui montré dans le livre. Quelle variation est acceptable entre les simulations MCMC? Même mes propres paramètres changent un peu en fonction de l'échantillonnage que j'utilise (Metropolis, Metropolis Adaptive.)
Existe-t-il une procédure bayésienne pour prédire les points afin de générer un tracé de contour comme je l'ai fait en utilisant la fonction de base radiale?