Question: Avec une chaîne MCMC à 10 dimensions, disons que je suis prêt à vous remettre une matrice des tirages: 100 000 itérations (lignes) par 10 paramètres (colonnes), comment identifier au mieux les modes postérieurs? Je suis particulièrement préoccupé par plusieurs modes.
Contexte:Je me considère comme un statisticien averti en calcul, mais quand un collègue m'a posé cette question, j'avais honte de ne pas pouvoir trouver de réponse raisonnable. La principale préoccupation est que plusieurs modes peuvent apparaître, mais seulement si au moins huit des dix dimensions sont prises en compte. Ma première pensée serait d'utiliser une estimation de la densité du noyau, mais une recherche dans R n'a rien révélé de prometteur pour des problèmes de plus de trois dimensions. Le collègue a proposé une stratégie de binning ad hoc en dix dimensions et en recherchant un maximum, mais je crains que la bande passante ne conduise à des problèmes de rareté importants ou à un manque de résolution pour discerner plusieurs modes. Cela dit, j'accepterais volontiers des suggestions de suggestions de bande passante automatisée, des liens vers un estimateur de densité de 10 noyaux ou tout autre élément que vous connaissez.
Préoccupations:
Nous pensons que la distribution peut être assez biaisée; par conséquent, nous souhaitons identifier le ou les modes postérieurs et non les moyens postérieurs.
Nous craignons qu'il puisse exister plusieurs modes postérieurs.
Si possible, nous préférons une suggestion basée sur R. Mais tout algorithme fera l'affaire tant qu'il n'est pas incroyablement difficile à mettre en œuvre. Je suppose que je préférerais ne pas implémenter un estimateur de densité de noyau Nd avec une sélection automatisée de la bande passante à partir de zéro.