Existe-t-il une méthode standard pour traiter le problème de changement d'étiquette dans l'estimation MCMC des modèles de mélange?

15

Le changement d'étiquette (c.-à-d. Que la distribution postérieure est invariante à la commutation des étiquettes des composants) est un problème problématique lors de l'utilisation de MCMC pour estimer les modèles de mélange.

Existe-t-il une méthodologie standard (comme largement acceptée) pour traiter le problème?
S'il n'y a pas d'approche standard, quels sont les avantages et les inconvénients des principales approches pour résoudre le problème de changement d'étiquette?

bayesian mcmc mixture

— whuber
source

J'envisageais de demander "Comment puis-je faire un modèle MCMC de la sortie sur lmer pour les modèles à pentes aléatoires?" mais je me demande si cette question est redondante avec celle-ci. Autrement dit, le «problème de changement d'étiquette» lors de l'utilisation de MCMC pour estimer des modèles de mélange est-il le même type de problème qui fait que pvals.fnc () dans languageR est capable d'intercepter MCMC des modèles mais pas des modèles avec des pentes? Sinon, faites-le moi savoir et je reviendrai pour poser ma question initiale.

— russellpierce

@drknexus Je ne connais pas R pour commenter votre question. Peut-être, vous devriez simplement poster votre question avec un commentaire que votre qn peut être aligné sur celui-ci.

14

Il y a une discussion agréable et raisonnablement récente de ce problème ici:

Christian P. Robert Multimodalité et changement d'étiquette: une discussion. Atelier sur les mélanges, ICMS 3 mars 2010.

Essentiellement, il existe plusieurs stratégies standard, et chacune a ses avantages et ses inconvénients. La chose la plus évidente à faire est de formuler l'a priori de manière à garantir qu'il n'y a qu'un seul mode postérieur (par exemple, commander les moyens des composants de mixuture), mais cela se révèle avoir un effet étrange sur le postérieur, et n'est donc généralement pas utilisé. La prochaine étape consiste à ignorer le problème lors de l'échantillonnage, puis à post-traiter la sortie pour ré-étiqueter les composants afin de conserver les étiquettes cohérentes. Ceci est facile à mettre en œuvre et semble fonctionner correctement. Les approches les plus sophistiquées ré-étiquettent en ligne, soit en conservant un seul mode, soit en permutant délibérément au hasard les étiquettes pour assurer le mélange sur plusieurs modes. J'aime bien cette dernière approche, mais cela laisse toujours le problème de résumer la sortie de manière significative. Cependant, je vois cela comme un problème distinct.

— Darren Wilkinson
source

1

semble que le lien soit rompu

— Edgar Santos

J'ai corrigé le lien en le trouvant sur web.archive.org et en fournissant un lien vers une copie de ces diapositives hébergées par l'auteur sur SlideShare.

— Tim

9

Gilles Celeux a également travaillé sur le problème du changement d'étiquette, par exemple

G. Celeux, inférence bayésienne pour Mixture: le problème de changement d'étiquette. Actes Compstat 98 , pp. 227-232, Physica-Verlag (1998).

En complément de la bonne réponse de @ darrenjw, voici deux articles en ligne qui ont passé en revue les stratégies alternatives:

— chl
source