Exemples de problèmes cachés de modèles de Markov?


21

J'ai lu pas mal de modèles Markov cachés et j'ai pu en coder moi-même une version assez basique.

Mais il semble que j'apprenne de deux manières principales. L'un consiste à le lire et à l'implémenter dans du code (ce qui est fait) et le second est de comprendre comment il s'applique dans différentes situations (afin que je puisse mieux comprendre comment il se rapporte aux problèmes sur lesquels je pourrais travailler). Tous les exemples que j'ai faits jusqu'à présent impliquaient une sorte de prédiction d'ADN ou un lancer de pièces.

Je me demande s'il y a des ressources pour obtenir d'autres problèmes de Markov (la langue n'a pas d'importance mais j'espère aussi avec les réponses pour que je puisse savoir si j'ai raison ou tort)?


J'ai été avisé de traverser ce post de stackoverflow.com/questions/8661941/…
Lostsoul

Pourriez-vous être un peu plus précis en termes de "coder une version assez basique"? Avez-vous simulé à partir d'un processus de Markov caché, ou avez-vous codé les algorithmes Viterbi, forward ou Baum – Welch? (Les trois derniers seraient utilisés pour calculer la séquence d'états correspondante la plus probable, la probabilité de la séquence d'observations, ou les probabilités de départ, la fonction de transition et la fonction d'observation d'un modèle de Markov caché, respectivement.)
Wayne

Salut Wayne, j'ai essentiellement codé une version de cette page (la feuille de calcul) pour baum-welch: cs.jhu.edu/~jason/papers/#tnlp02 et essentiellement mis en œuvre le code de la page wiki de viterbi et suivi quelques didacticiels de base sur modèles de Markov cachés. Cela peut sembler stupide, mais je voulais voir d'autres types de problèmes que je pourrais essayer de résoudre afin que je puisse mieux comprendre de quoi les modèles Markov sont capables.
Lostsoul

1
Je ne veux pas passer des semaines à travailler dessus, mais par exemple, une étude de cas d'une personne utilisant des modèles markoviens sans lancer de pièces ou de prévisions météorologiques pourrait m'aider à comprendre la gamme de problèmes qu'elle peut mieux résoudre. Je cherche essentiellement à mieux comprendre en testant ce que les modèles Markov peuvent faire.
Lostsoul

Je pense que HMM a également des applications très importantes en finance (taux d'intérêt) et en économie (PIB).
Un vieil homme dans la mer.

Réponses:


8

J'ai utilisé HMM dans un scénario d'estimation du niveau de la demande / inventaire, où nous avions des marchandises achetées dans de nombreux magasins qui pouvaient ou non être en rupture de stock. La séquence des demandes quotidiennes pour ces articles contenait donc des zéros qui étaient des jours de demande zéro légitimes et également des zéros parce que le magasin était en rupture de stock. Vous penseriez que vous sauriez si le magasin était en rupture de stock par rapport au niveau de l'inventaire, mais les erreurs dans les registres d'inventaire se propagent et il n'est pas rare de trouver un magasin qui pense avoir un nombre positif d'articles en stock, mais en fait n'en a pas; l'état caché est, plus ou moins, si le magasin a réellement un inventaire, et le signal est le (demande quotidienne, niveau d'inventaire nominal). Aucune référence pour ce travail, cependant; nous n'étions pas censés publier les résultats pour des raisons de concurrence.

Edit: j'ajouterai que cela est particulièrement important car, avec une demande nulle, l'inventaire nominal du magasin ne diminue jamais et ne franchit pas un point de commande, ce qui déclenche une commande pour plus d'inventaire - par conséquent, un état zéro en raison de les enregistrements d'inventaire erronés ne sont pas corrigés pendant longtemps, jusqu'à ce que quelqu'un remarque que quelque chose ne va pas ou qu'un décompte de cycles se produit, ce qui peut prendre plusieurs mois après le début du problème.


Je crois que cela est connu comme un problème d'inflation zéro, et ils sont assez répandus. Vous avez besoin d'un modèle qui modélise les «zéros en excès» (lorsque la lecture est nulle parce qu'il ne peut y avoir de lecture, par opposition à une lecture légitime de zéro), puis d'un modèle de deuxième niveau qui modélise le reste. Par exemple, le nombre de clients dans une banque: parfois il n'y en a en fait pas, d'autres fois la banque est fermée donc il ne peut y en avoir. Ou la vitesse d'une voiture: parfois, elle est immobile avec un conducteur, parfois elle est garée. Etc.
Wayne

C'est vrai, du point de vue du signal de demande. L'autre partie du problème consiste à identifier l'état binaire "inventaire = 0 | enregistrement d'inventaire> 0", qui était en fait plus important pour le client.
jbowman

Je dois également souligner que les «zéros gonflés» ne sont pas iid au fil du temps - il existe des exécutions où tous les zéros sont «supplémentaires» et s'exécute là où aucun d'entre eux, d'où la nécessité pour le HMM avec l'état indiquant ce qui se passe à chaque observation.
jbowman

6

J'ai à peu près vécu la même chose et je n'ai pas trouvé grand-chose au-delà du temps. Les domaines qui me viennent à l'esprit incluent: la reconnaissance vocale, la détection des points de changement, le balisage de parties du discours dans le texte, l'alignement des éléments / textes qui se chevauchent et la reconnaissance de la langue des signes.

Un exemple que j'ai trouvé et que j'ai exploré était dans la section 8 de cette introduction , qui est l'une des références pour les HMM dans Wikipedia. (C'est en fait assez amusant: votre analyse découvre qu'il y a des voyelles et des consonnes.) Cela vous introduit également à travailler avec un corpus de texte, ce qui est utile.

(Si vous voulez jouer avec la génération avec des HMM, vous pouvez vous entraîner sur du texte Shakespeare puis générer un faux Shakespeare.)


3

La plupart des logiciels de reconnaissance vocale utilisent des modèles de Markov cachés. Vous pouvez expérimenter le traitement du langage naturel si vous souhaitez vous familiariser avec les applications HMM.

Voici une bonne source: Modèles graphiques probabilistes, par Koller et Friedman .


Merci, Carlos. Excellent livre, j'ai commencé à le lire il y a quelque temps mais je ne l'ai pas terminé. Je l'ai pour en apprendre davantage sur l'apprentissage automatique et la théorie des graphes, mais je vais revenir en arrière et chercher des questions liées aux modèles de Markov. Je vais également jeter un oeil au traitement du langage naturel (je n'ai jamais travaillé avec lui auparavant)
Lostsoul

3

Les modèles de Markov cachés sont très utiles pour surveiller le VIH. Le VIH pénètre dans la circulation sanguine et recherche les cellules de réponse immunitaire. Il s'assoit ensuite sur la teneur en protéines de la cellule et pénètre dans le cœur de la cellule et modifie la teneur en ADN de la cellule et commence la prolifération des virions jusqu'à ce qu'ils éclatent des cellules. Toutes ces étapes sont inobservables et dites latentes. Un exemple idéal pour la modélisation markovienne cachée.


2
Alors, de quelle manière exactement les modèles de Markov cachés aident-ils à surveiller le VIH? Les cliniciens utilisent-ils des HMM pour diagnostiquer le VIH? Les chercheurs les utilisent-ils pour mieux comprendre les mécanismes de la maladie ou créer des médicaments et des thérapies anti-VIH? Toute référence serait très utile.
Leo


0

Les modèles de Markov peuvent être utiles pour analyser les interactions d'un utilisateur avec un site Web - Par exemple sur Amazon.com où déterminer quelle série d'interactions conduit à un paiement pour donner des recommandations à l'avenir.

Un exemple amusant montrant l'utilisation du modèle de Markov est le suivant-

http://freakonometrics.blog.free.fr/index.php?post/2011/12/20/Basic-on-Markov-Chain-(for-parents )


1
Pas des modèles Markov CACHÉS ici cependant - hein?
B_Miner
En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.