C'est une question assez générique: supposons que je veuille construire un modèle pour prédire la prochaine observation sur la base des observations précédentes ( peut être un paramètre à optimiser expérimentalement). Nous avons donc essentiellement une fenêtre coulissante d'entités d'entrée pour prédire la prochaine observation.
Je peux utiliser une approche du modèle de Markov caché, c'est-à-dire Baum-Welch pour estimer un modèle, puis Viterbi pour prédire un état actuel sur la base des dernières observations, puis prédire l'état suivant le plus probable sur la base de l'état actuel, puis prédire le prochain observation en utilisant l'état suivant le plus probable et les paramètres HMM (ou des variantes telles que trouver la distribution prédictive de l'observation suivante).
Ou je peux utiliser une approche beaucoup plus simple, en utilisant un modèle sans état (qui peut obtenir en entrée les observations précédentes ), par exemple SVM, régression linéaire, splines, arbres de régression, voisins les plus proches, etc. Ces modèles sont basés sur la minimisation de certaines erreurs de prédiction sur l'ensemble de formation et sont donc, conceptuellement, beaucoup plus simple qu'un modèle basé sur un état caché.
Quelqu'un peut-il partager son expérience face à un tel choix de modélisation? Que dirait-on en faveur du HMM et qu'en faveur d'une approche de régression? Intuitivement, on devrait prendre le modèle le plus simple possible pour éviter un sur-ajustement; cela parle en faveur d'une approche sans état ... Nous devons également considérer que les deux approches obtiennent les mêmes données d'entrée pour la formation (je pense que cela implique que si nous n'intégrons pas de connaissances de domaine supplémentaires dans la modélisation d'un modèle d'état caché, par exemple fixer certains états et probabilités de transition, il n'y a aucune raison pour laquelle un modèle d'état caché devrait mieux fonctionner). À la fin, on peut bien sûr jouer avec les deux approches et voir ce qui fonctionne mieux sur un ensemble de validation, mais certaines heuristiques basées sur l'expérience pratique pourraient également être utiles ...
Remarque: pour moi, il est important de prévoir uniquement certains événements; Je préfère un modèle qui prédit bien peu d' événements "intéressants / rares" , plutôt qu'un modèle qui prédit des événements "moyens / fréquents" mais les plus intéressants ne sont pas aussi bons. Cela a peut-être une incidence sur le choix de la modélisation. Merci.