Vous devez d'abord vous familiariser avec les modèles d'espace d'état plus faciles à coder et le filtrage de forme fermée (par exemple, les filtres kalman, les modèles markov cachés). Matthew Gunn a raison de dire que vous pouvez aller étonnamment loin avec des concepts simples, mais à mon humble avis, vous devriez en faire un objectif intermédiaire car:
1.) Relativement parlant, il y a plus de pièces mobiles dans les modèles d'espace d'état. Lorsque vous apprenez des SSM ou des modèles de Markov cachés, il y a beaucoup de notation. Cela signifie qu'il y a plus de choses à garder dans votre mémoire de travail pendant que vous jouez avec la vérification des choses. Personnellement, lorsque j'ai d'abord découvert les filtres de Kalman et les SSM linéaires gaussiens, je pensais essentiellement "eh, ce ne sont que des propriétés de vecteurs normaux multivariés ... Je n'ai qu'à garder une trace de quelle matrice est laquelle". De plus, si vous passez d'un livre à l'autre, ils changent souvent de notation.
Après, j'y ai pensé comme "eh, ce n'est que la règle de Bayes à chaque instant." Une fois que vous y pensez de cette façon, vous comprenez pourquoi les familles conjuguées sont agréables, comme dans le cas du filtre de Kalman. Lorsque vous codez un modèle de Markov caché, avec son espace d'état discret, vous voyez pourquoi vous n'avez pas à calculer de probabilité, et le filtrage / lissage est facile. (Je pense que je dévie du jargon hmm conventionnel ici.)
2.) Se couper les dents en codant beaucoup de ces éléments vous fera réaliser à quel point la définition d'un modèle d'espace d'état est générale. Très bientôt, vous noterez les modèles que vous souhaitez utiliser et vous verrez en même temps pourquoi vous ne le pouvez pas. D'abord, vous verrez finalement que vous ne pouvez tout simplement pas l'écrire sous l'une de ces deux formes auxquelles vous êtes habitué. Lorsque vous y réfléchissez un peu plus, vous écrivez la règle de Bayes et voyez que le problème est votre incapacité à calculer une sorte de probabilité pour les données.
Vous finirez donc par ne pas pouvoir calculer ces distributions postérieures (lissage ou filtrage des distributions des états). Pour prendre soin de cela, il existe de nombreux éléments de filtrage approximatifs. Le filtrage des particules n'est que l'un d'entre eux. Le principal enseignement du filtrage des particules: vous simulez à partir de ces distributions car vous ne pouvez pas les calculer.
Comment simulez-vous? La plupart des algorithmes ne sont qu'une variante de l'échantillonnage d'importance. Mais cela se complique aussi ici. Je recommande cet article de didacticiel de Doucet et Johansen ( http://www.cs.ubc.ca/~arnaud/doucet_johansen_tutorialPF.pdf ). Si vous comprenez comment fonctionne le filtrage des formulaires fermés, ils introduisent l'idée générale de l'échantillonnage d'importance, puis l'idée générale de la méthode de Monte Carlo, puis vous montrent comment utiliser ces deux choses pour commencer avec un bel exemple de série chronologique financière. À mon humble avis, c'est le meilleur tutoriel sur le filtrage des particules que j'ai rencontré.
En plus d'ajouter deux nouvelles idées au mélange (échantillonnage d'importance et méthode Monte Carlo), il y a maintenant plus de notation. Certaines densités que vous échantillonnez à partir de maintenant; certains que vous évaluez, et lorsque vous les évaluez, vous évaluez des échantillons. Le résultat, après avoir tout codé, sont des échantillons pondérés, considérés comme des particules. Ils changent après chaque nouvelle observation. Il serait très difficile de saisir tout cela à la fois. Je pense que c'est un processus.
Je m'excuse si je trouve cela cryptique ou ondulé. Ce n'est que la chronologie de ma familiarité personnelle avec le sujet. Le message de Matthew Gunn répond probablement plus directement à votre question. J'ai juste pensé que je jetterais cette réponse.