Pour répondre à votre question: vous pouvez utiliser la densité de lissage. Mais ce n'est pas obligatoire. La réponse de Jarle Tufto a la décomposition que vous utilisez. Mais il y en a d'autres.
Utilisation des Kalman Recursions
Ici, vous évaluez la probabilité comme
f(y1,…,yn)=f(y1)∏i=2nf(yi|y1,…,yi−1).
Cependant, les moyennes et les variances ne définissent pas toujours complètement les distributions de probabilité en général. Voici la décomposition que vous utilisez pour passer des distributions de filtrage aux vraisemblances conditionnelles :f ( y i | y 1 , … , y i - 1 )f(xi−1|y1,…,yi−1)f(yi|y1,…,yi−1)
f(yi|y1,…,yi−1)=∬f(yi|xi)f(xi|xi−1)f(xi−1|y1,…,yi−1)dxidxi−1.(1)
Ici est la densité de transition d'état ... partie du modèle, et est la densité d'observation ... partie du modèle à nouveau. Dans votre question, vous les écrivez comme et respectivement. C'est la même chose.f(xi|xi−1)f(yi|xi)xt+1=Fxt+vt+1yt=Hxt+Azt+wt
Lorsque vous obtenez la distribution de prédiction d'état à un pas en avant, c'est le calcul . Lorsque vous réintégrez, vous obtenez (1) complètement. Vous écrivez cette densité complètement dans votre question, et c'est la même chose.∫f(xi|xi−1)f(xi−1|y1,…,yi−1)dxi−1
Ici, vous n'utilisez que des décompositions de distributions de probabilité et des hypothèses sur le modèle. Ce calcul de vraisemblance est un calcul exact. Il n'y a rien de discrétionnaire que vous puissiez utiliser pour faire mieux ou pire.
Utilisation de l'algorithme EM
À ma connaissance, il n'y a pas d'autre moyen d'évaluer directement la probabilité dans ce type de modèle d'espace d'état. Cependant, vous pouvez toujours faire une estimation du maximum de probabilité en évaluant une fonction différente: vous pouvez utiliser l'algorithme EM. Dans l'étape Attente (E-Step), vous devez calculer
Ici
∫f(x1,…,xn|y1,…yn)logf(y1,…,yn,x1,…,xn)dx1:n=Esmooth[logf(y1,…,yn,x1,…,xn)].
f(y1,…,yn,x1,…,xn)est la probabilité de "données complètes", et vous prenez l'attente du logarithme de cela en ce qui concerne la densité de lissage des joints. Ce qui se produit souvent, c'est que, parce que vous prenez le journal de cette probabilité de données complète, les termes sont divisés en sommes, et en raison de la linéarité de l'opérateur d'attente, vous prenez des attentes en ce qui concerne les distributions de lissage marginal (celles vous mentionnez dans votre question).
Autres choses
J'ai lu par endroits que l'EM est un moyen "plus stable" de maximiser la probabilité, mais je n'ai jamais vraiment vu ce point bien argumenté, ni vu ce mot "stable" défini du tout, mais aussi je n'ai pas 't vraiment examiné cela plus loin. Aucun de ces algorithmes ne contourne l'épreuve des maxima locaux / globaux. Personnellement, j'ai tendance à utiliser le Kalman plus souvent juste par habitude.
Il est vrai que les estimations lissées de l'état ont généralement une variance plus petite que le filtrage, donc je suppose que vous avez raison d'avoir une certaine intuition à ce sujet, mais vous n'utilisez pas vraiment les états. La probabilité que vous essayez de maximiser n'est pas fonction des États.