Considérons l'équation différentielle suivante où est l'état et la variable de contrôle. La solution est donnée par où est l'état initial donné.
Considérons maintenant le programme suivant où \ rho> 0 indique la préférence temporelle, V (\ cdot) est la valeur et F (\ cdot) une fonction objective. Une application économique classique est le modèle Ramsey-Cass-Koopmans de croissance optimale. L'équation de Hamilton-Jacobi-Bellman est donnée par \ begin {align} \ rho V (x) = \ max_u [F (x, u) + V '(x) f (x, u)], \ quad \ forall t \ in [0, \ infty). \ end {align}
Dire que je l' ai résolu le HJB pour . Le contrôle optimal est alors donné par
L' article du wiki dit
... mais lorsqu'elle est résolue sur l'ensemble de l'espace d'état, l'équation HJB est une condition nécessaire et suffisante pour un optimum.
Dans Bertsekas (2005) Dynamic Programming and Optimal Control , Vol 1, 3e éd., Dans la proposition 3.2.1, il déclare que la résolution de est la fonction optimale de coût à parcourir et que le u ^ * associé est optimal. Cependant, il le déclare explicitement comme un théorème de suffisance.
En fait, je veux juste m'assurer que si j'ai résolu le HJB et récupéré l'état et les trajectoires de contrôle associés, je n'ai pas à me soucier de conditions d'optimalité supplémentaires.
Solution
Je tente
Je pense que j'ai pu dériver les conditions nécessaires du principe maximum par l'équation HJB elle-même.
Définissez l'hamiltonien
alors nous avons
qui est
Définissez une fonction arbitraire avec . Maintenant, corrigez
où est un paramètre. Branchez le terme dans l'hamiltonien maximisé qui donne
À nous avons la solution optimale. Différenciez donc pour obtenir une condition de premier ordre
Définissez maintenant la variable adjointe avec
Différencier au fil du temps
et notez que
Branchez tout dans la foc qui donne
C'est à peu près ça. La résolution du HJB est donc en effet nécessaire et suffisante (omise ici) pour l'optimalité. Quelqu'un devrait l'ajouter au wiki. Cela pourrait faire gagner du temps aux personnes qui pensent à de tels problèmes (ce ne sera pas beaucoup je pense).
Cependant, la condition de transversalité est manquante.
II Tentative
Définissez la fonction de gain
Notez que par définition de . Ajoutez le terme neutre à la fonction de gain
Intégration par des parties du terme droit sur les valeurs rhs
Remplacez ce terme
Définissez
ce qui donne
FOC pour maximum
Puisque et sont pas contraints, nous devons avoir