En programmation dynamique, la méthode des coefficients indéterminés est parfois appelée «deviner et vérifier». J'ai périodiquement entendu qu'il y avait des suppositions canoniques à faire.
En particulier, j'ai vu
Le premier s'applique à l'utilitaire de journalisation tandis que le second est lié aux préférences de la CRRA. Quelles autres suppositions canoniques existent-elles et sont-elles généralement liées à la forme particulière de la fonction de retour?
Edit : Pour ceux qui ne connaissent pas les programmes dynamiques, ce que nous essayons de faire ici est de trouver des formes fermées pour les coefficients ( par exemple et ). Pour simplifier à l'excès, l'équation fonctionnelle prend généralement la forme générique , où g (\ cdot, \ cdot) décrit l'évolution de la variable d'état k . Pour l' essentiel, la valeur d'être dans un état k aujourd'hui dépend de la fonction de retour d'aujourd'hui F (k, u) et une valeur actualisée de ce que k va être demain \ beta V \ bigl (g (k, u) \ bigr) . u représente toutes les autres variables non étatiques qui, selon vous, influencent le retour.
Parfois, il est possible d'obtenir une solution de forme fermée pour (... note: nous ne résolvons pas seulement pour car le côté droit est une quantité maximisée). Cela implique généralement de connaître quelque chose sur la fonction de retour puis de faire une supposition sur la forme fonctionnelle de . Nous pouvons ensuite répéter pour voir si notre supposition donne une solution de forme fermée pour . En particulier, cela inclurait des formes fermées pour les coefficients dans la supposition (d'où la méthode des coefficients indéterminés).