Questions marquées «deterministic-policy»

3
La politique optimale est-elle toujours stochastique si l'environnement est également stochastique?
La politique optimale est-elle toujours stochastique (c'est-à-dire une carte des états vers une distribution de probabilité sur les actions) si l'environnement est également stochastique? Intuitivement, si l'environnement est déterministe (c'est-à-dire si l'agent est dans un état sss et prend l'action aunea , alors l'état suivant s′s′s' est toujours le même, …
En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.