Je recherche actuellement un aperçu des algorithmes d'apprentissage par renforcement et peut-être une classification de ceux-ci. Mais à côté de Sarsa et Q-Learning + Deep Q-Learning, je ne trouve pas vraiment d'algorithmes populaires.
Wikipedia me donne un aperçu des différentes méthodes générales d'apprentissage par renforcement, mais il n'y a aucune référence à différents algorithmes mettant en œuvre ces méthodes.
Mais je suis peut-être en train de confondre les approches générales et les algorithmes et, fondamentalement, il n'y a pas de véritable classification dans ce domaine, comme dans d'autres domaines de l'apprentissage automatique. Quelqu'un peut-il peut-être me donner une courte introduction ou seulement une référence où je pourrais commencer à lire dans les différentes approches, les différences entre elles et les exemples d'algorithmes qui mettent en œuvre ces approches?