Quelle est une bonne ressource pour se familiariser avec l'apprentissage par renforcement?


8

Je connais l'apprentissage supervisé et non supervisé. J'ai suivi le cours SaaS dispensé par Andrew Ng sur Coursera.org.

Je recherche quelque chose de similaire pour l'apprentissage par renforcement.

Pouvez-vous recommander quelque chose?

Réponses:


5

Aux bonnes réponses ici, j'ajouterais

Ceux-ci rayent à peine la surface de RL, mais ils devraient vous aider à démarrer.


3

Il y a une playlist Youtube (dans la chaîne DeepMind ) dont le titre est Introduction à l'apprentissage par renforcement , qui est un cours (de 10 leçons) sur l'apprentissage par renforcement par David Silver .

Une personne qui a suivi et terminé le cours a écrit (comme un commentaire Youtube):

Excellent cours. Bien rythmé, suffisamment d'exemples pour fournir une bonne intuition, et enseigné par quelqu'un qui dirige le domaine dans l'application du RL aux jeux.


3

Avant cela, demandez-vous si vous voulez vraiment en savoir plus sur «l'apprentissage par renforcement». Bien qu'il y ait beaucoup de battage médiatique sur l'apprentissage par renforcement, l'applicabilité dans le monde réel de l'apprentissage par renforcement est presque inexistante. La plupart des cours en ligne vous en apprennent très peu sur l'apprentissage automatique, il est donc préférable de l'approfondir plutôt que de passer à l'apprentissage par renforcement. L'apprentissage par renforcement est quelque peu différent de l'apprentissage des techniques d'apprentissage non supervisé / supervisé.

Cela dit, le moyen le plus rapide d'avoir une bonne compréhension de l'apprentissage par renforcement est le suivant:

  1. Lisez le billet de blog d'Andrej Karpathy «Pong from Pixels».

  2. Regardez les conférences Deep RL Bootcamp .

  3. Pour comprendre les mathématiques derrière ces techniques, reportez-vous à Sutton and Barto's Reinforcement Learning: An Introduction .

  4. Lisez les articles pertinents (jeu, etc.).

PS: Assurez-vous de bien maîtriser les bases des réseaux de neurones, car la plupart des articles actuels de RL impliquent d'utiliser les DNN d'une manière ou d'une autre comme approximateurs.


real-world applicability of reinforcement learning is almost non-existent AlphaGo a été formé à l'apprentissage par renforcement.
cantordust le

Merci, ce que j'aime dans l'apprentissage par renforcement, c'est qu'il peut s'améliorer simplement en faisant la tâche encore et encore. Aucune supervision n'est nécessaire. Seul le modèle doit décrire correctement le problème.
Martin S


@thecomplexitytheorist Oui, je suis au courant de ce message, et oui, il y a des difficultés associées à RL (comme toute autre méthode ML). Cependant, ces difficultés ne signifient pas que son applicabilité est nulle. Un autre exemple réussi (également mentionné dans la publication) est l' amélioration de 40% de l'efficacité de refroidissement des centres de données de Google - ce qui n'est guère négligeable.
cantordust le

1
@cantordust, vous devriez lire ce post complètement, il n'y a pas d'apprentissage "d'apprentissage par renforcement" impliqué dans "l'amélioration de l'efficacité de refroidissement", ils ont clairement mentionné qu'ils ont fait des prédictions basées sur les données de consommation d'énergie passées.
riemann77


En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.