Je suis intéressé par (Deep) Reinforcement Learning (RL) . Avant de plonger dans ce domaine, dois-je suivre un cours de théorie des jeux (GT) ?
Quel est le lien entre GT et RL ?
Je suis intéressé par (Deep) Reinforcement Learning (RL) . Avant de plonger dans ce domaine, dois-je suivre un cours de théorie des jeux (GT) ?
Quel est le lien entre GT et RL ?
Réponses:
Dans l'apprentissage par renforcement (RL), il est courant d'imaginer un processus décisionnel de Markov sous-jacent (MDP). Ensuite, l'objectif de RL est d'apprendre une bonne politique pour le MDP, qui n'est souvent que partiellement spécifiée. Les MDP peuvent avoir différents objectifs tels que la récompense totale, moyenne ou actualisée, où la récompense actualisée est l'hypothèse la plus courante pour RL. Il existe des extensions bien étudiées des MDP aux paramètres à deux joueurs (c'est-à-dire le jeu); voir, par exemple,
Filar, Jerzy et Koos Vrieze. Processus décisionnels compétitifs de Markov . Springer Science & Business Media, 2012.
Il existe une théorie sous-jacente partagée par les MDP et leurs extensions aux jeux à deux joueurs (somme nulle), y compris, par exemple, le théorème de Banach à point fixe, l'itération de la valeur, l'optimalité de Bellman, l'itération des politiques / l'amélioration de la stratégie, etc. ces liens étroits entre les MDP (et donc RL) et ces types de jeux spécifiques:
La théorie des jeux est assez impliquée dans le contexte de l'apprentissage par renforcement multi-agents (MARL).
Jetez un œil aux jeux stochastiques ou lisez l'article Une analyse de la théorie des jeux stochastiques pour l'apprentissage par renforcement multi-agents .
Je ne verrais pas GT comme une condition préalable à RL. Cependant, il fournit une belle extension au cas multi-agents.
RL: Un seul agent est formé pour résoudre un problème de décision de Markov (MDPS). GT: Deux agents sont formés pour résoudre les jeux. Un apprentissage par renforcement multi-agents (MARL) peut être utilisé pour résoudre des jeux stochastiques.
Si vous êtes intéressé par l'application mono-agent de RL dans l'apprentissage en profondeur, vous n'avez pas besoin de suivre un cours GT. Pour deux ou plusieurs agents, vous devrez peut-être connaître les techniques de la théorie des jeux.