Intelligence artificielle reinforcement-learning

1

Qu'est-ce que l'opérateur Bellman dans l'apprentissage par renforcement?

En mathématiques, l' opérateur de mot peut faire référence à plusieurs concepts distincts mais liés. Un opérateur peut être défini comme une fonction entre deux espaces vectoriels, il peut être défini comme une fonction où le domaine et le domaine de codage sont identiques, ou il peut être défini comme …

10 reinforcement-learning terminology math

2

Pourquoi la ligne de base est-elle conditionnelle à l'état à un pas de temps non biaisé?

En robotique, la technique d'apprentissage par renforcement est utilisée pour trouver le modèle de contrôle d'un robot. Malheureusement, la plupart des méthodes de gradient politique sont biaisées statistiquement, ce qui pourrait mettre le robot dans une situation dangereuse, voir page 2 dans Jan Peters et Stefan Schaal: Renforcement de l'apprentissage …

9 reinforcement-learning

1

Quelques doutes concernant l'application de l'apprentissage par renforcement à des jeux comme les échecs

J'ai inventé un jeu de société aux échecs. J'ai construit un moteur pour qu'il puisse jouer de manière autonome. Le moteur est essentiellement un arbre de décision. Il est composé de: Une fonction de recherche qui à chaque nœud trouve tous les mouvements légaux possibles Une fonction d'évaluation qui attribue …

9 reinforcement-learning game-ai game-theory combinatorial-games negamax

3

La recherche d'arbres de Monte-Carlo peut-elle être considérée comme un apprentissage automatique?

Au meilleur de ma compréhension, l'algorithme de recherche d'arbre Monte Carlo (MCTS) est une alternative à minimax pour rechercher un arbre de nœuds. Cela fonctionne en choisissant un coup (généralement, celui qui a le plus de chances d'être le meilleur), puis en effectuant une lecture aléatoire lors du coup pour …

9 machine-learning reinforcement-learning game-ai monte-carlo-tree-search alphazero

5

Quelle est une bonne ressource pour se familiariser avec l'apprentissage par renforcement?

Je connais l'apprentissage supervisé et non supervisé. J'ai suivi le cours SaaS dispensé par Andrew Ng sur Coursera.org. Je recherche quelque chose de similaire pour l'apprentissage par renforcement. Pouvez-vous recommander quelque chose?

8 reinforcement-learning getting-started

1

Existe-t-il d'autres modèles d'apprentissage automatique en dehors de l'apprentissage par renforcement et de l'apprentissage Q pour jouer à des jeux vidéo?

L'univers d'OpenAI utilise des algorithmes RL et j'ai entendu parler de certains projets de formation de jeu utilisant l'apprentissage Q, mais y en a-t-il d'autres qui sont utilisés pour maîtriser / gagner des jeux? Les algorithmes génétiques peuvent-ils être utilisés pour gagner lors d'un match?

8 machine-learning reinforcement-learning genetic-algorithms game-theory

1

Apprendre à comprendre les états continus / espaces d'action MDP et apprentissage par renforcement

La plupart des introductions dans le domaine des MDP et de l'apprentissage par renforcement se concentrent exclusivement sur des domaines où l'espace et les variables d'action sont des entiers (et finis). De cette façon, nous sommes rapidement initiés à l'itération de la valeur, au Q-Learning, etc. Cependant, les applications les …

8 research reinforcement-learning control-problem

Questions marquées «reinforcement-learning»