Questions marquées «reinforcement-learning»

Pour les questions liées à l'apprentissage contrôlé par un renforcement positif externe ou un signal de rétroaction négatif ou les deux, où l'apprentissage et l'utilisation de ce qui a été appris jusqu'à présent se produisent simultanément.



1
Quelques doutes concernant l'application de l'apprentissage par renforcement à des jeux comme les échecs
J'ai inventé un jeu de société aux échecs. J'ai construit un moteur pour qu'il puisse jouer de manière autonome. Le moteur est essentiellement un arbre de décision. Il est composé de: Une fonction de recherche qui à chaque nœud trouve tous les mouvements légaux possibles Une fonction d'évaluation qui attribue …

3
La recherche d'arbres de Monte-Carlo peut-elle être considérée comme un apprentissage automatique?
Au meilleur de ma compréhension, l'algorithme de recherche d'arbre Monte Carlo (MCTS) est une alternative à minimax pour rechercher un arbre de nœuds. Cela fonctionne en choisissant un coup (généralement, celui qui a le plus de chances d'être le meilleur), puis en effectuant une lecture aléatoire lors du coup pour …


1
Existe-t-il d'autres modèles d'apprentissage automatique en dehors de l'apprentissage par renforcement et de l'apprentissage Q pour jouer à des jeux vidéo?
L'univers d'OpenAI utilise des algorithmes RL et j'ai entendu parler de certains projets de formation de jeu utilisant l'apprentissage Q, mais y en a-t-il d'autres qui sont utilisés pour maîtriser / gagner des jeux? Les algorithmes génétiques peuvent-ils être utilisés pour gagner lors d'un match?

1
Apprendre à comprendre les états continus / espaces d'action MDP et apprentissage par renforcement
La plupart des introductions dans le domaine des MDP et de l'apprentissage par renforcement se concentrent exclusivement sur des domaines où l'espace et les variables d'action sont des entiers (et finis). De cette façon, nous sommes rapidement initiés à l'itération de la valeur, au Q-Learning, etc. Cependant, les applications les …
En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.