DeepMind déclare que son réseau Q profond (DQN) a été en mesure d'adapter continuellement son comportement tout en apprenant à jouer à 49 jeux Atari.
Après avoir appris tous les jeux avec le même réseau neuronal, l'agent était-il en mesure de les jouer tous à des niveaux `` surhumains '' simultanément (chaque fois qu'il était présenté au hasard avec l'un des jeux) ou ne pouvait-il être bon que pour un jeu à la fois parce que la commutation besoin d'un ré-apprentissage?