Il est aussi facile de suivre le mouvement en affirmant que le jeu d'Alpha-Zero est «plus» humain que les programmes d'échecs informatiques précédents, mais il est également essentiel de dire que le jeu d'Alpha-Zero est totalement «extraterrestre». Il n'est pas clair que le jeu d'Alpha-zéro soit "plus humain", en particulier compte tenu de notre tendance humaine à l'anthropomorphisme.
Les échecs en tant que lutte de l'esprit (humain)
Mais aux échecs cette tendance est-elle vraie? Un jour, Magnus Carlsen a expliqué à quel point les ordinateurs «traditionnels» manquaient de créativité humaine en disant:
"Les échecs sont tout au sujet de la lutte entre les esprits humains. C'est ce qui le rend passionnant. Les échecs informatiques sont mécaniques, sèches et fades. Les mouvements sont très forts, bien sûr, mais il n'y a pas de style. Si vous essayez de jouer contre un ordinateur d'échecs , vous perdrez non seulement avec une très grande certitude, mais vous vous ennuyerez également.
Magnus Carlsen n'a pas vu de preuves de styles de jeu humains dans les ordinateurs d'échecs traditionnels. Voyons donc si la récente réalisation d’Alpha-Zero a défait cette perspective et nous a amenés vers quelque chose de plus évocateur de nous-mêmes.
Si vous entendez par «être humain», vous entendez jouer «un comportement présentant plus de chances de faire appel à notre sens de l'anthropomorphisme», le style d'Alpha-zéro vous semble-t-il plus humain? Comment pouvons-nous vraiment tester cette myope subjective que les hommes aiment projeter sur des choses non humaines? Permet de poser la question suivante: l'algorithme "sélectionne-t-il mieux" ou présente-t-il "un choix créatif plus humain" dans son style de jeu?
Les créateurs de l'algorithme indiquent que, contrairement à Stockfish qui utilise un algorithme de recherche Alpha-Beta, Alpha-Zero utilise un algorithme de recherche dans l'arbre de Monte-Carlo (MCTS) qui accepte en entrée un paramètre pondéré θ construit à partir de résultats précédents ~ Page 3. Maîtriser les échecs et Shogi par Self-Play avec un algorithme d’apprentissage par renforcement général ).
Donc, l'algorithme ne montre aucun choix. Il s’engage en fait dans une recherche aléatoire mais probabiliste de Monty-carlo, dans laquelle les voies de recherche possibles sont de plus en plus préjudiciables aux résultats précédents. Alpha-zero a-t-il choisi d'optimiser son style de jeu de cette manière ou est-ce le choix de ses programmeurs?
Alpha-Zero a-t-il toujours tous les mouvements possibles à considérer ou certains mouvements sont-ils préjudiciables à l'algorithme de manière à imiter une expérience pouvant être interprétée par l'homme de manière anthropomorphique?
Au départ, tous les mouvements étaient disponibles, donc son style était totalement aléatoire. Cependant, comme sa recherche est de plus en plus contrainte de manière optimale par le succès ou l’échec précédents, son style évolue en réalité vers le mode que les programmeurs lui ont réservé. Est-ce que c'est «plus humain»? Comparez cela à Magnus Carlesen qui choisira parfois des mouvements moins optimaux car plus créatifs :
Magnus Carlsen: «J'aime créer quelque chose d'unique»
Les échecs en tant que lutte de l'esprit (étranger)
Les humains peuvent choisir les critères qui déterminent leur propre style de jeu (par exemple, j'ai souvent choisi l'impulsion et l'erreur dans mon propre style). Beaucoup voient le jeu d'Alpha-zéro aux deux échecs et vont résolument comme des extraterrestres . Nick Hynes, étudiant diplômé du Laboratoire d'informatique et d'intelligence artificielle du MIT (CSAIL), observe:
«Ce que nous voyons ici est un modèle exempt de préjugés et de présupposés humains: il peut apprendre que tout ce qu’il détermine est optimal, ce qui peut même être plus nuancé que nos propres conceptions de la même chose. C'est comme une civilisation extraterrestre inventant ses propres mathématiques, ce qui lui permet de faire des choses comme le voyage dans le temps ... "
De même, le directeur général Peter Heine Nielsen a déclaré à Chess.com :
"Après avoir lu le journal, mais surtout vu les jeux, je me suis dit, eh bien, je me suis toujours demandé comment ce serait si une espèce supérieure atterrit sur terre et nous montre comment ils jouent aux échecs. Je me sens maintenant, je le sais."
Il semble que la plupart des gens réagissent au style de jeu émergent d’Alpha-zéro en tant que «jeu extraterrestre» et non en tant que «plus humain».
Par conséquent, il y a une raison d'être en désaccord avec les réponses ci-dessus qui disent «oui».