AlphaZero est-il un exemple d'AGI?

11

Extrait du document de recherche de DeepMind sur arxiv.org:

Dans cet article, nous appliquons un algorithme similaire mais entièrement générique, que nous appelons AlphaZero , aux jeux d'échecs et de shogi ainsi qu'à Go, sans aucune connaissance de domaine supplémentaire, à l'exception des règles du jeu, démontrant qu'un apprentissage de renforcement à usage général algorithme peut atteindre, tabula rasa, des performances surhumaines dans de nombreux domaines difficiles.

Est-ce à dire que AlphaZero est un exemple d'AGI (Artificial General Intelligence)?

— Thomas
source

11

Bonne question!

AlphaZero, bien qu'il s'agisse d'une étape importante, n'est certainement pas une AGI :)

AlphaGo, bien que fort au jeu de Go, est étroitement fort ("IA fort-étroit"), défini comme la force dans un seul problème ou type de problème (comme Go et d'autres jeux d'information parfaits sans chance.)

AGI, au minimum, doit être à peu près aussi fort que les humains dans tous les problèmes travaillés ou résolus par les humains.

L'AGI est souvent associée à la superintelligence , définie comme une intelligence qui dépasse les niveaux humains.

AGI n'implique pas nécessairement une super-intelligence, dans le sens où nous considérerions un androïde qui peut effectuer toutes les activités humaines avec la même capacité que l'homme comme une intelligence générale artificielle .

Mais techniquement, AlphaGo est une superintelligence étroite en ce sens qu'elle dépasse toutes les performances humaines en un seul problème.

— DukeZhou
source

Il n'y a pas de superintelligences étroites. Nous l'appelons l'IA faible :). Aucun humain ne peut trouver des compilations semi-optimales de Microsoft Word ou Excel de son vivant - alors que les machines modernes peuvent le faire en quelques heures.

— Quonux

@Quonux Dépend de la définition, je suppose. La définition de Bostrom de la superintelligence est à peu près analogue à l'intelligence générale artificielle, mais le terme lui-même, étymologiquement parlant, signifie simplement "intelligence supérieure", littéralement "au-dessus de + intelligence". Selon cette définition de base, "IA forte et étroite" pourrait être synonyme de "superintelligence étroite", dans la mesure où la définition originale de "fort" était AGI, donc après AlphaGo, les chercheurs ont commencé à utiliser le qualificatif "étroit".

— DukeZhou

@Quonux une partie de mon argument ici est que, avec l'avènement d'AlphaGo, le terme "faible" pour l'IA qui dépasse les capacités humaines dans une seule tâche semble avoir été remplacé par "l'IA forte et étroite".

— DukeZhou

2

Hypothèses qui peuvent être incorrectes

Il y a deux hypothèses identifiables dans le ton de l'article.

Tous les défis mentaux peuvent être réduits à un jeu avec des règles fixes.
Les machines mieux que les humains sont ce que les humains veulent ou ont vraiment besoin.

Il y a deux autres identifiables dans la question.

L'intelligence générale existe chez l'homme ¹
S'il existe chez l'homme, il est donc réalisable en informatique.

Les quatre peuvent être vrais, mais aucun des quatre n'est certain.

Productivité d'AlphaZero

Si notre échiquier est sur l'étagère de jeu dans notre placard, notre herbe est longue et notre tondeuse à gazon est cassée, AlphaZero, s'il est connecté à un robot humanoïde, n'aurait aucune règle de jeu codée pour la séquence de tâches.

Écouter la demande de son propriétaire,
Apprendre à maîtriser le robot fantoche,
Localiser et identifier tous nos outils et pièces détachées,
Fixer la tondeuse à gazon, et
Nous faire savoir que la tondeuse à gazon est prête à l'emploi.

Par conséquent, cela n'a aucune valeur particulière pour nous dans ce scénario. Pas très général.

Même si elle pouvait tondre la pelouse avec une tondeuse à gazon déjà fonctionnelle, elle serait utile, ce qui n'exige pas la capacité de gagner quoi que ce soit, mais plutôt la capacité d'obéir et de faire preuve de l'intelligence sous-humaine requise pour ne pas courir sur le parterre de fleurs.

Le fait que les gens intelligents de DeepMind aient choisi d'utiliser la tabula latine rasa plutôt que l' ardoise vierge est remarquable, mais pas aussi impressionnant que la construction d'un programme d'apprentissage qui peut bien apprendre à jouer à trois jeux avec seulement les règles encodées et le jeu réel en entrée.

Pour considérer ces programmes de jeu vraiment utiles dans un espace produit, on ne peut pas compter sur un intérêt soutenu pour acheter un logiciel qui bat chaque fois l'acheteur. Pour que les produits d'IA soient viables, les fonctionnalités d'apprentissage doivent être capables de ce que l'on appelle couramment le bon sens, ce qui nécessite une connaissance du domaine beaucoup plus large et flexible que les règles fixes d'un jeu. Nous pouvons deviner que la plupart des chercheurs qui ont franchi des étapes importantes dans la réussite de l'apprentissage du gameplay poussent dans cette direction. Eux aussi savent que leurs résultats de recherche doivent éventuellement être produits ou conduire à une offre SaaS achetable.

Ce qui serait impressionnant pour ceux qui ne sont pas sur le terrain, c'est si ces progrès peuvent être redirigés, dans l'espace du centre de données, pour générer des thérapies géniques curatives pour guérir le cancer ou l'herpès ou inverser le diabète ou la maladie d'Alzheimer. Ensuite, nous pourrions pardonner aux chercheurs de ne pas nous avoir fourni un téléchargement qui pourrait maîtriser les marionnettes d'un robot pour nettoyer notre salle de bain. Il ne ressort pas clairement du document qu'AlphaZero a suffisamment démontré qu'il présente «des performances surhumaines dans de nombreux domaines difficiles».

Ce qu'ils ont fait est toujours impressionnant et dans le sens où d'autres ont également progressé. Peu d'entre nous oseraient essayer d'inventer un jeu que ces programmes génériques d'apprentissage de jeu n'apprendraient pas rapidement et nous battraient en quelques instances de jeu.

Des avancées en perspective

Certes, en exécutant l'arithmétique, le tri du courrier et maintenant le jeu, les inventions de l'humanité étendent les capacités de l'homme nu, absent de ses outils. Ces progrès placent les systèmes informatiques fermement dans le domaine d'un outil. Une pelle rétrocaveuse est en quelque sorte surhumaine. Essayez de poser un kilomètre de tuyau sans un.

À l'inverse, l'humanité joue le rôle de fournisseur de soins de santé pour les ordinateurs. S'ils tombent malades ou échouent, nous sommes obligés d'expulser leurs virus et vers ou de remplacer leurs pièces défectueuses. Sinon, nos maisons et nos entreprises tombent dans le désarroi.

La technologie, comme en toutes choses, doit être mise en perspective.

Il serait prudent que les humains soient moins captivés par les jeux et se battent les uns les autres et davantage axés sur le comportement social collaboratif visant à résoudre les problèmes sociaux et économiques avec ses outils nouvellement inventés et à le faire d'une manière qui ne crée pas de nouveaux problèmes ni n'invite de nouvelles atrocités.

Notes de bas de page

Que ce qui a été décrit comme l'intelligence générale existe chez l'homme est contestable sur la base de preuves contraires. Beaucoup citeraient ces stratégies et ces tendances comme preuve des limites de l'intelligence humaine.

La dissuasion nucléaire comme stratégie de paix
Un manque total de modération dans la consommation de ressources énergétiques naturelles finies et critiques
Augmentation continue de la densité des schémas de toxicomanie dans le monde
Causant la sixième extinction de masse sur terre

— Douglas Daseeco
source

Merci pour l'édition, c'est mieux comme ça (pour moi du moins), avec plus de concentration sur les parties techniques de la réponse. Il y a peut-être une question différente à propos du degré de rationalité ou de performance d'une AGI. De même, à quelles normes de comportement individuel ou de groupe nous voulons imposer les humains - bien que ce ne serait pas pour ce site à moins que la question porte spécifiquement sur les comparaisons avec les intelligences artificielles.

— Neil Slater