Je me demande quels rôles la base de connaissances joue maintenant et jouera à l'avenir?


13

De nos jours, l'intelligence artificielle semble presque égale à l'apprentissage automatique, en particulier l'apprentissage en profondeur. Certains ont déclaré que le deep learning remplacera les experts humains, traditionnellement très importants pour l'ingénierie des fonctionnalités, dans ce domaine. On dit que deux percées ont soutenu l'essor du deep learning: d'une part, les neurosciences et la neuroplasticitéen particulier, nous dit que, comme le cerveau humain, qui est hautement plastique, les réseaux artificiels peuvent être utilisés pour modéliser presque toutes les fonctions; d'autre part, l'augmentation de la puissance de calcul, en particulier l'introduction du GPU et du FPGA, a stimulé l'intelligence algorithmique d'une manière magnifique et a rendu les modèles créés il y a des décennies immensément puissants et polyvalents. J'ajouterai que les mégadonnées (principalement des données étiquetées) accumulées au cours des dernières années sont également pertinentes.

De tels développements font entrer la vision par ordinateur (et la reconnaissance vocale) dans une nouvelle ère, mais dans le traitement du langage naturel et les systèmes experts, la situation ne semble pas avoir beaucoup changé.

Atteindre le bon sens pour les réseaux de neurones semble une tâche difficile, mais la plupart des phrases, des conversations et des textes courts contiennent des inférences qui doivent être tirées de la connaissance du monde de base. Ainsi, la représentation graphique des connaissances est d'une grande importance pour l'intelligence artificielle. Les réseaux de neurones peuvent être exploités dans la construction de bases de connaissances, mais il semble que les modèles de réseaux de neurones aient du mal à utiliser ces bases de connaissances construites.

Mes questions sont:

  • 1) Une base de connaissances (par exemple un "graphe de connaissances" inventé par Google) est-elle une branche prometteuse de l'IA? Si oui, de quelles manières KB peut-il permettre l'apprentissage automatique? Et comment peut-il aider à la génération du langage naturel?

  • 2) Pour la survie à une époque dominée par DL, où est l'orientation de la base de connaissances (ou du terme générique approche symbolique)? La base de connaissances dynamique z de Wolfram est -elle la nouvelle direction? Ou de nouvelles directions?

J'espère que je pose une question appropriée ici, car je n'ai pas pu marquer ma question comme "base de connaissances" ni "graphique de connaissances".

Suis-je en train de manquer quelque chose de fondamental ou quelques idées qui répondent à ces problèmes?


J'ai travaillé pour une grande entreprise informatique qui commercialisait autrefois des produits d'IA. Le problème avec une approche de réseau neuronal est qu'il n'y a pas de base de connaissances en soi. Donc, sans aucune sorte de règles, il est impossible pour un réseau de neurones d'expliquer «pourquoi». Former un réseau de neurones, puis formuler des règles qui dupliquent le réseau vous donnerait de telles réponses. Mais il n'y a aucune forme d'apprentissage automatique qui est maintenant capable d'un tel comportement.
MaxW

Ouais. Dans notre entreprise, le bot de chitchat soutenu uniquement par NN est très très stupide.
Lerner Zhang

Scientifiquement, on est parfaitement intimidé par son propre concept!
quintumnia

J'ai trouvé cet article: arxiv.org/abs/1702.01932
Lerner Zhang

@lerner merci pour la recommandation sur papier.
Seth Simba

Réponses:


4

Tout d'abord, je voudrais souligner les principales différences entre la base de connaissances et l'apprentissage automatique (en profondeur), en particulier lorsque l'accent est mis sur "AI" et non sur "Data Science":

  • Les NN sont comme une boîte noire; Même s'ils apprennent un ensemble de données et acquièrent le pouvoir de généralisation sur le domaine problématique, vous ne sauriez jamais comment ils fonctionnent. si vous examinez les détails du modèle développé, tout ce que vous voyez sont des chiffres, des poids, des connexions faibles et solides et des fonctions de transformation. l'étape "d'extraction des fonctionnalités" avant la phase de formation vous dit littéralement: "hé humain, assez avec votre monde compliqué, commençons les zéros et les uns". Dans le cas de DL, c'est pire! nous ne voyons même pas quelles sont les fonctionnalités sélectionnées et efficaces. Je ne suis pas un expert DL mais autant que je sache, la boîte noire de DL est plus sombre! Mais les bases de connaissances sont écrites dans un langage convivial. après une phase d'accumulation de connaissances, vous pouvez voir toutes les connexions entre les entités, et plus important encore, vous pouvez interpréter ces connexions. si vous coupez un fil dans une base de connaissances, votre modèle perdra juste un peu de sa puissance, et vous savez exactement ce qu'il perdra; par exemple, en déconnectant le nœud "Pluton" du nœud "système solaire", vous direz à votre modèle ce que deGrasse Tyson nous a dit. mais dans un modèle ML, cela pourrait le transformer en un pur inutile: que se passe-t-il si vous manipulez la connexion entre le neurone numéro 14 et 47 dans un modèle NN utilisé pour prédire quelles planètes appartiennent au système solaire?!

  • Les modèles ML sont simplement une inscription des données. Ils n'ont pas le pouvoir d'inférence, et ils ne vous en donnent pas. la base de connaissances est en revanche capable de déduire des connaissances antérieures comme vous l'avez indiqué dans votre question. Il est montré que les modèles DL qui ont été formés avec, par exemple, des données de classification d'image, pourraient également être appliqués à un problème de détection vocale. Mais cela ne signifie pas que les modèles DL pourraient appliquer ses connaissances antérieures dans le domaine des images au domaine des voix.

  • Vous avez besoin de kilos de données pour les algorithmes ML traditionnels et de tonnes de données pour ceux DL. mais une seule instance d'un ensemble de données créera une base de connaissances significative pour vous.

La PNL comprend deux principaux thèmes de recherche: la traduction automatique et la réponse aux questions. Pratiquement, il a été démontré que DL fonctionne de manière significative avec les problèmes de traduction automatique, mais agit comme un défi stupide en réponse aux questions, en particulier lorsque le domaine des sujets abordés dans la conversation homme-machine est large. Les bases de connaissances ne sont pas un bon choix pour la traduction automatique, mais sont probablement la clé d'un répondeur de questions noble. Étant donné que ce qui importe en traduction automatique n'est que la version traduite d'un texte (et je me fiche de savoir comment diable la machine a fait cela pour autant que ce soit vrai), mais pour répondre à un problème, je n'ai pas besoin d'un perroquet qui répète la même information que je lui ai donnée, mais une créature intelligente qui me donne "la pomme est mangeable" après lui avoir dit "la pomme est un fruit" et "


Tous les fruits sont comestibles, tant qu'ils ne sont pas métaphoriques, tels les fruits "de son travail". (Là encore, nous pourrions utiliser "dévorer" dans un sens métaphorique, comme quand on dévore une réponse de pile "savoureuse" et digère son contenu;)
DukeZhou
En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.