État d'AbuShawar et Atwell:
Un chatbot est un agent conversationnel qui interagit tour à tour avec les utilisateurs en utilisant le langage naturel. Différents chatbots ou systèmes de dialogue homme-ordinateur ont été développés en utilisant la communication orale ou textuelle et ont été appliqués dans différents domaines tels que: la recherche linguistique, l'éducation aux langues, le service client, l'aide sur le site Web et pour le plaisir.
Leurs articles et autres articles transmettent certaines des nombreuses approches contemporaines de la formation des chatbots à ce jour.
Extraction automatique des données de formation Chatbot à partir de corpus de dialogue naturel , Bayan AbuShawar, Eric Atwell, 2016
Cependant, la plupart des chatbots sont limités à la connaissance qui est manuellement dans leurs fichiers et à une langue naturelle spécifique qui est écrite ou parlée. Cet article présente le programme que nous avons développé pour convertir un texte lisible par machine (corpus) en un format de chatbot spécifique, qui est ensuite utilisé pour recycler un chatbot et générer un chat plus proche du langage humain. Différents corpus ont été utilisés: des corpus de dialogue tels que le British National Corpus of English (BNC); le livre saint de l'Islam Coran qui est un corpus de monologues où le verset et le vers suivant sont des tours; et la FAQ où les questions et réponses sont deux tours. L'objectif principal de ce processus d'automatisation est la capacité de générer différents prototypes de chatbot qui parlaient différentes langues en fonction du corpus.
Sélection de l'action du chatbot contextuelle-incertaine via l'apprentissage par renforcement auxiliaire paramétré , Chuandong Yin, Rui Zhang, Jianzhong Qi, Yu Sun et Tenglun Tan, 2018
Nous proposons un chatbot sensible au contexte et un modèle d'apprentissage par renforcement (RL) pour former le chatbot. Le modèle proposé est nommé Criticalized Auxiliary Asynchronous Advantage Actor Critic (PA4C). Nous utilisons un simulateur d'utilisateur pour simuler l'incertitude de la confiance des utilisateurs dans un contexte de conversation. Par rapport aux approches naïves basées sur des règles, notre chatbot formé via le modèle PA4C évite la sélection d'actions artisanales et est plus robuste à la variance des énoncés des utilisateurs. Le modèle PA4C optimise les modèles RL conventionnels avec paramétrage d'action et tâches auxiliaires pour la formation de chatbot, qui répondent aux problèmes d'un grand espace d'action et d'états à récompense nulle. Nous évaluons le modèle PA4C au cours de la formation d'un chatbot pour les tâches de création d'événements de calendrier.
Formation sur le système d'apprentissage supervisé utilisant l'interaction Chatbot , publication de demande de brevet des États-Unis 0034828 A1, International Business Machines Corporation, Armonk, NY, États-Unis, 2019
Procédé mis en œuvre par ordinateur comprenant la réception et l'analyse d'un point de données pour déterminer les paramètres du point de données, la génération d'un ticket d'alerte sur la base de l'analyse du point de données, la communication, via un chatbot, au moins certaines informations contenues dans le ticket d'alerte à un ou plusieurs utilisateurs, et en catégorisant, via le chatbot, le point de données qui a abouti au ticket d'alerte en fonction du comportement d'un appareil qui a généré le point de données. Jonathan A. Cagadas, Alexander D. Lewitt, Simon D. Mikulcik, Karan Shukla, Leigh A. Williamson
Formation en deux étapes et codage-décodage mixte pour la mise en œuvre d'un chatbot génératif avec un petit corpus de dialogue , Jintae Kim, Hyeon-Gu Lee, Harksoo Kim, Yeonsoo Lee, Young-Gil Kim, 2016
Les modèles de chatbot génératifs basés sur des réseaux séquence à séquence peuvent générer des interactions de conversation naturelles si un énorme corpus de dialogue est utilisé comme données de formation. Cependant, à l'exception de quelques langues comme l'anglais et le chinois, il reste difficile de rassembler un grand corpus de dialogue. Pour résoudre ce problème, nous proposons un modèle de chatbot utilisant un mélange de mots et de syllabes comme unités de codage-décodage. De plus, nous proposons une méthode de formation en deux étapes, impliquant une pré-formation utilisant un grand corpus sans dialogue et une nouvelle formation utilisant un petit corpus de dialogue. Dans nos expériences, il a été démontré que les unités de mélange aident à réduire les problèmes de non-vocabulaire (OOV). De plus, la méthode de formation en deux étapes a été efficace pour réduire les erreurs grammaticales et sémantiques dans les réponses lorsque le chatbot a été formé à l'aide d'un petit corpus de dialogue (533,
Sélection de données inspirées de la submodularité pour la formation de chatbot orientée vers les objectifs basée sur les intégrations de phrases , Mladen Dimovski, Claudiu Musat, Vladimir Ilievski, Andreea Hossmann, Michael Baeriswyl, 2018
Les systèmes de compréhension du langage parlé (SLU), tels que les chatbots orientés vers les objectifs ou les assistants personnels, s'appuient sur un module initial de compréhension du langage naturel (NLU) pour déterminer l'intention et extraire les informations pertinentes des requêtes des utilisateurs qu'ils prennent en entrée. Les systèmes SLU aident généralement les utilisateurs à résoudre des problèmes dans des domaines relativement étroits et nécessitent une grande quantité de données de formation dans le domaine. Cela conduit à d'importants problèmes de disponibilité des données qui entravent le développement de systèmes performants. Pour atténuer ce problème, nous proposons une technique de sélection de données dans le régime de données faibles qui nous permet de nous entraîner avec moins de phrases étiquetées, donc des coûts d'étiquetage plus faibles. Nous proposons une fonction de classement de données inspirée de la sous-modularité, le gain marginal ratio-pénalité, pour sélectionner les points de données à étiqueter en fonction uniquement des informations extraites de l'espace d'intégration textuelle. Nous montrons que les distances dans l'espace d'intégration sont une source viable d'informations pouvant être utilisées pour la sélection des données. Notre méthode surpasse deux techniques d'apprentissage actif connues et permet une formation rentable de l'unité NLU. De plus, la technique de sélection que nous proposons n'a pas besoin d'être recyclée entre les étapes de sélection, ce qui la rend également efficace en temps.