Donc, je commence tout juste à apprendre comment un réseau de neurones peut fonctionner pour reconnaître les modèles et classer les entrées, et j'ai vu comment un réseau de neurones artificiel peut analyser les données d'image et catégoriser les images ( démo avec convnetjs ), et la clé là-bas consiste à sous-échantillonner l'image et chaque pixel stimule un neurone d'entrée dans le réseau.
Cependant, j'essaie de comprendre si cela peut être fait avec des entrées de chaîne? Le cas d'utilisation que j'ai est un "moteur de recommandation" pour les films qu'un utilisateur a regardés. Les films ont beaucoup de données de chaîne (titre, intrigue, tags), et je pourrais imaginer "sous-échantillonner" le texte en quelques mots clés qui décrivent ce film, mais même si j'analyse les cinq premiers mots qui décrivent ce film, je pensez que j'aurais besoin de neurones d'entrée pour chaque mot anglais afin de comparer un ensemble de films? Je pourrais limiter les neurones d'entrée uniquement aux mots utilisés dans l'ensemble, mais pourrait-il alors grandir / apprendre en ajoutant de nouveaux films (l'utilisateur regarde un nouveau film, avec de nouveaux mots)? La plupart des bibliothèques que j'ai vues ne permettent pas d'ajouter de nouveaux neurones après que le système a été formé?
Existe-t-il un moyen standard de mapper les données de chaîne / mot / caractère aux entrées dans un réseau neuronal? Ou un réseau neuronal n'est-il pas vraiment le bon outil pour analyser des données de chaîne comme celle-ci (quel est un meilleur outil pour le filtrage de motifs dans les données de chaîne)?