J'ai une liste de mots, appartenant à différentes catégories auto-définies. Chaque catégorie a son propre motif (par exemple une a une longueur fixe avec des caractères spéciaux, une autre existe de caractères qui n'apparaissent que dans cette catégorie de "mot", ...).
Par exemple:
"ABC" -> type1
"ACC" -> type1
"a8 219" -> type2
"c 827" -> type2
"ASDF 123" -> type2
"123123" -> type3
...
Je recherche une technique d'apprentissage automatique pour apprendre ces modèles par elle-même, sur la base de données de formation. J'ai déjà essayé de définir certaines variables prédictives (par exemple la longueur des mots, le nombre de caractères spéciaux, ...) par moi-même, puis j'ai utilisé un Neural-Networks pour apprendre et prédire la catégorie. Mais ce n'est vraiment pas ce que je veux. Je veux une technique pour apprendre le motif de chaque catégorie par elle-même - même pour apprendre des motifs auxquels je n'ai jamais pensé.
Je donne donc l'algorithme des données d'apprentissage (consistant en des exemples de catégories de mots) et je veux qu'il apprenne des modèles pour chaque catégorie afin de prédire plus tard la catégorie à partir de mots similaires ou égaux.
Existe-t-il une manière de le faire de pointe?
Merci de votre aide