Sans tenir compte des contraintes de calcul possibles, existe-t-il des applications générales où la lemmatisation serait une étape contre-productive lors de l'analyse des données textuelles?
Par exemple, la lemmatisation serait-elle quelque chose qui ne se fait pas lors de la construction d'un modèle contextuel?
Pour référence, la lemmatisation par dictinory.com est l'acte de regrouper les formes fléchies de (un mot) pour l'analyse en un seul élément.
Par exemple, le mot «cuisinier» est le lemme du mot «cuisiner». L'acte de lemmatisation consiste, par exemple, à remplacer le mot cuisine par cuisinier après avoir symbolisé vos données de texte. De plus, le mot «pire» a «mauvais» comme lemme et, comme l'exemple précédent, remplacer le mot «pire» par «mauvais» est l'action de la lemmatisation.