Je dois développer un moteur de recherche basé sur la fréquence des termes du document. J'ai un jeu de données de 17 000 documents PDF. Existe-t-il un moyen de compter tous les mots et leurs occurrences dans un document particulier?
Exemple: Souhaitez-vous avoir des réponses?
Sortie: Aurait = 1 vous = 1 comme = 1 à = 2 réponses = 1