J'ai récemment lu quatre livres dans ce domaine:
Feldman, R. et James Sanger, J. (2006). The Text Mining Handbook: Advanced Approaches in Analyzing Unstructured Data. La presse de l'Universite de Cambridge.
Celui-ci se concentre sur des exemples pratiques, des logiciels et l'exploration de texte appliquée. Il donne plusieurs exemples d'utilisation pratique de l'exploration de texte. Cela pourrait être intéressant si vous souhaitez en savoir plus sur les applications commerciales des outils d'exploration de texte.
Srivastava, AN et Sahami, M. (2009). Exploration de texte: classification, regroupement et applications. Chapman & Hall / CRC.
Il s'agit d'une série de documents de recherche qui sont utilisés comme exemples d'utilisation de différents outils d'exploration de texte. Il est plutôt trop ciblé que pour le test d'introduction.
Weiss, SM, Indurkhya, N., Zhang, T. et Damerau, F. (2005). Exploration de texte: méthodes prédictives pour l'analyse d'informations non structurées.
Springer.
Texte très introductif qui décrit quelques problèmes généraux.
Manning, C. (1999). Fondements du traitement statistique du langage naturel. MIT Appuyez sur.
C'est le meilleur livre que j'ai déjà lu sur ce sujet. Il est bien écrit, clair, va plus loin dans la théorie mais de manière pratique. Commence par une introduction générale, mais passe en revue certaines des méthodes et algorithmes les plus couramment utilisés. Si vous ne deviez choisir qu'un seul livre, je recommanderais celui-ci.
Vous pouvez également trouver facilement plusieurs livres sur le traitement du langage naturel et l'exploration de texte qui se concentrent sur l'utilisation de R ( bibliothèque tm ) ou Python ( bibliothèque nltk ).