Livres ou articles recommandés comme introduction à l'analyse de cluster?

12

Je travaille sur un petit corpus de texte (200M), que je veux explorer avec une analyse de cluster. Quels livres ou articles sur ce sujet recommanderiez-vous?

machine-learning references clustering

— miku
source

6

Il peut être utile de consulter les livres de MW Berry:

Enquête sur l'exploration de textes I: regroupement, classification et récupération (2003)
Enquête sur l'exploration de textes II: regroupement, classification et récupération (2008)

Ils consistent en une série de documents appliqués et de synthèse. La dernière semble être disponible en PDF à l'adresse suivante: http://bit.ly/deNeiy .

Voici quelques liens liés à l'autorité de certification appliquée à l'exploration de texte:

Vous pouvez également consulter l' analyse sémantique latente , mais voyez ma réponse ici: Travailler à travers un problème de clustering .

— chl
source

5

Recherche de groupes dans les données. Une introduction à l'analyse des grappes des professeurs Leonard Kaufman et Peter J. Rousseeuw.

Je lis le livre et je le trouve très utile car:

Comme indiqué par les auteurs dans la préface:

Notre but était d'écrire un livre appliqué pour l'utilisateur général. Nous voulions mettre l'analyse des grappes à la disposition de personnes n'ayant pas nécessairement une solide formation mathématique ou statistique.

Il fournit un contenu théorique pour comprendre les fonctions disponibles dans le Rpackage Cluster .
Les chapitres peuvent être lus individuellement selon la méthode de cluster d'intérêt.
_{l'exception est le chapitre 3, qui est construit sur le chapitre 2}

Les chapitres du livre sont:

introduction
Partitionnement autour de Medoids (programme PAM).
Clustering de grandes applications (programme CLARA).
Analyse floue (programme FUNNY).
Imbrication agglomérative (programme AGNES).
Analyse de division (programme DIANA).
Analyse monothétique (programme MONA).

Les références:

Kaufman, L. et Rousseeuw, PJ (2005). Recherche de groupes dans les données. Une introduction à l'analyse des clusters (p. 342). John Wiley & Sons Inc.

Maechler, M. (2013). Analyse en grappes Extended Rousseeuw et al. CRAN.

— Andre Silva
source

Ce livre offre en effet un bel aperçu du domaine. Il se concentre sur quelques algorithmes / méthodes (par exemple la silhouette bien connue, qui se trouve avoir été conçue par l'un des auteurs du livre) et les couvre en détail. Il est également livré avec du code, mais de style 1990. FYI: table des matières complète .

— Franck Dernoncourt

4

Ce chapitre d' introduction à l'exploration de données est disponible en ligne et donne un bon aperçu.

— Shane
source

Et voici le lien vers la 2ème édition (2018).

— Richard Hardy

2

Analyse de cluster par Brian S. Everitt est un traitement appliqué d'une belle longueur de l'analyse de cluster.

— Brett
source

1

Pas spécifiquement sur le text-mining, mais j'ai bien aimé "Exploratory Data Analysis with MATLAB" de Martinez et Martinez.

— Nico
source

1

Un autre livre approfondi mérite d'être examiné: Handbook of Cluster Analysis par Hennig et al. (2015)

— tbeck
source