J'aimerais savoir si vous avez de bons tutoriels (rapides et simples) sur les modèles de sujet et LDA, enseignant intuitivement comment définir certains paramètres, ce qu'ils signifient et si possible, avec de vrais exemples.
J'aimerais savoir si vous avez de bons tutoriels (rapides et simples) sur les modèles de sujet et LDA, enseignant intuitivement comment définir certains paramètres, ce qu'ils signifient et si possible, avec de vrais exemples.
Réponses:
Si vous travaillez dans R, le didacticiel de Carson Sievert sur l'utilisation de LDA pour modéliser des sujets dans les critiques de films est un excellent point de départ:
http://cpsievert.github.io/LDAvis/reviews/reviews.html
Ce didacticiel utilise LDAvis, une visualisation interactive des distributions de sujets et de mots qui peut vraiment aider l'intuition.
De plus, bien qu'elles ne soient pas courtes, les conférences de David M. Blei sur les modèles de sujet sont une excellente ressource pour comprendre la signification des paramètres: http://videolectures.net/mlss09uk_blei_tm/
Je recommande fortement ce tutoriel: Premiers pas avec la modélisation de sujets et MALLET
Voici quelques liens supplémentaires pour vous aider à démarrer ...
Bons documents d'introduction (y compris des liens vers des documents de recherche): http://www.cs.princeton.edu/~blei/topicmodeling.html
Logiciel:
Encore plus ici sur le blog Estimations biaisées: Liste de lecture des modèles de sujets
Si vous cherchez quelque chose de simple pour commencer et facile à mettre en œuvre, je le recommanderais.
Le projet CLARIN-D a rassemblé de bons conseils sur les didacticiels de modélisation de sujets et de LDA sur le site de la collection de matériel pédagogique et d'apprentissage (TeLeMaCo) hébergé par le centre CLARIN de l' Université des Saarlandes .
Je suggère d'essayer le didacticiel Gensim de Machine Learning Plu . Il vous donnera un aperçu holistique de la PNL et de la LDA, y compris: comment pré-traiter vos données, effectuer l'ingénierie des fonctionnalités et appliquer la LDA.