J'envisage d'utiliser des bibliothèques Python pour mes expériences d'apprentissage automatique. Jusqu'ici, je m'appuyais sur WEKA, mais dans l'ensemble, j'étais plutôt mécontent. C’est principalement parce que j’ai trouvé que WEKA n’était pas très bien pris en charge (très peu d’exemples, la documentation est rare et le soutien de la communauté n’est pas souhaitable, selon mon expérience), et je me suis retrouvé dans des situations délicates sans aucune aide. Une autre raison pour laquelle je pense à cette initiative est que j'aime vraiment Python (je suis nouveau dans Python) et que je ne veux pas revenir au codage en Java.
Donc ma question est, quels sont les plus
- complet
- évolutif (fonctionnalités 100k, exemples 10k) et
- bibliothèques bien supportées pour faire ML en Python?
Je suis particulièrement intéressé par la classification de texte. Par conséquent, j'aimerais utiliser une bibliothèque qui contient une bonne collection de classificateurs, de méthodes de sélection de caractéristiques (Information Gain, Chi-Sqaured, etc.) et de capacités de traitement préliminaire de texte (remplacement, suppression des mots vides). , tf-idf, etc.).
Sur la base des anciens fils de discussion ici et ailleurs, je me suis jusqu'à présent intéressé à PyML, à scikits-learn et à Orange. Comment les gens ont-ils vécu les 3 mesures mentionnées ci-dessus?
D'autres suggestions?