Édition finale avec toutes les ressources mises à jour:
Pour un projet, j'applique des algorithmes d'apprentissage automatique pour la classification.
Défi: données étiquetées assez limitées et beaucoup plus de données non étiquetées.
Buts:
- Appliquer la classification semi-supervisée
- Appliquer un processus d'étiquetage en quelque sorte semi-supervisé (appelé apprentissage actif)
J'ai trouvé beaucoup d'informations dans des articles de recherche, comme l'application EM, Transductive SVM ou S3VM (Semi Supervised SVM), ou en quelque sorte en utilisant LDA, etc. Même il y a peu de livres sur ce sujet.
Question: Où sont les implémentations et les sources pratiques?
Mise à jour finale (basée sur les aides fournies par mpiktas, bayer et Dikran Marsupial)
Apprentissage semi-supervisé:
- TSVM: dans SVMligth et SVMlin .
- EM Naive Bayes en Python
- Projet EM dans LinePipe
Apprentissage actif:
- Dualiste : une implémentation de l'apprentissage actif avec code source sur la classification des textes
- Cette page Web offre un merveilleux aperçu de l'apprentissage actif.
- Un atelier de design expérimental: ici .
L'apprentissage en profondeur:
- Vidéo d'introduction ici .
- Site général .
- Tutoriel d' apprentissage des fonctionnalités et d'apprentissage en profondeur non supervisé de Stanford .