En ce qui concerne l'apprentissage non supervisé (comme la mise en cluster), existe-t-il des métriques permettant d'évaluer les performances?
En ce qui concerne l'apprentissage non supervisé (comme la mise en cluster), existe-t-il des métriques permettant d'évaluer les performances?
Réponses:
Dans un certain sens, je pense que cette question est sans réponse. Je dis cela parce que l'efficacité d'une méthode particulière non supervisée dépend en grande partie de la raison pour laquelle vous effectuez un apprentissage non supervisé en premier lieu, c.-à-d. Si la méthode est performante dans le contexte de votre objectif final. Évidemment, ce n'est pas tout à fait vrai, les gens travaillent sur ces problèmes et publient des résultats incluant une sorte d'évaluation. Je vais décrire ci-dessous quelques-unes des approches que je connais bien.
Une bonne ressource (avec des références) pour le clustering est la page de documentation de sklearn, intitulée Clustering Performance Evaluation . Cela couvre plusieurs méthodes, mais toutes sauf une, le coefficient Silhouette, supposent que des étiquettes de vérité sont disponibles. Cette méthode est également mentionnée dans la question Mesure d’évaluation du regroupement , liée aux commentaires de cette question.
Si votre méthode d'apprentissage non supervisé est probabiliste, vous pouvez également évaluer certaines mesures de probabilité (log-vraisemblance, perplexité, etc.) sur des données conservées. La motivation ici est que si votre méthode d’apprentissage non supervisé attribue une probabilité élevée à des données similaires qui n’ont pas été utilisées pour s’ajuster aux paramètres, elle a probablement bien réussi à capturer la distribution des intérêts. Un domaine où ce type d'évaluation est couramment utilisé est la modélisation du langage.
La dernière option que je mentionnerai consiste à utiliser un apprenant supervisé pour une tâche auxiliaire connexe. Si votre méthode non supervisée produit des variables latentes, vous pouvez les considérer comme une représentation de l'entrée. Il est donc judicieux d’utiliser ces variables latentes comme entrée d’un classifieur supervisé effectuant une tâche liée au domaine dont proviennent les données. La performance de la méthode supervisée peut alors servir de substitut à la performance de l'apprenant non supervisé. C'est essentiellement la configuration que vous voyez dans la plupart des travaux sur l'apprentissage de la représentation.
Cette description est probablement un peu nébuleuse, je vais donc donner un exemple concret. Presque tout le travail sur l'apprentissage de la représentation des mots utilise l'approche suivante pour l'évaluation:
Pour un exemple de cette approche en action, voir l'étude Entraînement de Boltzmann restreint sur les observations de mots de Dahl et al.