Dans le contexte de l'apprentissage automatique, quelle est la différence entre
- apprentissage non supervisé
- apprentissage supervisé et
- apprentissage semi-supervisé?
Et quelles sont les principales approches algorithmiques à examiner?
Dans le contexte de l'apprentissage automatique, quelle est la différence entre
Et quelles sont les principales approches algorithmiques à examiner?
Réponses:
Généralement, les problèmes d'apprentissage automatique peuvent être considérés comme des variations de l'estimation de fonction pour la classification, la prédiction ou la modélisation.
Dans l' apprentissage supervisé, on est fourni avec une entrée ( , , ...,) et une sortie ( , , ...,) et il est difficile de trouver une fonction qui se rapproche de ce comportement de manière généralisable. La sortie pourrait être une étiquette de classe (dans la classification) ou un nombre réel (dans la régression) - ce sont les «supervision» dans l'apprentissage supervisé.
L'apprentissage semi-supervisé implique l'estimation de fonction sur des données étiquetées et non étiquetées. Cette approche est motivée par le fait que les données étiquetées sont souvent coûteuses à générer, alors que les données non étiquetées ne le sont généralement pas. Le défi ici concerne principalement la question technique de savoir comment traiter les données mélangées de cette manière. Voir cette enquête sur la littérature sur l'apprentissage semi-supervisé pour plus de détails sur les méthodes d'apprentissage semi-supervisé.
Apprentissage non supervisé
L'apprentissage non supervisé se produit lorsque vous n'avez pas de données étiquetées disponibles pour la formation. Des exemples de cela sont souvent des méthodes de clustering.
Enseignement supervisé
Dans ce cas, vos données d'entraînement existent à partir de données étiquetées. Le problème que vous résolvez ici consiste souvent à prévoir les étiquettes des points de données sans étiquette.
Apprentissage semi-supervisé
Dans ce cas, les données étiquetées et non étiquetées sont utilisées. Cela peut par exemple être utilisé dans les réseaux de croyances profondes, où certaines couches apprennent la structure des données (non supervisées) et une couche est utilisée pour effectuer la classification (formée avec des données supervisées)
Je ne pense pas que supervisé / non supervisé soit la meilleure façon d'y penser. Pour l'exploration de données de base, il est préférable de penser à ce que vous essayez de faire. Il y a quatre tâches principales:
prédiction. si vous prédisez un nombre réel, cela s'appelle la régression. si vous prévoyez un nombre entier ou une classe, cela s'appelle la classification.
la modélisation. la modélisation est la même que la prédiction, mais le modèle est compréhensible par l'homme. Les réseaux de neurones et les machines à vecteurs de support fonctionnent très bien, mais ne produisent pas de modèles compréhensibles [1]. Les arbres de décision et la régression linéaire classique sont des exemples de modèles faciles à comprendre.
similarité. si vous essayez de trouver des groupes naturels d'attributs, cela s'appelle l'analyse factorielle. si vous essayez de trouver des groupes naturels d'observations, cela s'appelle regroupement.
association. c'est un peu comme la corrélation, mais pour d'énormes ensembles de données binaires.
[1] Apparemment, Goldman Sachs a créé des tonnes de grands réseaux de neurones pour la prédiction, mais personne ne les a compris, ils ont donc dû écrire d'autres programmes pour essayer d'expliquer les réseaux de neurones.