Enseignement supervisé
- 1) Un humain construit un classificateur basé sur des données d' entrée et de sortie
- 2) Ce classificateur est formé avec un ensemble de données de formation
- 3) Ce classificateur est testé avec un ensemble de données de test
- 4) Déploiement si le résultat est satisfaisant
A utiliser quand, "je sais classer ces données, j'ai juste besoin de vous (le classificateur) pour les trier".
Point de méthode: classer les étiquettes ou produire des nombres réels
Apprentissage non supervisé
- 1) Un humain construit un algorithme basé sur des données d' entrée
- 2) Cet algorithme est testé avec un ensemble de données de test (dans lequel l'algorithme crée le classificateur)
- 3) Déploiement si le classifieur est satisfaisant
À utiliser lorsque, "Je ne sais pas comment classer ces données, pouvez-vous (l'algorithme) créer un classificateur pour moi?"
Point de méthode: Classer les étiquettes ou prévoir (PDF)
Apprentissage par renforcement
- 1) Un humain construit un algorithme basé sur des données d' entrée
- 2) Cet algorithme présente un état dépendant des données d' entrée dans lesquelles un utilisateur récompense ou punit l'algorithme via l' action que l'algorithme a pris, cela continue dans le temps
- 3) Cet algorithme apprend de la récompense / punition et se met à jour, cela continue
- 4) Il est toujours en production, il a besoin d'apprendre de vraies données pour pouvoir présenter les actions des états
À utiliser quand, "Je n'ai aucune idée de comment classer ces données, pouvez-vous classer ces données et je vous donnerai une récompense si c'est correct ou je vous punirai si ce n'est pas le cas."
Est-ce le genre de flux de ces pratiques, j'entends beaucoup parler de ce qu'elles font, mais les informations pratiques et exemplaires sont terriblement peu!