Disons que j'ai un classificateur de régression logistique. Dans l'apprentissage par lots normal, j'aurais un terme régularisateur pour éviter le surapprentissage et garder mes poids petits. Je normaliserais également et ferais évoluer mes fonctionnalités.
Dans un environnement d'apprentissage en ligne, je reçois un flux continu de données. Je fais une mise à jour de descente de gradient avec chaque exemple, puis je le jette. Suis-je censé utiliser le terme de mise à l'échelle et de régularisation des fonctionnalités dans l'apprentissage en ligne? Si oui, comment faire? Par exemple, je n'ai pas de jeu de données de formation sur lequel évoluer. Je n'ai pas non plus de validation pour régler mon paramètre de régularisation. Si non, pourquoi pas?
Dans mon apprentissage en ligne, j'obtiens un flux d'exemples en continu. Pour chaque nouvel exemple, je fais une prédiction. Ensuite, dans la prochaine étape, j'obtiens la cible réelle et fais la mise à jour de la descente de gradient.