J'ai essayé d'en savoir plus sur l'apprentissage en ligne ces derniers temps (c'est absolument fascinant!), Et un thème sur lequel je n'ai pas réussi à bien comprendre est de savoir comment penser la sélection de modèles dans des contextes hors ligne et en ligne. Plus précisément, supposons que nous formons un classificateur en ligne, basé sur une série de données fixes . Nous estimons ses caractéristiques de performance via une validation croisée, disons, et nous sélectionnons le meilleur classificateur de cette façon.D
Voici à quoi je pensais: comment, alors, procéder pour appliquer à un environnement en ligne? Pouvons-nous supposer que le meilleur trouvé hors ligne fonctionnera également bien en tant que classificateur en ligne? Est-il judicieux de rassembler des données pour former , puis de prendre ce même classificateur et de le «rendre opérationnel» dans un cadre en ligne avec les mêmes paramètres que ceux trouvés sur , ou une autre approche pourrait-elle être meilleure? Quelles sont les mises en garde dans ces cas? Quels sont les principaux résultats ici? Et ainsi de suite.S S S D
Quoi qu'il en soit, maintenant que ça existe, je suppose que ce que je recherche, ce sont des références ou des ressources qui m'aideront (et j'espère que d'autres, qui ont pensé à ce genre de chose!) À faire la transition de la pensée uniquement en termes hors ligne, et développer le cadre mental pour réfléchir à la question de la sélection des modèles et de ces questions de manière plus cohérente au fur et à mesure de ma lecture.