J'ai un modèle de réseau neuronal profond et je dois le former sur mon ensemble de données qui comprend environ 100 000 exemples, mes données de validation contiennent environ 1 000 exemples. Parce qu'il faut du temps pour former chaque exemple (environ 0,5 s pour chaque exemple) et afin d'éviter le surapprentissage, je voudrais appliquer un arrêt précoce pour éviter un calcul inutile. Mais je ne sais pas comment former correctement mon réseau de neurones avec un arrêt précoce, plusieurs choses que je ne comprends pas très bien maintenant:
Quelle serait une bonne fréquence de validation? Dois-je vérifier mon modèle sur les données de validation à la fin de chaque époque? (La taille de mon lot est 1)
Est-il vrai que les premières époques pourraient donner un résultat pire avant qu'il ne commence à converger vers une meilleure valeur? Dans ce cas, devons-nous former notre réseau pendant plusieurs époques avant de vérifier un arrêt précoce?
Comment gérer le cas où la perte de validation peut monter et descendre? Dans ce cas, un arrêt précoce pourrait empêcher mon modèle d'apprendre davantage, non?
Merci d'avance.