J'ai repensé une réponse que j'ai donnée à une question il y a quelques semaines
La validation croisée hold-out produit un ensemble de tests unique qui peut être utilisé à plusieurs reprises pour la démonstration. Nous semblons tous convenir qu'il s'agit à bien des égards d'une caractéristique négative, car l'ensemble unique retenu pourrait se révéler non représentatif par hasard. De plus, vous pourriez finir par sur-adapter aux données de test de la même manière que vous pouvez sur-adapter aux données d'entraînement.
Cependant, il me semble que la nature statique d'un échantillon retenu est une meilleure approximation de «l'obtention de plus de données» que le CV k-fold, et évite le problème de la moyenne des plis. Je ne peux cependant pas trouver de base statistique pour ce sentiment que j'ai. Y a-t-il une logique dans mon intuition?
Par exemple, ce que j'ai en tête pour un projet à venir, c'est d'abord d'utiliser la validation d'exclusion pour construire et tester un modèle, puis comme étape de validation en redessinant plusieurs fois l'ensemble d'exclusion pour montrer que mes estimations d'erreur de prédiction ( sur l'ensemble de test) sont robustes aux erreurs d'échantillonnage dans l'ensemble de test. Est-ce une mauvaise idée pour une raison quelconque? Cette question a été posée auparavant mais n'a jamais reçu de réponse.