J'ai lu que la validation croisée avec abandon fournit une «estimation sans biais de la véritable performance de généralisation» (par exemple ici ) et que c'est une propriété avantageuse du CV avec abandon.
Cependant, je ne vois pas comment cela découle des propriétés du CV à laisser-un. Pourquoi le biais de cet estimateur est-il faible par rapport aux autres?
Mise à jour:
Je continue à enquêter sur le sujet, et je pense que cela a à voir avec le fait que cet estimateur est moins pessimiste que, disons, la validation K-fold, car il utilise toutes les données sauf une instance, mais ce serait bien de lire une mathématique dérivation de cela.