J'ai lu maintes et maintes fois que la validation croisée "Leave-one-out" a une grande variance en raison du grand chevauchement des plis de formation. Cependant, je ne comprends pas pourquoi: les performances de la validation croisée ne devraient-elles pas être très stables (faible variance) exactement parce que les ensembles d'entraînement sont presque identiques? Ou ai-je une mauvaise compréhension du concept de "variance"?
Je ne comprends pas non plus complètement comment la LOO peut être impartiale, mais j'ai une variance élevée? Si l'estimation LOO est égale à la vraie valeur de l'estimateur dans l'espérance - comment peut-elle alors avoir une variance élevée?
Remarque: Je sais qu'il y a une question similaire ici: pourquoi la variance de validation croisée sans effet (LOOCV) sur l'estimation moyenne de l'erreur est-elle élevée? Cependant, la personne qui a répondu dit plus loin dans les commentaires que malgré les votes positifs, il a réalisé que sa réponse était fausse.