L'argument que le papier semble faire me semble étrange.
Selon le document, l'objectif du CV est d'estimer , la performance prédictive attendue du modèle sur de nouvelles données, étant donné que le modèle a été formé sur l'ensemble de données observées S . Lorsque nous effectuons k CV -fold, on obtient une estimation A de ce nombre. En raison de la répartition aléatoire de S en k plis, ceci est une variable aléatoire Aα2SkA^Sk avecmoyenne μ k etvariance σ 2 k . En revanche, leCV répété n fois donne une estimation avec la même moyenneA^∼f(A)μkσ2kn mais plus petite variance σ 2 k / n .μkσ2k/n
Évidemment, . Ce parti pris est quelque chose que nous devons accepter.α2≠μk
Cependant, l'erreur attendue sera plus grande pour les petits n , et sera le plus grand pour n = 1 , au moins sous des hypothèses raisonnables sur f ( A ) , par exemple lorsque A ˙ ~ N ( μ k , σ 2 k / n ) . En d'autres termes, un CV répété permet d'obtenir une estimation plus précise de μ kE[|α2−A^|2]nn=1f(A)A^∼˙N(μk,σ2k/n)μket c'est une bonne chose car elle donne une estimation plus précise de .α2
Par conséquent, un CV répété est strictement plus précis qu'un CV non répété.
Les auteurs ne contestent pas cela! Au lieu de cela, ils affirment, sur la base des simulations, que
réduire la variance [en répétant CV] est, dans de nombreux cas, peu utile et essentiellement un gaspillage de ressources de calcul.
Cela signifie simplement que dans leurs simulations était assez faible; et en effet, la plus petite taille d'échantillon qu'ils ont utilisée était de 200 , ce qui est probablement assez grand pour produire un petit σ 2 k . (La différence dans les estimations obtenues avec le CV non répété et le CV répété 30 fois est toujours faible.) Avec des échantillons de plus petite taille, on peut s'attendre à une plus grande variance entre les répétitions.σ2k200σ2k
CAVEAT: intervalles de confiance!
Un autre point soulevé par les auteurs est que
la déclaration des intervalles de confiance [dans la validation croisée répétée] est trompeuse.
Il semble qu'ils se réfèrent aux intervalles de confiance pour la moyenne des répétitions de CV. Je suis tout à fait d'accord pour dire que cela n'a aucun sens à signaler! Plus le CV est répété, plus ce CI sera petit, mais personne ne s'intéresse au CI autour de notre estimation de ! Nous nous soucions du CI autour de notre estimation de α 2 .μkα2
Les auteurs rapportent également des IC pour le CV non répété, et il n'est pas tout à fait clair pour moi comment ces IC ont été construits. Je suppose que ce sont les IC pour les moyennes à travers les plis. Je dirais que ces CI sont également à peu près dénués de sens!k
adult
μk
CAVEAT PLUS GENERAL: variance de CV.
Vous avez écrit ce CV répété
est devenu une technique populaire pour réduire la variance de la validation croisée.
μkk=Nk
Pourquoi donc? En effet, LOOCV présente la variance la plus élevée comme estimation deα1S