J'ai trouvé des définitions potentiellement contradictoires pour la statistique de validation croisée (CV) et pour la statistique de validation croisée généralisée (GCV) associée à un modèle linéaire (avec un vecteur d'erreur homoscédastique normal ).ε
D'une part, Golub, Heath & Wahba définissent l'estimation GCV comme (p. 216)
le minimiseur de donné par
où
D'autre part, Efron définit le même concept que (p. 24), mais il attribue l'introduction de ce concept à Craven & Wahba, où sa définition (p. 377) est essentiellement la même comme la définition susmentionnée de Golub, Heath & Wahba.
Est-ce à dire que minimise ?
De même, Golub, Heath & Wahba définissent l'estimation CV de (p. 217) comme le minimiseur de
où est l'estimation
of avec le ème point de données omis.
Les auteurs attribuent l'introduction de l'estimation CV (également appelée estimation PRESS) à Allen ("Allen's PRESS", ibid.). Pourtant, dans l'article d'Allen, l'estimation PRESS est définie (p. 126) comme (dans l'article d'Efron, il est défini comme (p. 24)).
Encore une fois, cela signifie-t-il que minimise ?
Allen, David M. La relation entre la sélection des variables et l'agumentation des données et une méthode de prédiction. Technometrics, Vol. 16, n ° 1 (février 1974), p. 125-127
Craven, Peter et Wahba, Grace. Lissage des données bruyantes avec les fonctions Spline. Numerische Mathematik 31, (1979), p. 377-403
Efron, Bradley. Dans quelle mesure le taux d'erreur apparent d'une régression logistique est-il biaisé? Rapport technique no. 232. Département de statistique, Université de Stanford (avril 1985)
Golub, Gene H., Heath et Grace Wahba. La validation croisée généralisée comme méthode de choix d'un bon paramètre de crête. Technometrics, Vol. 21, n ° 2 (mai 1979), pp. 215-223