De manière asymptotique, la minimisation de l'AIC est équivalente à la minimisation de la MSE de validation croisée avec sortie pour les données transversales [ 1 ]. Alors, quand nous avons l'AIC, pourquoi utilise-t-on du tout la méthode de division des données en ensembles de formation, de validation et de test pour mesurer les propriétés prédictives des modèles? Quels sont précisément les avantages de cette pratique?
Je peux penser à une raison: si l'on veut évaluer les performances prédictives des modèles, l'analyse hors échantillon est utile. Mais bien que l'AIC ne soit pas une mesure de la précision des prévisions , on a généralement une bonne idée si un modèle atteint son potentiel maximum (pour les données fournies) en termes de capacité à prédire.