J'ai récemment rencontré plusieurs sources "informelles" qui indiquent que dans certaines circonstances, si nous utilisons l' AIC ou le BIC pour former un modèle de série chronologique, nous n'avons pas besoin de diviser les données en test et en formation - nous pouvons utiliser tous les données pour la formation. (Les sources incluent entre autres, une discussion sur le blog de Rob Hyndman sur CV , cette présentation de Stanford ou la section 4 de ce texte ).
En particulier, ils semblent indiquer que l'AIC ou le BIC peuvent être utilisés lorsque l'ensemble de données est trop petit pour permettre une répartition train / essai.
Le commentaire de Rob Hyndman par exemple: "Il est beaucoup plus efficace d'utiliser AIC / BIC que d'utiliser des ensembles de test ou CV, et cela devient essentiel pour les courtes séries chronologiques où il n'y a pas assez de données pour faire autrement."
Je n'arrive cependant pas à trouver de textes ou d'articles qui en discutent en détail.
Une chose qui me rend particulièrement perplexe est que l'AIC et le BIC tendent asymptotiquement vers la validation croisée, ce qui signifie que si possible, ils remplaceraient le CV pour les grands ensembles de données - ce qui va à l'encontre de l'idée qu'ils soient utiles pour les petits ensembles de données.
Quelqu'un peut-il m'indiquer une discussion formelle (chapitres de livre, articles, tutoriels) de cette idée?