Une question plus productive pourrait être "pourquoi n'a-t-elle pas été utilisée dans les statistiques classiques que j'ai apprises?"
Selon le ou les niveaux auxquels il a été enseigné, le contenu du cours (et le temps disponible) ce choix peut être dû à une combinaison de divers facteurs. Souvent, des sujets importants sont laissés de côté parce que d'autres matières doivent être enseignées pour une raison ou une autre, dans l'espoir qu'elles puissent être traitées dans des matières ultérieures.
Dans certains sens au moins, la notion a longtemps été utilisée par diverses personnes. Elle était plus courante dans certains domaines que dans d'autres. De nombreuses utilisations des statistiques n'ont pas de prédiction ou de sélection de modèle en tant que composant majeur (ou dans certains cas, même pas du tout), et dans ce cas, l'utilisation d'échantillons d'exclusion peut être moins critique que lorsque la prédiction est le point principal. On peut dire qu'il aurait dû être utilisé plus largement à un stade antérieur dans certaines applications pertinentes qu'il ne l'a fait, mais ce n'est pas la même chose qu'être inconnu.
Si vous regardez les domaines qui se concentrent sur la prédiction, la notion d'évaluation de modèle en prédisant des données que vous n'avez pas utilisées pour estimer votre modèle était certainement présente (mais pas universelle). Je le faisais certainement avec la modélisation de séries chronologiques que je faisais dans les années 1980, par exemple, où la performance prédictive hors échantillon des données les plus récentes était particulièrement importante.
L'idée de laisser de côté au moins certaines données a été utilisée dans la régression (résidus supprimés, PRESS, jacknife, etc.) et dans l'analyse des valeurs aberrantes, par exemple.
Certaines de ces idées remontent encore beaucoup plus tôt. Stone (1974) [1] fait référence à des articles sur la validation croisée (avec le mot dans le titre) des années 50 et 60. Peut-être encore plus près de votre intention, il mentionne l'utilisation par Simon (1971) des termes «échantillon de construction» et «échantillon de validation» - mais souligne également que «Larson (1931) a utilisé la division aléatoire de l'échantillon dans un multiple éducatif. -étude de régression ".
Des sujets comme la validation croisée et l'utilisation de statistiques basées sur la prédiction, etc., devenaient beaucoup plus fréquents dans la littérature statistique dans les années 70 et dans les années 80, par exemple, mais de nombreuses idées de base existaient depuis un certain temps même ensuite.
[1]: Stone, M., (1974)
"Cross-Validatory Choice and Assessment of Statistical Predictions",
Journal de la Royal Statistical Society. Série B (méthodologique) , vol. 36, n ° 2., pp. 111-147