Je suis tombé sur une question simple sur la comparaison des modèles flexibles (c'est-à-dire des splines) et des modèles inflexibles (par exemple la régression linéaire) dans différents scénarios. La question est:
En général, nous attendons-nous à ce que les performances d'une méthode d'apprentissage statistique flexible soient meilleures ou moins bonnes qu'une méthode inflexible lorsque:
- Le nombre de prédicteurs est extrêmement grand et le nombre d'observations est petit?
- La variance des termes d'erreur, c'est-à-dire , est extrêmement élevée?
Je pense que pour (1), quand est petit, les modèles inflexibles sont meilleurs (pas sûr). Pour (2), je ne sais pas quel modèle est (relativement) meilleur.