Tout d'abord: je sais, il n'y a pas de nombre général de taille d'échantillon requis pour former un réseau neuronal. Cela dépend de trop de facteurs comme la complexité de la tâche, le bruit dans les données, etc. Et plus j'aurai d'échantillons de formation, meilleur sera mon réseau.
Mais je me demandais: est-il théoriquement possible de former un réseau neuronal avec moins d'échantillons d'entraînement que de poids, si je suppose que ma tâche est assez "simple"? Quelqu'un connaît-il un exemple où cela a fonctionné? Ou ce réseau sera-t-il presque sûrement mauvais?
Si je considère, par exemple, la régression polynomiale, je ne peux pas ajuster un polynôme de degré 4 (c'est-à-dire avec 5 paramètres libres) sur seulement 4 points de données. Existe-t-il une règle similaire pour les réseaux de neurones, considérant mon nombre de poids comme le nombre de paramètres libres?