Momentum est utilisé pour diminuer les fluctuations de poids lors d’itérations successives:
Weight decay pénalise les changements de poids:
La question est de savoir s'il est judicieux de combiner les deux astuces lors de la rétro-propagation et quel effet cela aurait-il?