Les réseaux Maxout étaient une idée simple mais brillante de Goodfellow et al. de 2013 aux cartes de fonctionnalités maximales pour obtenir un approximateur universel des activations convexes. La conception a été conçue pour être utilisée en conjonction avec le décrochage (puis récemment introduite) et a bien sûr abouti à des résultats de pointe sur des références telles que CIFAR-10 et SVHN.
Cinq ans plus tard, le décrochage est définitivement dans le jeu, mais qu'en est-il de maxout? Le document est encore largement cité dans des articles récents selon Google Scholar, mais il semble que pratiquement aucun n'utilise réellement la technique.
Maxout appartient donc au passé et, dans l'affirmative, pourquoi - qu'est-ce qui en a fait un acteur de référence en 2013 mais pas en 2018?