Quelle est la définition d'un réseau neuronal profond? Pourquoi sont-ils si populaires ou importants?
Quelle est la définition d'un réseau neuronal profond? Pourquoi sont-ils si populaires ou importants?
Réponses:
Un réseau neuronal profond (DNN) n'est rien d'autre qu'un réseau neuronal qui a plusieurs couches, où plusieurs peuvent être subjectives.
À mon humble avis, tout réseau qui a 6 ou 7 couches ou plus est considéré comme profond. Ainsi, ce qui précède formerait une définition très basique d'un réseau profond.
Les réseaux profonds ont deux différences principales avec les réseaux «normaux».
La première est que la puissance de calcul et les ensembles de données de formation ont énormément augmenté, ce qui signifie qu'il est pratique d'exécuter des réseaux plus importants et statistiquement valides (c'est-à-dire que nous avons suffisamment d'exemples de formation que nous ne rencontrerons pas simplement des problèmes de sur-adaptation avec des réseaux plus importants).
La seconde est que la propagation arrière est limitée plus vous avez de couches; chaque couche représente un gradient de l'erreur, et donc au moment où l'on a environ six couches de profondeur, il ne reste plus beaucoup d'erreur pour modifier les poids des neurones. Mais on pourrait raisonnablement s'attendre à ce que les neurones antérieurs soient plus importants que les neurones ultérieurs, car ils représentent des «concepts» plus proches des entrées brutes.
De nouvelles techniques de formation contournent ce problème, généralement en faisant un apprentissage non supervisé sur les intrants bruts, créant des «concepts» de niveau supérieur qui sont ensuite utiles comme intrants pour l'apprentissage supervisé.
(Par exemple, considérez le problème de déterminer si une image contient ou non un chat à partir des pixels. Les premières couches du réseau devraient faire des choses comme la détection des contours, que l'on pourrait s'attendre à partager entre toutes les images et surtout indépendamment de ce on essaie de faire avec les couches de sortie, donc aussi difficile de s'entraîner à travers des signaux «cat-not cat» de nombreuses couches vers le haut.
Structure générale d'un réseau de neurones artificiels
Couche d'entrée + couches masquées + couche de sortie
S'il y a plus de couches cachées dans le réseau neuronal artificiel, alors le réseau neuronal est appelé réseau neuronal profond. Combien constituent exactement un réseau neuronal profond est un sujet de débat, mais en général, plus les couches cachées sont profondes, plus le réseau neuronal est profond.
En raison de leur popularité ou de leur importance, de nombreux problèmes tels que la détection d'objets, la classification, la reconnaissance faciale et la reconnaissance vocale ont été résolus avec l'avènement des réseaux de neurones profonds. Il n'est pas exagéré de dire que les performances des réseaux de neurones profonds ont même croisé les performances humaines dans de nombreuses tâches mentionnées ci-dessus. Cela signifie maintenant qu'un ordinateur est le meilleur pour effectuer les tâches ci-dessus que les humains. Tous les problèmes mentionnés ci-dessus se situaient dans le domaine de la recherche depuis près de 5 décennies. Tous n'ont été résolus à la perfection qu'au cours des 4,5 dernières années, simplement en raison du succès des réseaux de neurones profonds. C'est pourquoi ils sont très populaires et importants. J'ai mentionné très peu de problèmes sur lesquels j'ai travaillé, il y a beaucoup de tâches similaires que les réseaux neuronaux profonds ont résolus facilement au cours de la dernière décennie.
Et, à l'heure actuelle, de nombreuses personnes à travers le monde travaillent à la résolution d'innombrables applications à l'aide de réseaux de neurones profonds.