J'ai utilisé theeano pour expérimenter avec des LSTM et je me demandais quelles méthodes d'optimisation (SGD, Adagrad, Adadelta, RMSprop, Adam, etc.) fonctionnent le mieux pour les LSTM? Existe-t-il des documents de recherche sur ce sujet?
De plus, la réponse dépend-elle du type d'application pour laquelle j'utilise le LSTM? Si c'est le cas, j'utilise des LSTM pour la classification de texte (où le texte est d'abord converti en vecteurs de mots).
Enfin, les réponses seraient-elles identiques ou différentes pour les RNN? Tous les pointeurs vers des documents de recherche ou des informations personnelles seraient très appréciés!
Les LSTM semblent être assez puissants et je souhaite en savoir plus sur la meilleure façon de les utiliser.