Je me demande pourquoi la formation des RNN n'utilise généralement pas 100% du GPU.
Par exemple, si j'exécute ce test RNN sur un Maxwell Titan X sur Ubuntu 14.04.4 LTS x64, l'utilisation du GPU est inférieure à 90%:
Le benchmark a été lancé à l'aide de la commande:
python rnn.py -n 'fastlstm' -l 1024 -s 30 -b 128
Comment diagnostiquer le goulot d'étranglement?