Je travaille sur le modèle Seq2Seq en utilisant LSTM de Keras (en utilisant l'arrière-plan de Theano) et je voudrais paralléliser les processus, car même peu de Mo de données nécessitent plusieurs heures de formation.
Il est clair que les GPU sont bien meilleurs en parallélisation que les CPU. Pour le moment, je n'ai que des processeurs avec lesquels travailler. Je pouvais accéder à 16 CPU (2 threads par cœur X 4 cœurs par socket X 2 sockets)
À partir du document de prise en charge multicœur de Theano, j'ai réussi à utiliser les quatre cœurs d'un même socket. Donc, fondamentalement, le CPU est à 400% d'utilisation avec 4 processeurs utilisés et les 12 CPU restants restent inutilisés. Comment puis-je les utiliser aussi. Tensorflow pourrait également être utilisé à la place de l'arrière-plan de Theano, si cela fonctionne.