Il est peu probable que cela ajoute beaucoup au-delà de vos efforts directs de collecte de données.
La qualité des sorties GAN actuelles (à partir de 2017) ne sera pas suffisamment élevée. Les images produites par un GAN sont généralement petites et peuvent avoir des détails inhabituels / ambigus et des distorsions étranges. Dans l'article que vous avez lié, les images générées par le système à partir d'une phrase ont des blocs de couleur crédibles compte tenu du sujet, mais sans que la phrase ne vous indique à quoi s'attendre, la plupart d'entre elles ne sont pas reconnaissables comme un sujet spécifique.
Les GAN avec un objectif moins ambitieux que de générer des images à partir de phrases (ce qui malgré ma critique ci-dessus, est un exploit vraiment remarquable de l'OMI) devraient produire des images plus proches de la photo-réalisme. Mais leur portée sera moindre et n'inclura probablement pas le type d'image souhaité. De plus, la taille de sortie est généralement petite, par exemple 64x64 ou 128x128 *, et il y a encore suffisamment de distorsions et d'ambiguïtés pour que des photos de terrain originales soient de loin préférables.
Le GAN est lui-même limité par la bibliothèque de formation disponible - il ne fonctionnera pas bien si vous essayez de générer des images en dehors de la portée de ses données de formation. Les résultats présentés dans le document de recherche se concentrent bien sûr sur le domaine fourni par les données de formation. Mais vous ne pouvez pas simplement insérer une phrase dans ce modèle et vous attendre à un résultat qui serait utile ailleurs.
Si vous trouvez un GAN qui a été formé sur un ensemble de données adapté à votre problème, vous feriez probablement mieux d'essayer de trouver les mêmes données directement pour votre projet.
Si vous rencontrez un problème avec des données de vérité terrain limitées, alors peut-être qu'une meilleure approche pour utiliser un GAN serait d'utiliser un classificateur pré-formé tel que VGG-19 ou Inception v5, remplacer les dernières couches entièrement connectées, et bien réglez-le sur vos données. Voici un exemple de cela en utilisant la bibliothèque Keras en Python - d'autres exemples peuvent être trouvés avec des recherches comme "classeur d'image CNN affiné".
* Les GAN de pointe se sont améliorés depuis que j'ai publié cette réponse. Une équipe de recherche de Nvidia a connu un succès remarquable en créant des images photo-réalistes 1024x1024 . Cependant, cela ne change pas les autres points de ma réponse. Les GAN ne sont pas une source fiable d'images pour les tâches de classification d'images, sauf peut-être pour les sous-tâches de tout ce sur quoi le GAN a déjà été formé et est capable de générer de manière conditionnelle (ou peut-être plus trivialement, de fournir des données sources pour les "autres" catégories dans classificateurs).