Supposons que l'exécution d'un vertex shader représente 100 flops, ce qui signifie que vous pouvez traiter 1000e9 / 100 = 10e9 sommets par seconde.
Non, certainement pas.
Fondamentalement, vous devriez considérer tout calcul de la vitesse d'exécution de tout code basé uniquement sur le nombre de "FLOPS" comme suspect. En effet, il est généralement préférable d'ignorer complètement les FLOPS.
Vous n'avez pas défini le terme «unité parallèle»; sans cette définition, nous ne pouvions que deviner ce que vous vouliez.
Prenez la Radeon 5870. Elle a 1600 unités à virgule flottante. Cela signifie que, pour chaque cycle, il peut exécuter simultanément 1600 opérations scalaires à virgule flottante. Cependant, chaque opcode VLIW fonctionne sur des registres mathématiques vectoriels à 5 voies. Ainsi, la plus petite granularité possible du code réel est 1600/5, ou 320 (note: il s'agit d'une vaste simplification). C'est 320 threads.
Cependant , ce n'est pas vraiment ainsi que cela fonctionne. Vous n'avez pas 320 chemins d'exécution distincts en cours. Vous ne pouvez pas avoir 320 morceaux de code différents s'exécutant sur 320 unités différentes. Voir, les VLIW à 5 voies sont elles-mêmes regroupées en cœurs SIMD à 4 voies. Chaque SIMD peut avoir son propre chemin d'exécution et son propre code source. Chaque VLIW dans un cœur SIMD peut avoir des données distinctes, de sorte qu'elles calculent des valeurs distinctes. Mais chaque VLIW dans un cœur SIMD exécute les mêmes instructions en étape de verrouillage avec les autres VLIW dans ce cœur.
Donc, vraiment, vous n'avez que 320/4, soit 80 threads au total. Mais encore une fois, cela dépend du type "d'unité parallèle" dont vous parlez. Techniquement, 1600, 320 et 80 sont toutes des réponses légitimes.
Et c'est juste pour une architecture spécifique . La gamme Fermi de NVIDIA (GeForce 4xx et plus) utilise une architecture très différente. La ligne Cayman d'ATI (Radeon 69xx) change les VLIW à 5 voies en VLIW à 4 voies. Leur prochaine architecture peut également présenter des différences importantes.
Sans savoir ce que vous cherchez, il n'y a tout simplement aucun moyen de répondre à la question.