Quel modèle parallèle théorique est le plus proche du modèle de programmation CUDA / OpenCL?
Par exemple, il correspond dans une certaine mesure au modèle générique de machine d'accès parallèle parallèle (PRAM). Cependant, c'est trop générique, car cela rend abstraction les diverses latences d'accès à la mémoire et les problèmes de synchronisation.
Ma question est de savoir quel est le modèle théorique auquel l'architecture CUDA correspond le mieux (compte tenu du parallélisme hiérarchique des threads et des blocs de threads qui coopèrent)?