J'ai une application qui peut être trivialement parallélisée mais ses performances sont dans une large mesure liées aux E / S. L'application lit un tableau d'entrée unique stocké dans un fichier qui est généralement de 2 à 5 Go (mais je m'attends à ce que ce nombre augmente à l'avenir). Un calcul typique applique la même opération à chaque ligne ou colonne de ce tableau. Pour les opérations gourmandes en CPU, j'obtiens une très bonne évolutivité jusqu'à environ 100 processeurs, mais pour les opérations plus lentes, les E / S et la communication associée (accès NFS) dominent et je ne peux pas utiliser plus de quelques processeurs efficacement.
Quelles sont les options efficaces et portables (idéalement portatives) dans une telle situation? Le HDF5 parallèle semble prometteur. Quelqu'un a-t-il une expérience de la vie réelle avec cela?
Est-ce que MPI-I / O mérite d'être étudié? Peut-il fonctionner efficacement avec une disposition de fichier donnée, ou dois-je tout adapter?