Questions marquées «performance»

Questions sur la vitesse d'exécution et l'utilisation de la mémoire des algorithmes, des structures de données, des langages et des bibliothèques.

4
Comment gérer trop de données?
Nos simulations de dynamique du plasma produisent souvent trop d'informations. Au cours des simulations, nous enregistrons diverses propriétés physiques sur une grille (x, y, z, t) qui est aussi grande que (8192x1024x1024x1500), pour au moins 10 propriétés. Ces informations sont traitées une fois la simulation terminée. Avec elle, nous faire …




4
Comptage FLOP pour les fonctions de bibliothèque
Lors de l'évaluation du nombre de FLOP dans une fonction simple, on peut souvent simplement descendre l'expression en comptant les opérateurs arithmétiques de base. Cependant, dans le cas d'instructions mathématiques impliquant une division paire, on ne peut pas le faire et s'attendre à pouvoir comparer avec les nombres FLOP à …

2
Quel est le moyen le plus rapide pour calculer toutes les valeurs propres d'une matrice d'adjacence très grande et clairsemée en python?
J'essaie de comprendre s'il existe un moyen plus rapide de calculer toutes les valeurs propres et vecteurs propres d'une matrice de contiguïté très grande et clairsemée que d'utiliser scipy.sparse.linalg.eigsh Pour autant que je sache, cette méthode utilise uniquement la rareté et attributs de symétrie de la matrice. Une matrice d'adjacence …


3
Dans quels cas d'application les schémas de préconditionnement additif sont-ils supérieurs aux schémas multiplicatifs?
Dans les deux méthodes de décomposition de domaine (DD) et multigrille (MG), on peut composer l'application des mises à jour de bloc ou des corrections grossières comme additive ou multiplicative . Pour les solveurs ponctuels, c'est la différence entre les itérations de Jacobi et de Gauss-Seidel. Le lisseur multiplicatif pour …


1
Modèles statistiques pour la mémoire / le calcul locaux, la latence du réseau et la gigue de la bande passante dans HPC
Le calcul parallèle est fréquemment modélisé à l'aide d'un taux de calcul local déterministe, d'une surcharge de latence et d'une bande passante réseau. En réalité, ceux-ci sont spatialement variables et non déterministes. Des études telles que Skinner et Kramer (2005) observent des distributions multimodales, mais l'analyse des performances semble toujours …


3
Nvidia K20X vs GeForce Titan pour l'accélération GPGPU
Im essayant de comprendre la différence entre ces deux cartes graphiques pour l'informatique académique, en particulier pour le composant DGEMM. Si nous regardons les statistiques brutes, les deux ont la même puce GK110, ont des statistiques comparables dans pratiquement toutes les catégories et, je crois, ont la même architecture de …


3
Références bibliographiques pour la modélisation des coûts énergétiques actuels et futurs des opérations en virgule flottante et des transferts de données
Je recherche la documentation et les références de diapositives les plus importantes pour modéliser les coûts énergétiques actuels et futurs des opérations en virgule flottante et des transferts de données à travers le CPU, la mémoire, le réseau et le stockage. J'ai marqué cette question comme un wiki communautaire et …


En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.