J'ai une machine à 24 cœurs avec 94,6 Go de RAM exécutant le serveur Ubuntu 10.04. La box connaît un pourcentage élevé, contrairement à un autre serveur que nous avons (4 cœurs) exécutant les mêmes types et quantités de processus. Les deux machines sont connectées à un serveur de fichiers VNX Raid, la machine à 24 cœurs via 4 cartes FC et l'autre via 2 cartes Ethernet gigabit. La machine à 4 cœurs surpasse actuellement la machine à 24 cœurs, a une utilisation du processeur plus élevée et un% iowait plus faible.
En 9 jours de disponibilité, le% iowait en moyenne à 16%, et est systématiquement supérieur à 30%. La plupart du temps, l'utilisation du processeur est très faible, environ 5% (en raison de la forte intensité). Il y a suffisamment de mémoire libre.
Une chose que je ne comprends pas, c'est pourquoi toutes les données semblent passer par le périphérique sdc plutôt que par les déménageurs de données directement:
avg-cpu: %user %nice %system %iowait %steal %idle
6.11 0.39 0.75 16.01 0.00 76.74
Device: tps Blk_read/s Blk_wrtn/s Blk_read Blk_wrtn
sda 0.00 0.00 0.00 1232 0
sdb 0.00 0.00 0.00 2960 0
sdc 1.53 43.71 44.54 36726612 37425026
dm-0 0.43 27.69 0.32 23269498 268696
dm-1 1.00 1.86 7.74 1566234 6500432
dm-2 0.96 1.72 5.97 1442482 5014376
dm-3 0.49 9.57 0.18 8040490 153272
dm-4 0.00 0.00 0.00 1794 24
dm-5 0.00 0.00 0.00 296 0
Une autre pièce du puzzle est que les tâches passent fréquemment en mode veille ininterrompu (en haut), probablement aussi en raison du blocage io.
Que puis-je regarder pour aider à diagnostiquer le problème? Pourquoi toutes les données transitent-elles par / dev / sdc? Est-ce normal?
MISE À JOUR:
La connexion réseau et la capacité de lecture / écriture VNX ont été exclues en tant que goulots d'étranglement. Nous pouvons atteindre des vitesses de 800 Mo / s avec les 4 cartes réseau liées (round-robin). Les cartes Fibre Channel ne sont pas encore utilisées. Le VNX est bien capable de gérer les E / S (RAID6, disques 30 x 2 To à 7,2 kRPM par pool dans deux pools (60 disques au total), environ 60% en lecture).
Ignorez ci-dessus à propos de dm et sdc, ce sont tous des disques internes et ne font pas partie du problème.
Nous pensons que le problème pourrait être avec les montages nfs ou TCP (nous avons 5 montages sur 5 partitions sur le VNX), mais je ne sais pas quoi exactement. Aucun conseil?
dm
signifie mappeur de périphérique, pas de moteur de données. Cette question ferait probablement beaucoup mieux à Server Fault.