Depuis un certain temps maintenant, j'essaie de comprendre pourquoi bon nombre de nos systèmes critiques reçoivent des rapports de «lenteur» allant de légère à extrême. J'ai récemment tourné mon regard vers l'environnement VMware où tous les serveurs en question sont hébergés.
J'ai récemment téléchargé et installé la version d'essai du pack d'administration Veeam VMware pour SCOM 2012, mais j'ai du mal à croire (et mon patron aussi) les chiffres qu'il me rapporte. Pour essayer de convaincre mon patron que les chiffres qu'il me dit sont vrais, j'ai commencé à regarder le client VMware lui-même pour vérifier les résultats.
J'ai regardé cet article VMware KB ; spécifiquement pour la définition de Co-Stop qui est définie comme:
Durée pendant laquelle une machine virtuelle MP était prête à fonctionner, mais a subi un retard en raison d'un conflit de planification de co-vCPU
Que je traduis
Le système d'exploitation invité a besoin de temps de l'hôte, mais doit attendre que les ressources deviennent disponibles et peut donc être considéré comme "ne répondant pas"
Cette traduction semble-t-elle correcte?
Si c'est le cas, voici où j'ai du mal à croire ce que je vois: l'hôte qui contient la majorité des machines virtuelles qui sont "lentes" affiche actuellement une moyenne de CPU Co-stop de 127 835,94 millisecondes!
Est-ce à dire qu'en moyenne les VMs sur cet hôte doivent attendre 2+ minutes pour le temps CPU ???
Cet hôte possède deux processeurs à 4 cœurs et il a un invité de processeur 1x8 et des invités de processeur 14x4.