Bien que ce soit un ancien article, répondre maintenant parce que je savais que les valeurs de seuil de check_load sont des maux de tête pour les débutants ..;)
Une alerte d'avertissement, si le processeur est à 70% pendant 5 minutes, 60% pendant 10 minutes, 50% pendant 15 minutes. Une alerte critique, si le processeur est à 90% pendant 5 minutes, 80% pendant 10 minutes, 70% pendant 15 minutes.
*command[check_load]=/usr/local/nagios/libexec/check_load -w 0.7,0.6,0.5 -c 0.9,0.8,0.7*
Toutes mes découvertes sur la charge CPU:
Que signifie "la charge": Wikipedia dit:
Tous les systèmes Unix et Unix-like génèrent une métrique de trois nombres de "moyenne de charge" dans le noyau. Les utilisateurs peuvent facilement interroger le résultat actuel à partir d'un shell Unix en exécutant la commande uptime:
$ uptime
14:34:03 up 10:43, 4 users, load average: 0.06, 0.11, 0.09
De la moyenne de charge de sortie ci-dessus: 0.06, 0.11, 0.09
signifie (sur un système à processeur unique):
- au cours de la dernière minute, le CPU a été sous-chargé de 6%
- au cours des 5 dernières minutes, le CPU était sous-chargé 11%
- au cours des 15 dernières minutes, le CPU était sous-chargé 9%
.
$ uptime
14:34:03 up 10:43, 4 users, load average: 1.73, 0.50, 7.98
La moyenne de charge ci-dessus 1.73 0.50 7.98
sur un système à processeur unique est la suivante:
- au cours de la dernière minute, le processeur a été surchargé de 73% (1 processeur avec 1,73 processus exécutables, de sorte que 0,73 processus ont dû attendre un tour)
- au cours des 5 dernières minutes, le CPU a été sous-chargé à 50% (aucun processus n'a dû attendre un tour)
- au cours des 15 dernières minutes, le processeur a été surchargé de 698% (1 processeur avec 7,98 processus exécutables, de sorte que 6,98 processus ont dû attendre un tour)
Calcul de la valeur seuil de Nagios:
Pour la configuration de Nagios CPU Load, qui comprend un avertissement et un élément critique:
y = c * p / 100
Où:
y = nagios value
c = number of cores
p = wanted load procent
pour un système à 4 cœurs:
time 5 min 10 min 15 min
warning: 90% 70% 50%
critical: 100% 80% 60%
command[check_load]=/usr/local/nagios/libexec/check_load -w 3.6,2.8,2.0 -c 4.0,3.2,2.4
Pour un système monocœur:
y = p / 100
Où:
y = nagios value
p = wanted load procent
time 5 min 10 min 15 min
warning: 70% 60% 50%
critical: 90% 80% 70%
command[check_load]=/usr/local/nagios/libexec/check_load -w 0.7,0.6,0.5 -c 0.9,0.8,0.7
Un grand livre blanc sur l'analyse de la charge du processeur par Dr. Gunther http://www.teamquest.com/pdfs/whitepaper/ldavg1.pdf
Dans cet article en ligne, Dr. Gunther fouille dans le noyau UNIX pour découvrir comment les moyennes de charge (la Les «triplets LA») sont calculés et dans quelle mesure ils sont appropriés comme mesures de planification de la capacité.
standard
outested
valeur. Cela dépend de la charge de travail attendue de votre serveur. Si vous vous attendez à une charge élevée, vous devez augmenter les valeurs. Sinon, votre serveur apparaîtra toujours dans un état critique.