Le serveur Zabbix envoie trop de notifications


9

J'ai récemment installé le serveur Zabbix sur un VPS et j'en suis très content. J'ai installé le client sur env. 6-7 autres VPS et tout fonctionne bien. L'interface est fluide et produit de très beaux graphiques.
Mon seul problème avec le logiciel est que je l'ai configuré pour envoyer des notifications sur les problèmes, mais je reçois entre 30 et 60 e-mails chaque jour. Toujours quelque chose le long de "Le serveur XXX est inaccessible: PROBLÈME", et une minute plus tard: "Le serveur XXX est inaccessible: OK". Bien sûr, Zabbix reconnaît également quand il y a de vrais problèmes, et par exemple quand un serveur a été redémarré. Il me semble que Zabbix "abandonne" très rapidement, ou peut-être expire plus vite que ce qui convient à mes besoins. J'ai essayé de google ce problème plusieurs fois, mais j'ai abandonné, alors maintenant j'essaie cette approche.

Quelqu'un sait-il comment ajuster la fidélité de ces notifications / déclencheurs?


utilisez-vous les exemples de modèles par défaut? si tel est le cas, il s'agit très probablement de l'élément "état", qui n'est en fait pas suggéré :) - vous devriez plutôt passer à agent.ping pour vérifier la disponibilité de l'hôte
Richlv

Réponses:


9

https://www.zabbix.com/documentation/1.8/manual/escalations_and_repeated_notifications/delayed_notifications J'utilise la fonctionnalité d'escalade de Zabbix pour supprimer les messages On / Off fréquents. En général:

  • les premiers messages déclenchent une chaîne d'escalade, sans vous envoyer de courrier électronique
  • puis, Zabbix attend 5 minutes (ou ce que vous avez configuré) avant d'envoyer une notification.
  • si au cours de ces 5 minutes, les changements d'état de déclenchement sont désactivés, vous n'obtenez AUCUNE notification et tout redevient normal.
  • Belle partie que le tableau montre encore

Oleg


Merci! Cela ressemble à ce que je cherchais. J'ai ajusté les paramètres et je donne maintenant du temps au système pour voir comment l'envoi de notification est affecté.
anselmdk

Après avoir attendu patiemment (et relâché certains déclencheurs Web), l'emailing Zabbix fonctionne enfin correctement maintenant. Merci pour le conseil!
anselmdk

5

Vous pouvez également ajuster les déclencheurs. J'ai trouvé la méthode count () pratique.
Au lieu de déclencher le dernier (0), essayez plutôt count (300,0, "eq")}> 5. Cela déclenche une exception si les 5 derniers contrôles (en supposant 60 secondes entre les contrôles) ont échoué.

http://www.zabbix.com/documentation/1.8/manual/config/triggers

Vous pouvez également désactiver les messages OK en ajoutant la condition 'Trigger value = "PROBLEM"'. Cette modification doit être effectuée dans la configuration des actions.

http://www.zabbix.com/documentation/1.8/manual/config/actions


2
En fait, votre exemple de comptage renverra le nombre de valeurs des 300 dernières secondes égal à 0. Vous le comparerez ensuite à 5. L'effet global est de déclencher un événement si 5 valeurs "0" ou plus se sont produites au cours des 300 dernières secondes.
G-Wiz
En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.