Quels sont vos plugins Nagios les plus utiles / précieux? [fermé]


33

Nous étendons notre configuration de Nagios 3 et rencontrons fréquemment de nouveaux plug-ins NRPE ou Nagios généraux pour tester notre infrastructure existante. C’est pourtant au compte-gouttes - il serait utile d’obtenir un résumé des plugins que les utilisateurs de Nagios ont le plus à offrir.

Veuillez répertorier un seul plugin par publication, de préférence avec une brève description de pourquoi vous l'aimez et un lien vers le site MonitoringExchange ou le développeur. De cette façon, les gens peuvent voter pour les plugins déjà listés et nous pouvons les voir dans un ordre préférentiel.

Il serait préférable de ne pas répertorier les plugins que d'autres ont déjà mentionnés, pour la même raison. Si vous avez d'autres choses à ajouter concernant un plugin répertorié par une autre personne, veuillez laisser un commentaire sur sa réponse.

Merci!

Réponses:


8

En termes de flexibilité, vous ne pouvez pas battre le plugin snmp. C’est derrière presque toutes les vérifications que je fais, et si ce n’est pas le cas, la connexion TCP l’est.


À ce stade, Matt (et d’autres :): avez-vous des techniques spéciales que vous utilisez avec? Mon principal atout avec net-snmpd pour le moment est la complexité de la «nouvelle» fonctionnalité d’extension plutôt que d’exec - check_snmpd gère-t-il bien cette situation?
Mike Pountney

7

Nos plugins les plus utiles sont ceux qui testent la fonctionnalité de notre application supérieure. Par exemple, nous avons des tests qui tentent de se connecter au site Web et des tests qui consistent à envoyer un courrier électronique et à cocher la case Vérifier une boîte mail pop3 pour s'assurer de son arrivée. Si l'une de ces choses se casse, nous pouvons utiliser des contrôles de niveau inférieur pour voir ce qui ne va pas. La pop3 est-elle morte? le MTA, le MDA? Le serveur de base de données? le datastore?


Wotcha Dave;) Avez-vous des conseils sur la manière de relier les contrôles de niveau supérieur et inférieur? Par exemple, comment créez-vous une dépendance entre l'envoi d'un courrier électronique et la case à cocher de la case pop3 pour voir s'il est là? Est-il possible de le faire uniquement via Nagios ou utilisez-vous votre propre logique?
Mike Pountney

Êtes-vous vraiment debout à 4h du matin? :) Nagios a des dépendances de service, vous pouvez donc faire en sorte que la vérification de votre courrier électronique dépende des vérifications SMTP, MDA et POP3, mais cela signifie simplement que la vérification de la messagerie électronique ne vous avertit pas si les vérifications de niveau inférieur le font. Cela devient beaucoup plus difficile si vous avez un cluster de serveurs fournissant un service car il n'y a aucun moyen de dire "ne nous alerte pas pour ce service si tous ces services sont morts". Habituellement, nous nous contentons de savoir comment le système s'intègre pour savoir où sont les problèmes.
David Pashley

7

Honnêtement, celui qui fait le plus pour moi est un peu vieux check_disk. Rien ne me fait me sentir si spécial, de cette façon "arrête de manger de la pâte", comme si un serveur qui fonctionnait bien exploserait hier, courait comme un fou, et découvre que c'est parce que j'ai laissé les disques se remplir. Ne jamais avoir à refaire ça dans ma vie vaut beaucoup pour moi.

(Et n'oubliez pas de vérifier les inodes, aussi, les enfants qui regardent à la maison.)


7

WebInject est très utile pour surveiller des sites Web si vous voulez aller au-delà de la fonctionnalité check_http. il peut gérer les pages de connexion et effectuer plusieurs étapes en une vérification Nagios.


4

Je trouve que check_nfsmount est utile sur beaucoup de mes serveurs.

Edit: Je voterais aussi check_snmp si j'avais le représentant pour le faire. Il est utilisé sur tous mes serveurs, ainsi que la logique sous-jacente à check_hpjd, qui est exécutée sur toutes mes imprimantes HP.


4

Mon plus utile est celui que j'ai moi-même écrit et qui vérifie les certificats SSL sur nos serveurs Web afin que je puisse garder un œil sur la date d'expiration.


Est-ce posté quelque part?
RainyRat

4
check_http -H www.verisign.com -C 14
wittwerch le

4

PNP (pnp4nagios.org) - génère des graphiques de style RRD pour tout contrôle Nagios qui produit perf. Les données. Très utile, surtout pour essayer de convaincre les développeurs que ce service nouvellement installé est vraiment la cause de tous ces pics de processeur ...


3

check_nt (parler à NSClient ou à quelque chose de similaire sur le sujet) vous permet d'interroger WMI sur un ordinateur Windows. S'il existe un compteur de performance, vous pouvez désormais le contrôler avec Nagios.


Et vous pouvez surveiller tous vos services en cours d'exécution, par exemple vérifier que Exchange ou le serveur SQL sont en cours d'exécution
Simon Foster

2

Il s’agit là d’une fiche éhontée, mais si vous surveillez les machines Windows à l’aide de NRPE, NagiosPluginsNT semble plutôt bien fonctionner. ;-)


2

Je conviens que check_snmp est un plugin extrêmement précieux; il peut être utilisé à presque toutes les fins et tout est indiqué dans SNMP en général. SNMP est disponible sur des systèmes aussi divers que HP-UX, Tru64 et OpenVMS, sans aucune installation supplémentaire.

Un autre plugin (pas tout à fait) très utile est NagiosGrapher; J'ai mon expérience dans un article qui explique plus, mais aussi pour que d'autres puissent l'utiliser sans les difficultés que j'ai rencontrées.

Un dernier: NSCA. Vous pouvez écrire un script Perl, Ruby ou ksh et alimenter la sortie en NSCA.

Entre les flexibiités de NSCA et SNMP combinées aux rapports de NagiosGrapher, cela devrait très bien élargir votre surveillance.


2

J'aime check_http pour vérifier que mes sites Web fonctionnent toujours. Je l’ai développé pour vérifier que certains textes y figurent après qu’une fois ma société d’hébergement a décidé de servir des pages vierges et que mes vérifications nagios soient toutes passées, le serveur fonctionnant toujours.


2

Le plus utile pour moi est celui que j'ai écrit pour mes besoins: nagios-check-web page

Il télécharge une page entière avec js / css / images, avec multi-threads et gzip (économiser beaucoup de bande passante), à ​​la manière de vrais navigateurs.


+1 En effet, ce plugin est génial. Utilisation pour l'application. 4 mois maintenant.
Henk

1

Le numéro un est NagiosWSC Il vous permet d'effectuer une surveillance sans agent des hôtes Windows via WMI.


sans agent, mais avec un seul point d'échec, beurk.
Toto

1

Celui qui vérifie la latence réelle pour extraire les sites Web et l’analyse pour une balise masquée «status: ok». Il y avait un problème avec notre cache de calmar et un problème de langue qui ne se produisait que toutes les quelques nuits à 3 heures du matin lorsque quelqu'un visitait le site avec un navigateur qui demandait une version de la page internationalisée en turc.

Sérieusement, configurez tous les types de surveillance possibles. Les bogues et erreurs étranges que vous pouvez détecter dans un environnement complexe avec une surveillance efficace sont tout simplement incroyables. Enregistrez également vos données de performance dans une base de données rrd et affichez-les dans Cacti.


1

L'un des plugins les plus importants est celui que j'ai écrit moi-même: check_rdiff_backup. Je fais des sauvegardes à l'étranger et Nagios me dit si quelque chose leur arrive.

Si vous recherchez un plugin rdiff-backup, vous en trouverez un sur Google.


1
En connaissez-vous un pour rsnapshot?
Rory

1

check_curl a été pour moi une aubaine. Nous avons vraiment fait une différence en termes de flexibilité avec les vérifications de sites Web, et nous l'avons également trouvé beaucoup plus facile que Webinject, avec presque toutes les fonctionnalités dont j'avais besoin


1

Ce n'était pas strictement un plugin, mais le fait d'utiliser twurl ( https://github.com/marcel/twurl ) comme moyen de déclencher des alertes était une aubaine absolue. Pas besoin d'alertes par SMS et tout simplement satisfaisant.

Détails sur la manière dont cela a été fait: alertes Nagios utilisant Twitter (avec twurl) sans déclencher - excuses pour la promotion éhontée de soi;)

Autres choses...

Check_diskio ( https://trac.id.ethz.ch/projects/nagios_plugins/wiki/check_diskio ) a été incroyablement utile en conjonction avec les vérifications standard de la charge de la CPU et du nombre de processus pour déterminer quand / si l'IO est lié et de quelle manière. . Utiliser nagiosgraph ( http://exchange.nagios.org/directory/Addons/Graphing-and-Trending/nagiosgraph/details ) facilite encore plus les choses.





0

C'est une sorte de tricherie, car j'ai beaucoup de développement dessus, et elle vérifie en fait beaucoup de choses différentes en même temps, mais le plugin nagios le plus utile pour moi est Resmon . C'est un agent que vous exécutez sur le serveur lui-même, et Nagios se connecte via http pour effectuer les vérifications. Je suppose que cela ressemble à ce que fait nPRe, mais avec un certain nombre de décisions de conception différentes.


0

J'avais utilisé deux plugins. L'un consistait à fournir un flux XML des alertes et l'autre à envoyer des alertes via Twitter. Les deux étaient utiles (en dehors des plugins réguliers). si vous comptez NRPE comme un plugin, ajoutez-le aussi.


0

check_apt est vraiment cool et me rappelle la mise à jour de mes serveurs Debian.


0

Récemment, j'ai commencé à utiliser le plugin check_multi , en utilisant un NRPE patché / amélioré pour une sortie volumineuse (en raison d'informations HTML et de performances).
C'est presque "un plugin pour les gouverner tous"! ;-)

En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.