Nous avons 3 serveurs dédiés, répartis en plusieurs VPS utilisant openVZ. Nous utilisons munin pour surveiller le VPS avec les sites de production et surveillons l'un des VPS pour nous assurer qu'il redémarre le service en cas d'échec.
La chose est que nous avons besoin d'un bien meilleur moyen de surveiller tous nos serveurs, puisque nous avons jusqu'à 14 VPS, nous aimerions avoir un hub central où nous pourrions voir non seulement les données collectées par munin, mais aussi quelques statistiques supplémentaires sur les réseaux et les performances de nos services.
Certaines de nos exigences:
- Notification SMS en cas d'échec (possibilité de configurer certaines vérifications personnalisées)
- Analyseur de journal pour apache error_log et d'autres.
- Doit être central (c'est-à-dire un serveur et plusieurs nœuds collectant les données).
- Ne doit pas être facile à installer mais facile à entretenir.
- Besoin d'être libre
J'ai été pointé du doigt sur nagios et splunk, qu'en pensez-vous? Merci,