Pour surveiller les statistiques (utilisation de la mémoire, charge, activité mysql, activité apache, etc.), j'utilise Munin . Hors de la boîte, il suit déjà beaucoup de choses et trace des graphiques pour différents intervalles de temps (dernières 24 heures, 7 derniers jours, mois dernier, année dernière). Grâce aux plugins, encore plus de choses peuvent être surveillées. Ses résultats sont des pages HTML avec de jolis graphiques.
Munin a une architecture maître / nœud: les nœuds rassemblent les statistiques sur un serveur et le maître stocke les données et produit du HTML et des graphiques.
J'utilise Monit pour suivre les processus en cours et pour redémarrer ou m'avertir lorsque certaines conditions configurables se présentent (charge élevée du processeur, utilisation importante de la mémoire, absence de réponse HTTP, etc.). Monit peut également surveiller des aspects plus généraux d'un serveur, tels que le processeur. charge, utilisation de la mémoire, statut du disque dur ou utilisation du disque.
Monit doit être configuré pour chaque service ou matériel que vous souhaitez surveiller et savoir comment réagir en cas de problème. Les options les plus utilisées sont de ne rien faire, d'envoyer un e-mail d'alerte ou de redémarrer le service.
Monit est excellent lorsque cela fonctionne, mais parfois, il ne parvient pas à démarrer, arrêter ou redémarrer un service et il n’ya pas beaucoup d’informations de diagnostic disponibles pour vous dire ce qui ne va pas. Cela signifie que vous ne savez pas si le problème vient de votre service ou de la configuration de Monit, qui s'exécute dans un environnement minimal semblable à celui de cron.
Les deux outils sont disponibles par défaut sur la plupart des distributions Linux.