J'ai utilisé munin sur plusieurs serveurs pendant de nombreuses années avec beaucoup de succès, mais avec plus de 100 nœuds munin et lorsqu'il y a une charge sur les clients, le traitement arrive à expiration.
J'ai apporté des changements d'échelle au travail cron, au nombre de processus clients et réduit le nombre de plugins en cours d'exécution, etc. mais j'ai décidé de chercher une alternative qui a une architecture plus évolutive.
Toutes suggestions ou expériences seraient les bienvenues. Je suis essentiellement intéressé par les métriques du serveur qui peuvent être utilisées pour la planification de la capacité et le diagnostic de l'utilisation des ressources. (nous avons des nagios pour alerter)