Je cherche un moyen de diagnostiquer des problèmes, tels que la mort par échange, où un processus de mémoire de ballon remplit l'échange et tue toute la machine (comme Apache).
J'utilise déjà des cactus et je peux configurer des nagios (mais je préfère ne pas le faire) ou des munins, mais pour autant que je sache, ils ne peuvent pas enregistrer l'utilisation des programmes individuels - juste le statut général.
Je sais que je peux rouler un script >> dans un fichier toutes les 30 secondes, mais j'aimerais voir si une solution mature existante existe déjà.
Encore une fois, idéalement, cela:
- enregistrer l'utilisation de la mémoire des processus toutes les N secondes
- enregistrer l'utilisation du processeur des processus toutes les N secondes
- graphiques et historique du support
- moyennes de support - comme mysqld a utilisé 43% de CPU au cours du dernier jour et en moyenne 400 Mo de mémoire
- être libre et open source
Les noms des processus ne sont pas et ne devraient pas être connus à l'avance - l'idée est simplement de le laisser surveiller et de jeter un coup d'œil aux principaux délinquants.
Mon système est Linux (OpenSUSE).