Lors de l'installation de munin, il active un ensemble de plugins par défaut (au moins sur ubuntu). Alternativement, vous pouvez simplement exécuter munin-node-configure
pour déterminer quels plugins sont pris en charge sur votre système. La plupart de ces plugins tracent des données simples. Ma question n'est pas d'expliquer la nature des données (enfin ... peut-être pour certains) mais qu'est -ce que vous recherchez dans ces graphiques?
Il est facile d'installer munin et de voir des graphiques fantaisistes. Mais avoir les graphiques et ne pas pouvoir les "lire" les rend totalement inutiles.
Je vais lister les plugins standard qui sont activés par défaut sur mon système. Ce sera donc une longue liste. Par souci d'exhaustivité, je vais également énumérer les plugins que je pense comprendre et donner une brève explication à quoi je pense qu'il est utilisé. Veuillez corriger si je me trompe avec l'un d'eux.
Permettez-moi donc de diviser ces questions en trois parties:
- Plugins où je ne comprends même pas les données
- Plugins où je comprends les données mais ne sais pas ce que je dois rechercher
- Plugins que je pense comprendre
Plugins où je ne comprends même pas les données
Ceux-ci peuvent contenir des questions qui ne visent pas nécessairement uniquement Munin. Ne pas comprendre les données signifie généralement une lacune dans les connaissances fondamentales sur les systèmes d'exploitation / le matériel ....;) N'hésitez pas à répondre par une réponse "giyf".
Ce sont des plugins où je ne peux que deviner ce qui se passe ... Je veux à peine regarder ces "devinettes" ...
E / S de disque par périphérique (IO / seconde) Qu'est-ce qu'un IO. Je sais que cela signifie entrée / sortie. Mais c'est aussi loin que ça va.- Latence du disque par périphérique (attente d'E / S moyenne)
Pas la moindre idée de ce qu'est une «attente d'E / S» ... - Temps de service IO
Celui-ci est un énorme gâchis, et il est presque impossible de voir quelque chose dans le graphique.
Plugins où je comprends les données mais ne sais pas ce que je dois rechercher
- IOStat (blocs / seconde lecture / écriture)
Je suppose que la chose à surveiller ici est les pointes? Ce qui signifierait que l'appareil est très utilisé? - Entropie disponible (octets)
Je suppose que cela est important pour la génération de nombres aléatoires? Pourquoi devrais-je représenter cela graphiquement? Jusqu'à présent, la valeur a toujours été presque constante. - VMStat (exécution / processus de veille d'E / S)
Quelle est la différence entre celui-ci et le graphique "processus"? Les deux montrent des processus en cours / en sommeil, tandis que le graphique "Processus" semble avoir plus de détails. - Débit du disque par périphérique (octets / seconde en lecture / écriture)
Quelle est la différence entre celui-ci et le graphique "IOStat"? - utilisation de la table d'inode
Que dois-je rechercher dans ce graphique?
Plugins que je pense comprendre
Je devine certaines choses ici ... corrigez-moi si je me trompe.
- Utilisation du disque en pourcentage (pourcentage)
Combien d'espace disque est utilisé / restant. Comme cela approche les 100%, vous devriez envisager de nettoyer ou d'étendre la partition. Ceci est extrêmement important pour la partition racine. - Débit du pare-feu (paquets / seconde)
Le nombre de paquets passant par le pare-feu. Si cela augmente pendant une période plus longue, cela pourrait être le signe d'une attaque DOS (ou nous recevons simplement un gros fichier). Il peut également vous donner une idée des performances de votre pare-feu. Si cela se stabilise et que vous avez besoin de plus de "puissance", vous devriez envisager un équilibrage de charge. Si cela se stabilise et constate une corrélation avec la charge de votre processeur, cela peut également signifier que votre matériel n'est pas assez rapide. Les corrélations avec l'utilisation du disque peuvent pointer vers des cibles LOG excessives dans votre configuration FW. - Erreurs eth0 (paquets entrants / sortants)
Erreurs réseau. Si cette valeur augmente, cela pourrait être un signe de matériel défectueux. - trafic eth0 (bits / seconde entrée / sortie)
Trafic réseau brut. Cela devrait être en corrélation avec le débit du pare-feu. - nombre de threads
Une valeur toujours croissante peut indiquer qu'un processus ne ferme pas correctement les threads. Enquêter! - processus
Décomposition des processus actifs (y compris le sommeil). Un pic rapide ici pourrait indiquer une fourche-bombe. Une valeur lente, mais toujours croissante, peut indiquer qu'une application génère des sous-processus mais ne les ferme pas correctement. Enquêter en utilisantps faux
. - priorité de processus
Ceci montre la distribution des priorités de processus. Le fait de n'avoir que des processus hautement prioritaires n'est pas très utile. Envisagez de dé-prioriser certains. - utilisation du processeur
Assez simple. Si cela augmente, vous pouvez avoir une attaque en cours ou un processus monopolise le processeur. Si elle augmente lentement et approche le maximum dans les opérations normales, vous devriez envisager de mettre à niveau votre matériel (ou l'équilibrage de charge). - utilisation de la table de fichiers
Nombre de fichiers ouverts activement. Si cela atteint le maximum, vous pouvez avoir un processus d'ouverture, mais pas de libération correcte des fichiers. - moyenne de charge
Affiche une valeur résumée pour la charge du système. Doit correspondre à l'utilisation du processeur. L'augmentation des valeurs peut provenir d'un certain nombre de sources. Recherchez les corrélations avec d'autres graphiques. - utilisation de la mémoire
Une représentation graphique de votre mémoire. Tant que vous avez beaucoup de tampons + cache + inutilisés, tout va bien. - swap in / out
Affiche l'activité sur votre partition de swap. Cela devrait toujours être 0. Si vous voyez de l'activité à ce sujet, vous devez ajouter plus de mémoire à votre machine!