Linux: découvrez quel processus utilise toute la RAM?


106

Avant de demander, juste pour être clair: oui, je connais le cache disque, et non, ce n'est pas mon cas :) Désolé, pour ce préambule :)

J'utilise CentOS 5. Toutes les applications du système échangent beaucoup, et le système est très lent. Quand je fais free -m, voici ce que j'ai eu:

             total       used       free     shared    buffers     cached
Mem:          3952       3929         22          0          1         18
-/+ buffers/cache:       3909         42
Swap:        16383         46      16337

Donc, je n'ai en fait que 42 Mo à utiliser! Pour autant que je sache, -/+ buffers/cache en fait, ne compte pas le cache disque, je n'ai donc que 42 Mo, n'est-ce pas? J'ai pensé que je pouvais me tromper, alors j'ai essayé de désactiver la mise en cache du disque et cela n'a eu aucun effet - l'image est restée la même.

Alors, j’ai décidé de trouver qui utilise toute ma mémoire vive, et j’ai utilisé top pour ça. Mais, apparemment, il indique qu'aucun processus n'utilise ma RAM. Le seul processus dans mon top est MySQL, mais il utilise 0,1% de RAM et 400 Mo de swap. Même image lorsque j'essaie d'exécuter d'autres services ou applications - tous sont échangés, top montre que MEM n'est pas utilisé (0,1% maximum pour tous les processus).

top - 15:09:00 up  2:09,  2 users,  load average: 0.02, 0.16, 0.11
Tasks: 112 total,   1 running, 111 sleeping,   0 stopped,   0 zombie
Cpu(s):  0.0%us,  0.0%sy,  0.0%ni,100.0%id,  0.0%wa,  0.0%hi,  0.0%si,  0.0%st
Mem:   4046868k total,  4001368k used,    45500k free,      748k buffers
Swap: 16777208k total,    68840k used, 16708368k free,    16632k cached

  PID USER      PR  NI  VIRT  RES  SHR S %CPU %MEM    TIME+  SWAP COMMAND
 3214 ntp       15   0 23412 5044 3916 S  0.0  0.1   0:00.00  17m ntpd
 2319 root       5 -10 12648 4460 3184 S  0.0  0.1   0:00.00 8188 iscsid
 2168 root      RT   0 22120 3692 2848 S  0.0  0.1   0:00.00  17m multipathd
 5113 mysql     18   0  474m 2356  856 S  0.0  0.1   0:00.11 472m mysqld
 4106 root      34  19  251m 1944 1360 S  0.0  0.0   0:00.11 249m yum-updatesd
 4109 root      15   0 90152 1904 1772 S  0.0  0.0   0:00.18  86m sshd
 5175 root      15   0 90156 1896 1772 S  0.0  0.0   0:00.02  86m sshd

Redémarrer n’aide pas et, à leur manière, c’est très lente, ce que je ne m'attendrais pas normalement sur cette machine (4 cœurs, 4 Go de RAM, RAID1).

Donc, avec cela - je suis à peu près sûr que ce n'est pas un cache de disque, qui utilise la RAM, car normalement, il aurait dû être réduit et laisser les autres processus utiliser la RAM plutôt que de passer à l'échange.

Donc, pour finir, la question est la suivante: si quelqu'un a des idées, comment savoir quel processus utilise réellement la mémoire de manière aussi importante?


1
Avez-vous déjà trouvé la réponse à cela?
Hackeron

@Hackeron: OP accepté cette réponse . Je sais que cette réponse ne répond pas ta question , bien que. J'ai pu reproduire votre problème sur l'un de mes serveurs et je cherche actuellement un moyen de le résoudre.
Deltik

@ Deltik Ah, d'accord. Merci :) - J'ai 2 serveurs ici qui perdent toute la mémoire disponible en environ 12 heures, faites-moi savoir si je peux faire quelque chose pour aider à diagnostiquer cela. Je suis joignable sous le pseudo "hackeron" sur IRC (irc.freenode.org).
Hackeron

@Hackeron: Je n'ai pas pu vous trouver en tant que "hackeron" sur irc.freenode.org. J'ai créé un salle de discussion pour une discussion prolongée ici .
Deltik

Réponses:


95

Sur Linux dans le top processus, vous pouvez appuyer sur < touche pour décaler le tri de l'affichage de sortie vers la gauche. Par défaut, il est trié par le %CPU donc, si vous appuyez 4 fois sur la touche, vous pourrez le trier par VIRT qui est la taille de la mémoire virtuelle vous donnant votre réponse.

Une autre façon de faire est:

ps -e -o pid,vsz,comm= | sort -n -k 2

devrait vous donner et la sortie triée par processus taille virtuelle.

Voici la version longue:

ps --everyone --format=pid,vsz,comm= | sort --numeric-sort --key=2

Ça me donne Warning: bad ps syntax, perhaps a bogus '-'? See http://procps.sf.net/faq.html sur le serveur Ubuntu 11.10.
Der Hochstapler

1
@OliverSalzburg Le problème est -o options. RHEL4 cela fonctionne. RHEL5: ps -e -o pid,vsz,comm= | sort -n -k 2 travaux. Je vais essayer 11h10 plus tard ce soir, mais si vous trouvez les bonnes options de tri, merci de me le faire savoir. ps -e -o pid,vsz,comm | sort -n -k 2 pourrait fonctionner mais je n'ai pas d'endroit à vérifier pour le moment.
Karlson

2
Je ne connais pas vraiment le -ef option. Mais cela semble produire un résultat raisonnable: sudo ps axo pid,vsz,comm=|sort -n -k 2
Der Hochstapler

@ OliverSalzburg Désolé. Modifié (je pensais déjà l'avoir changé). CA devrait etre ps -e ou ps -a
Karlson

1
Ty, j'aime la suggestion supérieure de < Je ne savais pas que c'était possible, fedora
SSH This

56

Affiche la mémoire des processus en mégaoctets et le chemin du processus.

ps aux  | awk '{print $6/1024 " MB\t\t" $11}'  | sort -n

7
Bienvenue sur Super User. Pouvez-vous développer votre réponse pour expliquer ce que fait ce code et comment il résout le problème? Le code inexpliqué est découragé parce qu’il n’enseigne pas la solution. Merci.
fixer1234

7
Je suis surpris que cette réponse ait été rejetée et qu'un commentaire vous demande de l'expliquer. Elle est suffisamment courte pour indiquer clairement ce qu'elle fait (canalne les ps aux dans awk, puis triez), et dans le contexte de la question, quels processus utilisent le plus de RAM. Je pense que c'est une bonne réponse.
John

13

Juste une note sur un serveur présentant les mêmes symptômes, mais toujours épuisée par la mémoire. Ce qui a fini par trouver était un sysctl.conf à partir d’une boîte avec 32 Go de RAM et la configuration d’une base de données avec des pages énormes configurées à 12 000. Cette boîte n’ayant que 2 Go de RAM, elle assignait toute la RAM libre aux 960 d'entre eux). La définition d’énormes pages à 10, aucune d’elles n’ayant été utilisée, libère toute la mémoire.

Une vérification rapide de / proc / meminfo pour rechercher les paramètres HugePages_ peut être un bon début pour dépanner au moins un bourreau de mémoire inattendu.


2
J'ai récemment eu un autre serveur où c'était le problème. Si votre organisation compte des employés ex-Oracle, ce paramètre peut être votre coupable.
fields

2

Vous pouvez également utiliser la commande ps pour obtenir plus d'informations sur le processus.

ps aux | less

Par curiosité, quel est le bon moyen d'échapper à cette commande? Il montre END quand je parviens à la dernière ligne, il ne tue pas le processus lorsque je le touche Ctrl + C.
KingsInnerSoul

1
@KingsInnerSoul appuyez sur 'q'
enobayram

1

Je référence ce et Mémoire totale utilisée par le processus Python? - débordement de pile , voilà ma réponse. Je reçois maintenant un outil de comptage de processus spécifique (python).

# Megabyte.
$ ps aux | grep python | awk '{sum=sum+$6}; END {print sum/1024 " MB"}'
87.9492 MB

# Byte.
$ ps aux | grep python | awk '{sum=sum+$6}; END {print sum " KB"}'
90064 KB

Joignez ma liste de processus.

$ ps aux  | grep python
root       943  0.0  0.1  53252  9524 ?        Ss   Aug19  52:01 /usr/bin/python /usr/local/bin/beaver -c /etc/beaver/beaver.conf -l /var/log/beaver.log -P /var/run/beaver.pid
root       950  0.6  0.4 299680 34220 ?        Sl   Aug19 568:52 /usr/bin/python /usr/local/bin/beaver -c /etc/beaver/beaver.conf -l /var/log/beaver.log -P /var/run/beaver.pid
root      3803  0.2  0.4 315692 36576 ?        S    12:43   0:54 /usr/bin/python /usr/local/bin/beaver -c /etc/beaver/beaver.conf -l /var/log/beaver.log -P /var/run/beaver.pid
jonny    23325  0.0  0.1  47460  9076 pts/0    S+   17:40   0:00 python
jonny    24651  0.0  0.0  13076   924 pts/4    S+   18:06   0:00 grep python

Référence


1

Dans mon cas, le problème était que le serveur était un serveur virtuel VMware avec vmw_balloon module activé:

$ lsmod | grep vmw_balloon
vmw_balloon            20480  0
vmw_vmci               65536  2 vmw_vsock_vmci_transport,vmw_balloon

Fonctionnement:

$ vmware-toolbox-cmd stat balloon
5189 MB

Ainsi, environ 5 Go de mémoire ont en fait été récupérés par l'hôte. Donc, malgré le fait d'avoir officiellement 8 Go sur ma machine virtuelle, en pratique, c'était beaucoup moins:

$ free
              total        used        free      shared  buff/cache   available
Mem:        8174716     5609592       53200       27480     2511924     2458432
Swap:       8386556        6740     8379816

0

Faire un script appelé show-memory-usage.sh avec contenu:

#!/bin/sh
ps -eo rss,pid,user,command | sort -rn | head -10 | awk '{ hr[1024**2]="GB"; hr[1024]="MB";
 for (x=1024**3; x>=1024; x/=1024) {
 if ($1>=x) { printf ("%-6.2f %s ", $1/x, hr[x]); break }
 } } { printf ("%-6s %-10s ", $2, $3) }
 { for ( x=4 ; x<=NF ; x++ ) { printf ("%s ",$x) } print ("\n") }
 '

5
Pourquoi? Qu'est-ce que cela fait? Comment ça marche? Ne dites pas aux gens d'exécuter du code au hasard; expliquer son but et son fonctionnement.
a CVn

2
Je vais expliquer le code pour ceux qui ne comprennent pas, car il semble pouvoir être exécuté en toute sécurité, mais le vote négatif peut éloigner ceux sur lesquels il serait utile. Il exécute la même commande que dans ci-dessus réponses , mais cela ajoute le formatage avec AWK. Personnellement, je n'ai pas exécuté le script car je ne l'utilise pas, mais l'expliquer aide ceux qui ont besoin d'un formatage.
Dooley_labs
En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.