[root@server]# awk '!seen[$0]++' out.txt > cleaned
awk: (FILENAME=out.txt FNR=8547098) fatal error: internal error
Aborted
[root@server]#
Le "" serveur "" a: 8 Go de RAM + 16 Go de SWAP, x> 300 Go d'espace libre, amd64, CPU de bureau. Scientific Linux 6.6. Rien d'autre ne tourne dessus pour faire de la CHARGE. Awk s'interrompt après quelques secondes. Out.txt fait ~ 1,6 Go. GNU Awk 3.1.7.
Question : Comment puis-je supprimer les lignes en double tout en conservant l'ordre des lignes? La casse est aussi importante, ex: "A" et "a" sont deux lignes différentes, faut la garder. Mais "a" et "a" est en double, seul le premier est nécessaire.
La réponse pourrait être dans n'importe quoi .. si awk n'est pas bon pour cela .. alors perl / sed .. quel pourrait être le problème?
[root@server]# ulimit -a
core file size (blocks, -c) 0
data seg size (kbytes, -d) unlimited
scheduling priority (-e) 0
file size (blocks, -f) unlimited
pending signals (-i) 61945
max locked memory (kbytes, -l) 99999999
max memory size (kbytes, -m) unlimited
open files (-n) 999999
pipe size (512 bytes, -p) 8
POSIX message queues (bytes, -q) 819200
real-time priority (-r) 0
stack size (kbytes, -s) 99999999
cpu time (seconds, -t) unlimited
max user processes (-u) 61945
virtual memory (kbytes, -v) unlimited
file locks (-x) unlimited
[root@server]#
Mise à jour: J'ai essayé cela sur une machine RHEL, cela n'interrompt pas, mais je n'ai pas eu le temps d'attendre qu'elle se termine. Pourquoi SL SL Linux ne diffère-t-il pas de RHEL?
Mise à jour: J'essaie un gues virtuel Ubuntu 14 .. jusqu'à présent ça marche! Ce n'est pas un problème ultime : mawk 1.3.3
root@asdf-VirtualBox:~# ulimit -a
core file size (blocks, -c) 0
data seg size (kbytes, -d) unlimited
scheduling priority (-e) 0
file size (blocks, -f) unlimited
pending signals (-i) 51331
max locked memory (kbytes, -l) 64
max memory size (kbytes, -m) unlimited
open files (-n) 1024
pipe size (512 bytes, -p) 8
POSIX message queues (bytes, -q) 819200
real-time priority (-r) 0
stack size (kbytes, -s) 8192
cpu time (seconds, -t) unlimited
max user processes (-u) 51331
virtual memory (kbytes, -v) unlimited
file locks (-x) unlimited
root@asdf-VirtualBox:~#
awk
versions sur deux machines?
out.txt
? La même commande fonctionne-t-elle si vous l'essayez sur un fichier plus petit? Combien d'utilisateurs sur la machine? Y avait-il suffisamment de mémoire disponible pour le processus? Y a-t-il quelque chose de spécial à propos de la ligne 8547098 du fichier d'entrée?