Comparaison dans le temps des solutions présentées (pas une réponse)
L'efficacité des réponses n'est pas importante. Néanmoins, après l’approche @josephwb, j’ai essayé de chronométrer toutes les réponses présentées.
J'utilise comme entrée la traduction portugaise de Victor Hugo "Les Misérables" (grand livre!) Et compte les occurrences de "a". Mon édition a 5 volumes, plusieurs pages ...
$ wc miseraveis.txt
29331 304166 1852674 miseraveis.txt
Les réponses en C ont été compilées avec gcc, sans optimisation.
Chaque réponse a été exécutée 3 fois et choisissez le meilleur.
Ne faites pas trop confiance à ces chiffres (ma machine effectue d'autres tâches, etc.). Je partage ces moments avec vous, car j’ai eu des résultats inattendus et je suis sûr que vous en trouverez d’autres ...
- 14 des 16 solutions chronométrées ont pris moins de 1 s; 9 moins de 0,1, beaucoup d'entre eux utilisant des tuyaux
- 2 solutions, utilisant bash ligne par ligne, ont traité les 30k lignes en créant de nouveaux processus et calculent la solution correcte en 10s / 20s.
grep -oP a
est l'arbre fois plus vite que grep -o a
(10; 11 vs 12)
- La différence entre C et les autres n'est pas si grande que ce à quoi je m'attendais. (7; 8 vs 2; 3)
- (conclusions bienvenues)
(résultats dans un ordre aléatoire)
=========================1 maxschlepzig
$ time sed 's/[^a]//g' mis.txt | awk '{print length}' > a2
real 0m0.704s ; user 0m0.716s
=========================2 maxschlepzig
$ time tr -d -c 'a\n' < mis.txt | awk '{ print length; }' > a12
real 0m0.022s ; user 0m0.028s
=========================3 jjoao
$ time perl -nE 'say y!a!!' mis.txt > a1
real 0m0.032s ; user 0m0.028s
=========================4 Stéphane Gimenez
$ function countchar(){while read -r i; do echo "$i"|tr -dc "$1"|wc -c; done }
$ time countchar "a" < mis.txt > a3
real 0m27.990s ; user 0m3.132s
=========================5 Loki Astari
$ time awk -Fa '{print NF-1}' mis.txt > a4
real 0m0.064s ; user 0m0.060s
Error : several -1
=========================6 enzotib
$ time awk '{ gsub("[^a]", ""); print length }' mis.txt > a5
real 0m0.781s ; user 0m0.780s
=========================7 user606723
#include <stdio.h> #include <string.h> // int main(int argc, char *argv[]) ... if(line) free(line); }
$ time a.out a < mis.txt > a6
real 0m0.024s ; user 0m0.020s
=========================8 maxschlepzig
#include <stdio.h> // int main(int argc, char **argv){if (argc < 2 || !*argv[1]) { ... return 0; }
$ time a.out a < mis.txt > a7
real 0m0.028s ; user 0m0.024s
=========================9 Stéphane Chazelas
$ time awk '{print gsub(/a/, "")}'< mis.txt > a8
real 0m0.053s ; user 0m0.048s
=========================10 josephwb count total
$ time grep -o a < mis.txt | wc -w > a9
real 0m0.131s ; user 0m0.148s
=========================11 Kannan Mohan count total
$ time grep -o 'a' mis.txt | wc -l > a15
real 0m0.128s ; user 0m0.124s
=========================12 Kannan Mohan count total
$ time grep -oP 'a' mis.txt | wc -l > a16
real 0m0.047s ; user 0m0.044s
=========================13 josephwb Count total
$ time perl -ne '$x+=s/a//g; END {print "$x\n"}'< mis.txt > a10
real 0m0.051s ; user 0m0.048s
=========================14 heemayl
#!/usr/bin/env python2 // with open('mis.txt') as f: for line in f: print line.count('"')
$ time pyt > a11
real 0m0.052s ; user 0m0.052s
=========================15 enzotib
$ time while IFS= read -r line; do line="${line//[!a]/}"; echo "${#line}"; done < mis.txt > a13
real 0m9.254s ; user 0m8.724s
=========================16 bleurp
$ time awk ' {print (split($0,a,"a")-1) }' mis.txt > a14
real 0m0.148s ; user 0m0.144s
Error several -1