J'ai une sortie sous la forme de:
count id type
588 10 | 3
10 12 | 3
883 14 | 3
98 17 | 3
17 18 | 1
77598 18 | 3
10000 21 | 3
17892 2 | 3
20000 23 | 3
63 27 | 3
6 3 | 3
2446 35 | 3
14 4 | 3
15 4 | 1
253 4 | 2
19857 4 | 3
1000 5 | 3
...
Ce qui est assez désordonné et doit être nettoyé au format CSV afin que je puisse le donner à un gestionnaire de projet pour lui la feuille de calcul.
Le cœur du problème est le suivant: j'ai besoin que la sortie de ceci soit:
id, sum_of_type_1, sum_of_type_2, sum_of_type_3
Un exemple de ceci est l'ID "4":
14 4 | 3
15 4 | 1
253 4 | 2
19857 4 | 3
Cela devrait plutôt être:
4,15,253,19871
Malheureusement, je suis assez nul à ce genre de chose, j'ai réussi à nettoyer toutes les lignes et à les convertir en CSV, mais je n'ai pas pu dédupliquer et grouper les lignes. En ce moment, j'ai ceci:
awk 'BEGIN{OFS=",";} {split($line, part, " "); print part[1],part[2],part[4]}' | awk '{ gsub (" ", "", $0); print}'
Mais tout ce que cela fait, c'est nettoyer les caractères de déchets et réimprimer les lignes.
Quelle est la meilleure façon de masser les lignes dans la sortie mentionnée ci-dessus?