J'ai un fichier .csv qui a certaines valeurs formatées comme des paragraphes avec des sauts de ligne ou parfois des puces.
"STAT","ID","DESC"
"UPD", "1", "Updated"
"CHG", "2", "Changed"
"UPD", "3", "Updated.
Might have to update again"
"UPD", "4", "Updated.
- once
- twice
- thrice
"
"DEL", "5", "unknown"
"DEL", "6", "Deleted
Need to restore"
J'ai besoin de compter le nombre d'enregistrements, utilisé par awk comme ci-dessous puisque je savais que la 2e colonne était un identifiant unique mais renvoyait plus que le mien. Le texte ci-dessus est bien sûr un mannequin, car je ne suis pas autorisé à partager l'original mais j'ai essayé de réfléchir aussi fidèlement que possible.
awk '{print $2}' FS="," sample.csv | wc -l
J'ai même imprimé la première colonne en utilisant awk '{print $ 1}' pour vérifier uniquement les valeurs de la première colonne, mais la sortie affiche les parties de départ de la nouvelle ligne dans les paragraphes.
S'il vous plaît laissez-moi savoir si des informations supplémentaires sont nécessaires et je mettrai à jour la question.