J'ai un fichier texte contenant des tweets et je dois compter le nombre de fois qu'un mot est mentionné dans le tweet. Par exemple, le fichier contient:
Apple iPhone X is going to worth a fortune
The iPhone X is Apple's latest flagship iPhone. How will it pit against it's competitors?
Et disons que je veux compter combien de fois le mot iPhone est mentionné dans le fichier. Voici donc ce que j'ai essayé.
cut -f 1 Tweet_Data | grep -i "iPhone" | wc -l
cela fonctionne certainement, mais je suis confus à propos de la commande «wc» sous unix. Quelle est la différence si j'essaye quelque chose comme:
cut -f 1 Tweet_Data | grep -c "iPhone"
où -c est utilisé à la place? Ces deux résultats différents dans un grand fichier plein de tweets et je suis confus sur la façon dont cela fonctionne. Quelle méthode est la bonne façon de compter l'occurrence?
cut -f1
coupe en fonction des onglets, ce qui ne fait pas grand-chose ici. Êtes-vous sûr quewc -l
cela vous donne vraiment le bon nombre? Il en afficherait 2 ici, mais je compte 3 instances de "iPhone".