Connexes, mais pas de réponses satisfaisantes: Comment puis-je diviser un gros fichier texte en morceaux de 500 mots environ?
J'essaie de prendre un fichier texte ( http://mattmahoney.net/dc/text8.zip ) avec> 10 ^ 7 mots tous sur une seule ligne, et de le diviser en lignes de N mots chacune. Mon approche actuelle fonctionne, mais est assez lente et laide (en utilisant un script shell):
i=0
for word in $(sed -e 's/\s\+/\n/g' input.txt)
do
echo -n "${word} " > output.txt
let "i=i+1"
if [ "$i" -eq "1000" ]
then
echo > output.txt
let "i=0"
fi
done
Des conseils sur la façon de rendre cela plus rapide ou plus compact?