Existe-t-il une commande Linux pouvant être utilisée pour échantillonner un sous-ensemble de fichier? Par exemple, un fichier contient un million de lignes et nous voulons échantillonner de manière aléatoire seulement mille lignes de ce fichier.
Pour aléatoire, je veux dire que chaque ligne a la même probabilité d'être choisie et qu'aucune des lignes choisies n'est répétitive.
head
et tail
peut choisir un sous-ensemble du fichier mais pas au hasard. Je sais que je peux toujours écrire un script python pour le faire, mais je me demandais simplement s'il existait une commande pour cet usage.