Les fichiers de courte durée sont-ils vidés sur le disque?


9

Mon programme crée de nombreux petits fichiers de courte durée. Ils sont généralement supprimés dans la seconde qui suit leur création. Les fichiers sont dans un système de fichiers ext4 soutenu par un vrai disque dur. Je sais que Linux vide périodiquement ( pdflush) les pages sales du disque. Étant donné que mes fichiers sont de courte durée, ils ne sont probablement pas mis en cache par pdflush. Ma question est, mon programme provoque-t-il beaucoup d'écritures sur disque? Ma préoccupation est la vie de mon disque dur.

Étant donné que les fichiers sont petits, supposons que la somme de leur taille est inférieure à dirty_byteset dirty_background_bytes.

Ext4 a le journal par défaut activé, c'est-à-dire le journal des métadonnées. Je veux également savoir si les métadonnées ou les données sont écrites sur le disque.


> Mon programme crée de nombreux petits fichiers éphémères, c'est «beaucoup»? Supprimez-vous ces fichiers ou réécrivez-vous des fichiers? > Je veux également savoir si les métadonnées ou les données sont écrites sur le disque. Je crois que le mode de métadonnées par défaut est ordonné, ce qui signifie que les métadonnées sont validées avant que les données ne soient écrites sur le disque. Bien sûr, il existe des options de montage que vous pouvez ajouter pour changer cela. > Ma question est la suivante: mon programme provoque-t-il beaucoup d'écritures sur disque? il est difficile de répondre à l'examen des informations que vous avez fournies. Avez-vous envisagé d'utiliser des outils tels que iotop et sysstat pour surveiller les E / S disque?
AngryWombat

ReiserFS est meilleur pour les petits fichiers si vous voulez vraiment qu'ils atteignent le disque jamais tmpfs est bien si vous ne vous en souciez pas
xenoterracide

Quelques clarifications: (1). le système de fichiers ext4 n'est pas monté avec syncoption. Vous pouvez envisager un Fedora, Debian ou Ubuntu installé par défaut. Vous en choisissez un. (2). Chaque fichier fait environ 60 Ko. (3). Environ 1000 fichiers sont créés et supprimés par seconde, mais pas plus de 10 fichiers existent à tout moment. En d'autres termes, le débit d'E / S est important mais l'espace occupé est petit.
Wu Yongzheng

Réponses:


5

Une expérience simple avec ext4:

Créer une image de 100 Mo ...

# dd if=/dev/zero of=image bs=1M count=100
100+0 records in
100+0 records out
104857600 bytes (105 MB) copied, 0.0533049 s, 2.0 GB/s

Faites-en un appareil en boucle ...

# losetup -f --show image
/dev/loop0

Faire un système de fichiers et monter ...

# mkfs.ext4 /dev/loop0
# mount /dev/loop0 /mnt/tmp

Faites une sorte de course avec des fichiers de courte durée. (Changez ceci pour n'importe quelle méthode que vous préférez.)

for ((x=0; x<1000; x++))
do
    (echo short-lived-content-$x > /mnt/tmp/short-lived-file-$x
     sleep 1
     rm /mnt/tmp/short-lived-file-$x ) &
done

Montez, synchronisez, déverrouillez.

# umount /mnt/tmp
# sync
# losetup -d /dev/loop0

Vérifiez le contenu de l'image.

# strings image | grep short-lived-file | tail -n 3
short-lived-file-266
short-lived-file-895
short-lived-file-909
# strings image | grep short-lived-content | tail -n 3

Dans mon cas, il a répertorié tous les noms de fichiers, mais aucun du contenu du fichier. Donc, seul le contenu n'a pas été écrit.


Bien essayé. Maintenant, je suis convaincu. J'ai également essayé ext2 et obtenu le même résultat que vous. J'ai changé votre charge de travail d'E / S parallèle en une charge séquentielle et j'ai obtenu un fichier de courte durée-999 et 8 contenus de courte durée- *. Quelqu'un at-il une explication?
Wu Yongzheng du

@msw: édité au cas où ce ne serait pas clair. Sinon, veuillez préciser.
frostschutz

C'est idiot. Les fichiers existent simultanément, il n'y avait rien à écraser et les systèmes de fichiers n'écrasent pas le contenu des fichiers supprimés car cela nuirait aux performances. Mais par tous les moyens, utilisez nbdet enregistrez le trafic (ou une méthode similaire de traçage de toutes les écritures).
frostschutz

7

À moins que vous ne parliez d'un disque SSD, un nombre élevé d'écritures sur disque ne sera pas le facteur dominant de la longévité du disque.

Si vous voulez vraiment éviter les écritures sur disque, regardez dans tmpfs ,


2
tmpfs est en effet un bon ajustement dans ce cas, mais je veux toujours savoir, en tant que question générale sur le système d'exploitation, les données sont-elles écrites sur le disque (inutilement)?
Wu Yongzheng

Votre question devrait être beaucoup plus précise que vous ne pouvez probablement formuler pour recevoir une réponse définitive. Le cache tampon sert de médiateur à un compromis compliqué entre performances et persistance auquel il est impossible de répondre dans l'abstrait. En utilisant les outils @AngryWombat répertoriés, vous pouvez mesurer les écritures réelles de votre application spécifique, mais de nombreux facteurs peuvent la faire varier d'une exécution à l'autre.
msw

Eh bien, si pdflush vient après la suppression du fichier. L'écrire serait inutile.
Wu Yongzheng

1

En règle générale, non, ils ne seront pas écrits. En effet, le cache vide les pages sales lorsqu'une des deux conditions est remplie:

  1. Les données sont vieillies après /proc/sys/vm/dirty_writeback_centisecs, ce qui par défaut est de 5 secondes.

  2. Il y a trop peu de mémoire pour le cache pour contenir les données, plus que dirty_ratiodes pages sales dans le cache (par défaut à 20%).

Donc, sur un système avec beaucoup de mémoire libre et peu de trafic d'écriture en dehors de vos petits fichiers supprimés en moins de 5 secondes, les données ne seront pas vidées.


0

Que les fichiers de courte durée soient écrits sur le disque ou non dépend non seulement du comportement par défaut du cache de fichiers du noyau, mais également des détails de l'implémentation du pilote du système de fichiers et des options de montage dudit système de fichiers. Il est possible de configurer le système de telle manière que tout soit toujours immédiatement écrit sur le disque (essentiellement, un comportement de type DOS).

Un système de fichiers, mettant en évidence le comportement qui vous intéresse (appelé "allocation retardée") est XFS. Avec cela, vous pouvez être plus ou moins sûr (étant donné aucune option de configuration amusante ailleurs) que les blocs appartenant aux fichiers juste supprimés seront réutilisés en mémoire, sans accès intermédiaire au disque. XFS peut toujours vouloir mettre à jour son journal de métadonnées (qui sera écrit sur le disque assez fréquemment; pourtant, étant donné que le journal de XFS est uniquement des métadonnées, il est assez petit pour être défini sur un autre appareil rapide, comme la RAM sauvegardée par batterie trouvée sur de nombreux contrôleurs RAID).

En raison de ce comportement, il n'est pas rare de trouver des fichiers complètement remis à zéro, mais sinon légitimes (taille et autres métadonnées intactes) sur un système de fichiers XFS après une coupure de courant soudaine. C'est un coût de prise en charge des opérations de fichiers "semi-temporaires" rapides.

Un peu de théorie

En général, un appel système accédant à un système de fichiers se termine, assez rapidement, par la méthode définie par le pilote du système de fichiers (attachée à "struct inode_operations" et "struct file_operations" lorsque le pilote VFS est enregistré). Ce qui se passe ensuite est laissé à la seule discrétion de l'implémentation du système de fichiers. En règle générale, quelque chose ressemblant à l'approche suivante est utilisé (cet exemple simple provient du pilote Linux FAT):

if (IS_DIRSYNC(dir))
    (void)fat_sync_inode(dir);
else
    mark_inode_dirty(dir);

Si le système de fichiers est monté en mode "sync", toutes les modifications vont immédiatement sur le disque (via fat_sync_inode () dans ce cas). Sinon, le bloc est marqué comme "sale" et reste dans le cache mémoire jusqu'à ce qu'il soit vidé à une occasion raisonnable.

Ainsi, il est impossible de prédire le comportement du système en ce qui concerne les fichiers transitoires sans prendre en compte les options de montage du système de fichiers et inspecter le code source de son implémentation (cela, bien sûr, s'applique principalement à toutes sortes de systèmes de fichiers exotiques principalement trouvés dans l'espace embarqué) .


Merci pour votre réponse. Il semble que ext4 ait également retardé l'allocation. Est-ce à dire que ma réponse est NON? (étant donné aucune option de configuration amusante ailleurs). Est-ce que cela signifie également que ma réponse est OUI si ext2 est utilisé?
Wu Yongzheng

Je pense que même avec ext2 sur le noyau moderne, la réponse sera NON. Ce problème particulier a été beaucoup discuté et un bref coup d'œil à la source du noyau montre que le pilote ext2 s'appuie principalement sur les opérations du noyau "par défaut" pour faire son travail (ainsi, tout est retardé par le cache de bloc). Je suppose que je devrais mettre à jour ma réponse pour inclure des informations supplémentaires.
oakad

Mon ext4 n'est évidemment pas monté en syncoption. Je ne ferais jamais ça.
Wu Yongzheng

Lors du marquage d'un inode sale, je suppose que le système de fichiers est responsable du marquage de la page correspondante sale. Plus tard, lorsque l'inode est supprimé, le système de fichiers nettoie-t-il la page sale? Sinon, les données seront vidées sur le disque inutilement.
Wu Yongzheng

2
Les blocs de données inutilisés sont "libérés", ils cessent donc d'être sales. Si vous avez écrit des trucs à classer, puis que vous les avez tronqués avant de vider, les fichiers indésirables après l'EOF disparaissent (en quelque sorte). Avec les métadonnées, ce n'est peut-être pas aussi simple car il peut y avoir divers compromis concernant l'intégrité des structures de données du système de fichiers. Soit dit en passant, il ne ressort pas clairement de votre question que vous vous attendez toujours à avoir le plein contrôle de votre plate-forme - la plupart des applications finissent généralement par s'exécuter sur des machines de configuration inconnue, loin du développeur.
oakad
En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.