Oui, c'est un problème, principalement à cause de la taille croissante des disques. La plupart des disques SATA ont un taux URE (erreur de lecture non corrigible) de 10 ^ 14. Ou pour chaque 12 To de données lues de manière statistique, le fabricant du lecteur indique que celui-ci renverra un échec de lecture (vous pouvez normalement les rechercher dans les feuilles de spécifications du lecteur). Le lecteur continuera à fonctionner correctement pour toutes les autres parties du lecteur. Les disques Enterprise FC et SCSI ont généralement un taux URE de 10 ^ 15 (120 To) avec un petit nombre de disques SATA, ce qui contribue à le réduire.
Je n'ai jamais vu de disques s'arrêter de tourner exactement au même moment, mais un volume raid5 s'est heurté à ce problème (il y a 5 ans, avec des disques PATA grand public à 5 400 tr / min). Le disque tombe en panne, il est marqué comme mort et une reconstruction est effectuée sur le disque de secours. Le problème est que lors de la reconstruction, un deuxième lecteur est incapable de lire ce petit bloc de données. En fonction de qui fait le raid, le volume entier peut être mort ou tout simplement ce petit bloc peut être mort. En supposant que seul un bloc soit mort, si vous essayez de le lire, vous obtiendrez une erreur, mais si vous y écrivez, le lecteur le remappera à un autre emplacement.
Il existe plusieurs méthodes de protection: raid6 (ou équivalent), qui protège mieux contre la double panne de disque, d'autres sont des systèmes de fichiers sensibles à l'URA tels que ZFS, qui utilisent des groupes de raid plus petits, ce qui vous laisse statistiquement moins de risques de toucher le lecteur URE. Les limites (lecteurs de grande taille ou disques RAID5 plus petits), le nettoyage de disque et SMART aident également, mais ne constituent pas vraiment une protection en soi, mais sont utilisés en plus de l’une des méthodes ci-dessus.
Je gère près de 3 000 piles dans les tableaux, et ces derniers nettoient constamment les lecteurs à la recherche d’URC latentes. Et j'en reçois un flux assez constant (chaque fois qu'il en trouve un, il le répare avant la panne du disque et m'avertit), si j'utilisais raid5 au lieu de raid6 et que l'un des disques était complètement mort ... être en difficulté si elle frappe certains endroits.