J'ai un disque dans un logiciel RAID-1 à deux disques pour lequel récemment un "secteur non corrigible hors ligne" est apparu dans l'état SMART.
198 Offline_Uncorrectable 0x0030 200 200 000 Old_age Offline - 1
Apparemment, cela n'est un signe de défaillance imminente du disque que s'il se produit de plus en plus fréquemment (et comme le lecteur est en miroir, il n'y a pas non plus de risque réel de perte de données réelle). À l'époque, un auto-test a également échoué à un moment donné et smartd
m'a envoyé un e-mail pour m'en informer, comme cela devrait bien sûr le faire.
Cependant, l'écriture dans le secteur endommagé oblige généralement le disque à utiliser un de ses secteurs de rechange à la place, ce qu'il a apparemment fait car, depuis que j'ai dd
parcouru le disque, tous les auto-tests se sont bien déroulés. Et badblocks
aussi trouvé aucune raison de se plaindre.
Num Test_Description Status Remaining LifeTime(hours) LBA_of_first_error
[...]
# 5 Extended offline Completed without error 00% 5559 -
# 6 Short offline Completed without error 00% 5540 -
# 7 Short offline Completed: read failure 90% 5524 63273368
Le nombre de secteurs défectueux n'a pas diminué, mais il ne devrait pas, vraiment, car le secteur cassé est toujours là, bien qu'il ne soit pas utilisé. Cependant, smartd
continue de m'envoyer des e-mails tous les soirs:
The following warning/error was logged by the smartd daemon:
Device: /dev/sda [SAT], 1 Offline uncorrectable sectors
C'est extrêmement ennuyeux évidemment et engourdit mon réflexe de panique sain face aux smartd
mails.
Le disque est un Western Digital WD20EARS et la smartd
version est 5.41 2011-06-09 r3365.
-U 198+
devrait le faire. Belle trouvaille!