SMART est-il intelligent à utiliser?


16

Il y a quelques années, on m'a dit d'éviter SMART comme la peste. Le raisonnement était que la pression exercée par les tests sur le disque entraînerait en fait sa défaillance.

Est-ce toujours le cas? Sinon, quelle est la fréquence raisonnable pour exécuter les tests? Si je devais toujours l'éviter, quelle est la meilleure façon de surveiller la santé de mes disques durs?

Réponses:


30

Alors que SMART ne prévoit certainement pas toutes les pannes, j'ai travaillé dans un atelier de réparation d'ordinateurs pendant plusieurs années, et plusieurs fois un message d'erreur SMART était la première indication qu'une panne était sur le point de se produire, me permettant d'enregistrer les données du client avant le lecteur décédés.

La technologie elle-même ne met pas l'accent sur le lecteur, elle ne fait que suivre un certain nombre d'indicateurs (liste complète ici: http://en.wikipedia.org/wiki/SMART .) Qui pourraient potentiellement entraîner une défaillance du lecteur, tels que:

  • Taux d'erreur de lecture
  • Nombre de secteurs réaffectés
  • Nombre de nouvelles tentatives d'essorage
  • Nombre de secteurs non corrigibles
  • Heures de mise sous tension

Les performances pour SMART sont négligeables, ne stressent pas les lecteurs (la surveillance est passive) et peuvent potentiellement vous avertir que vous êtes sur le point de perdre toutes les photos de vos enfants (ou votre collection MP3 ou tout ce qui est important sur votre disque dur) ).

Bref, laissez-le.


Je pense que l'affiche originale a été informée du danger des tests de surface actifs qui peuvent être effectués par SMART (exécution manuelle de "longs" tests). Autobus comme vous le dites, par défaut SMART est passif et doit toujours être activé. Personnellement, je lance également des tests actifs une fois par mois sur mes disques.
Colas Nahaboo

3

Outre la journalisation passive des compteurs de performances et des événements, SMART fournit une interface pour lancer plusieurs types d'autotests effectués par le lecteur et obtenir leurs résultats plus tard.

Certains de ces tests impliquent l'analyse de toute la surface du plateau tout en restant en ligne et en répondant aux demandes de l'hôte, de sorte que les E / S lourdes entraîneront de nombreux battements de tête.

Je suppose que ce dernier est à l'origine de la grave fausse idée qui vous a été racontée. SMART est agréable.


-6

Il y a quelque temps, Google a fait une étude (PDF) " Tendances des défaillances dans une population de gros disques ". Ils ont des tonnes de disques qui utilisent et l'étude a montré:

Notre analyse identifie plusieurs paramètres de l'installation d'autosurveillance du variateur (SMART) qui sont fortement corrélés aux pannes. Malgré cette forte corrélation, nous concluons que les modèles basés uniquement sur des paramètres SMART ne sont probablement pas utiles pour prédire les pannes de disques individuelles. Étonnamment, nous avons constaté que la température et les niveaux d'activité étaient beaucoup moins corrélés aux pannes de disque que ceux précédemment signalés.

La température est donc un facteur beaucoup plus important que la pression exercée sur le variateur. De plus, avec toute la correction d'erreur qui se produit dans ce nouveau lecteur tout le temps, tellement plus de stress est ajouté que vous n'avez pas le contrôle. Si vous cherchez un outil pour assurer la maintenance (ou la récupération) de vos disques, je recommanderais SpinRite . C'est par Steve Gibson et c'est un produit incroyable.


3
Votre référence ne dit-elle pas que la température n'est pas corrélée à la panne du variateur? ... mais vous la considérez comme un "facteur beaucoup plus important"? Veuillez clarifier ce que vous voulez dire
Michael Haren

Suis-je en train de lire mal? Il dit que la température n'est pas fortement corrélée à une panne de disque, non? L'activité ne l'est pas non plus selon ce document.
MrChrister

1
"La température est donc un facteur beaucoup plus important que la pression exercée sur le variateur." - D'où concluez-vous cela? Le paragraphe que vous avez cité dit que la température n'était pas aussi fortement corrélée.
Joe Phillips

3
-1 pour avoir échoué non seulement à lire correctement l'abrégé de l'article, mais aussi pour ne pas avoir pris le temps de lire le tout. La panne d'unité est généralement due à un défaut de fabrication (comme le montre la figure 3: une utilisation élevée au cours des 3 premiers mois élimine les erreurs de composants - après que la panne due à l'utilisation commence à converger), ou à une dégradation au fil du temps. La dégradation au fil du temps est ce que SMART va ramasser. La figure 5 montre que la température n'est pas du tout un facteur important - en effet, le rapport suggère que les entraînements plus froids ont plus de changements d'échec que ceux fonctionnant à chaud, certainement au cours des 3 premières années.
Ian
En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.