J'ai un serveur exécutant VMware ESXi v4.1.0 348481. Il dispose d'un RAID10 matériel et d'un lecteur de sauvegarde SATA. J'ai une machine virtuelle en cours d'exécution qui a son vmdk de démarrage principal sur la banque de données RAID10, et une vmdk de 600 Go sur la banque de données du lecteur de sauvegarde SATA. La machine virtuelle exécute Debian Linux avec le noyau FreeBSD et utilise ZFS pour le lecteur de sauvegarde.
EDIT: le lecteur n'est pas directement connecté à la machine virtuelle. Il est utilisé en tant que banque de données VMware et la machine virtuelle possède un vmdk sur la banque de données du lecteur SATA. Le magasin de données n'est pas plein (65% seulement)
Je me suis connecté au serveur à l'aide de SSH et j'ai constaté que la sauvegarde de la nuit dernière était bloquée, zfs listou les zpool listdeux bloquées. J'ai donc ouvert la console virtuelle dans ESXi et j'étais triste de voir:

(da1:mpt0:0:1:0): READ(10). CDC: 28 0 19 97 3a 50 0 0 2d 0
(da1:mpt0:0:1:0): CAM status: SCSI Status Error
(da1:mpt0:0:1:0): SCSI status: Check Condition
(da1:mpt0:0:1:0): SCSI sense: MEDIUM ERROR info:4862ec asc:11,4 (Unrecovered read error - auto reallocate failed)
(da1:mpt0:0:1:0): READ(10). CDC: 28 0 19 97 3a 50 0 0 2d 0
(da1:mpt0:0:1:0): CAM status: SCSI Status Error
(da1:mpt0:0:1:0): SCSI status: Check Condition
(da1:mpt0:0:1:0): SCSI sense: MEDIUM ERROR info:4862ec asc:11,4 (Unrecovered read error - auto reallocate failed)
J'ai essayé de redémarrer la machine virtuelle et j'ai reçu un message indiquant que le système était en cours de redémarrage, puis cela s'est bloqué. (^ C apparaît mais ne tue pas shutdown). Je ne peux pas interrompre ou kill -9le processus zpool list zfs listou rsync- Rien ne se passe lorsque j'essaie.
- Cela indique-t-il que le disque SATA de sauvegarde est en panne? Ou pourrait-il s'agir simplement d'une erreur ESXi?
- Comment dans le client vSphere pourrais-je savoir si le lecteur tombe en panne? Je n'ai vu aucune indication, tout sous État de santé du matériel semble bon, et je n'ai rien vu sous la configuration de stockage.
- Comment dois-je procéder à partir d'ici? Dois-je simplement redémarrer dur la machine virtuelle?
MISE À JOUR: Je viens de redémarrer durement la machine virtuelle. Après sa remise en ligne, le zpool de sauvegarde était en ligne, cependant:
root@timestandstill:/home/jnet# zpool status -v
  pool: backup
 state: ONLINE
status: One or more devices has experienced an error resulting in data
        corruption.  Applications may be affected.
action: Restore the file in question if possible.  Otherwise restore the
        entire pool from backup.
   see: http://www.sun.com/msg/ZFS-8000-8A
 scrub: none requested
config:
        NAME        STATE     READ WRITE CKSUM
        backup      ONLINE       0     0     0
          da1       ONLINE       0     0     0
errors: Permanent errors have been detected in the following files:
        /backups/someserver/home/someuser/public_html/somedir/calendar/someuser/calendars/somefile.ics
Je me penche fortement vers le remplacement du lecteur ...