J'ai un serveur exécutant VMware ESXi v4.1.0 348481. Il dispose d'un RAID10 matériel et d'un lecteur de sauvegarde SATA. J'ai une machine virtuelle en cours d'exécution qui a son vmdk de démarrage principal sur la banque de données RAID10, et une vmdk de 600 Go sur la banque de données du lecteur de sauvegarde SATA. La machine virtuelle exécute Debian Linux avec le noyau FreeBSD et utilise ZFS pour le lecteur de sauvegarde.
EDIT: le lecteur n'est pas directement connecté à la machine virtuelle. Il est utilisé en tant que banque de données VMware et la machine virtuelle possède un vmdk sur la banque de données du lecteur SATA. Le magasin de données n'est pas plein (65% seulement)
Je me suis connecté au serveur à l'aide de SSH et j'ai constaté que la sauvegarde de la nuit dernière était bloquée, zfs list
ou les zpool list
deux bloquées. J'ai donc ouvert la console virtuelle dans ESXi et j'étais triste de voir:
(da1:mpt0:0:1:0): READ(10). CDC: 28 0 19 97 3a 50 0 0 2d 0
(da1:mpt0:0:1:0): CAM status: SCSI Status Error
(da1:mpt0:0:1:0): SCSI status: Check Condition
(da1:mpt0:0:1:0): SCSI sense: MEDIUM ERROR info:4862ec asc:11,4 (Unrecovered read error - auto reallocate failed)
(da1:mpt0:0:1:0): READ(10). CDC: 28 0 19 97 3a 50 0 0 2d 0
(da1:mpt0:0:1:0): CAM status: SCSI Status Error
(da1:mpt0:0:1:0): SCSI status: Check Condition
(da1:mpt0:0:1:0): SCSI sense: MEDIUM ERROR info:4862ec asc:11,4 (Unrecovered read error - auto reallocate failed)
J'ai essayé de redémarrer la machine virtuelle et j'ai reçu un message indiquant que le système était en cours de redémarrage, puis cela s'est bloqué. (^ C apparaît mais ne tue pas shutdown
). Je ne peux pas interrompre ou kill -9
le processus zpool list
zfs list
ou rsync
- Rien ne se passe lorsque j'essaie.
- Cela indique-t-il que le disque SATA de sauvegarde est en panne? Ou pourrait-il s'agir simplement d'une erreur ESXi?
- Comment dans le client vSphere pourrais-je savoir si le lecteur tombe en panne? Je n'ai vu aucune indication, tout sous État de santé du matériel semble bon, et je n'ai rien vu sous la configuration de stockage.
- Comment dois-je procéder à partir d'ici? Dois-je simplement redémarrer dur la machine virtuelle?
MISE À JOUR: Je viens de redémarrer durement la machine virtuelle. Après sa remise en ligne, le zpool de sauvegarde était en ligne, cependant:
root@timestandstill:/home/jnet# zpool status -v
pool: backup
state: ONLINE
status: One or more devices has experienced an error resulting in data
corruption. Applications may be affected.
action: Restore the file in question if possible. Otherwise restore the
entire pool from backup.
see: http://www.sun.com/msg/ZFS-8000-8A
scrub: none requested
config:
NAME STATE READ WRITE CKSUM
backup ONLINE 0 0 0
da1 ONLINE 0 0 0
errors: Permanent errors have been detected in the following files:
/backups/someserver/home/someuser/public_html/somedir/calendar/someuser/calendars/somefile.ics
Je me penche fortement vers le remplacement du lecteur ...