Après la panne d' Amazon le 8 août , toutes les AMI (basées sur EBS) ont cessé de fonctionner pour de nombreux utilisateurs . Cela est dû à la corruption de certains secteurs dans les instantanés sur lesquels les AMI sont basées.
Cependant, Amazon a créé des instantanés de récupération où les problèmes de disque doivent être résolus. Ceux-ci sont nommés sur le modèle de "Instantané de récupération pour vol-xxxxxxxx".
J'ai créé une nouvelle AMI à partir d'un instantané de récupération qui a bien fonctionné, mais les instances lancées à partir de cette nouvelle AMI ne fonctionnent pas: leur état est "En cours d'exécution", mais je ne peux pas accéder à la machine ni accéder aux services Web qui devraient y être exécutés. Cela se résume à ceci (à partir du journal système, accessible via la console de gestion AWS):
EXT3-fs: sda1: couldn't mount because of unsupported optional features (240).
EXT2-fs: sda1: couldn't mount because of unsupported optional features (244).
Kernel panic - not syncing: VFS: Unable to mount root fs on unknown-block(8,1)
J'ai monté un volume créé à partir de cet instantané de récupération sur un autre serveur sur AWS, et tout semble tout à fait normal cependant. Par exemple, fsck dit:
$ sudo fsck -a /dev/xvdg
fsck from util-linux-ng 2.17.2
uec-rootfs: clean, 53781/524288 files, 546065/2097152 blocks
Dans l'une des discussions du forum AWS, j'ai trouvé ce conseil d'une personne ayant des problèmes similaires:
Une solution consiste à créer un volume à partir de l'instantané et à le joindre à une instance en cours d'exécution, à utiliser fsck --force pour forcer la vérification du système de fichiers et une fois effacé, vous pouvez créer un instantané et l'utiliser pour l'AMI.
Mais je ne sais pas comment forcer fsck sur Ubuntu (11.04):
$ sudo fsck --force /dev/xvdg
fsck from util-linux-ng 2.17.2
fsck.ext3: invalid option -- 'o'
Quelqu'un sait comment forcer la vérification du système de fichiers sur le volume sur Ubuntu? Avez-vous d'autres idées sur la façon de lancer des instances de travail basées sur l'instantané de récupération?
À l'heure actuelle, il semble qu'il serait plus rapide de recommencer à partir d'une AMI Ubuntu propre et de reconfigurer tous nos services. :-( Mais bien sûr, je préférerais ne pas le faire s'il existe un moyen de faire fonctionner l'instantané de récupération.