Aujourd'hui, nous frappons une sorte de pire scénario et sommes ouverts à toutes sortes de bonnes idées.
Voici notre problème:
Nous utilisons plusieurs serveurs de stockage dédiés pour héberger nos machines virtuelles. Avant de continuer, voici les spécifications:
- Machine serveur dédiée
- Contrôleur RAID Areca 1280 ml, micrologiciel 1,49
- 12 disques durs Samsung 1 To
Nous avons configuré un ensemble RAID6 avec 10 disques contenant un volume logique. Nous avons deux disques de secours dans le système.
Aujourd'hui, un disque dur est tombé en panne. Cela se produit de temps en temps, nous l'avons donc remplacé. Lors de la reconstruction, un deuxième disque a échoué. Normalement, ce n'est pas amusant. Nous avons arrêté les opérations d'E / S lourdes pour assurer une reconstruction RAID stable.
Malheureusement, le disque de secours a échoué lors de la reconstruction et le tout s'est arrêté.
Nous avons maintenant la situation suivante:
- Le contrôleur dit que l'ensemble de raid est en cours de reconstruction
- Le contrôleur dit que le volume a échoué
Il s'agit d'un système RAID 6 et deux disques sont tombés en panne, les données doivent donc être intactes, mais nous ne pouvons pas remettre le volume en ligne pour accéder aux données.
Lors de la recherche, nous avons trouvé les pistes suivantes. Je ne sais pas s'ils sont bons ou mauvais:
Mise en miroir de tous les disques sur un deuxième ensemble de lecteurs. Nous aurions donc la possibilité d'essayer différentes choses sans perdre plus que ce que nous avons déjà.
Essayer de reconstruire le tableau dans R-Studio. Mais nous n'avons pas vraiment d'expérience avec le logiciel.
Tirer tous les disques, redémarrer le système, passer au BIOS du contrôleur areca, réinsérer les disques durs un par un. Certaines personnes disent que cela a mis le système en ligne. Certains disent que l'effet est nul. Certains disent qu'ils ont tout fait exploser.
Utilisation de commandes d'arec non documentées comme "rescue" ou "LeVel2ReScUe".
Contacter un service de criminalistique informatique. Mais whoa ... les estimations primaires par téléphone dépassaient 20 000 €. C'est pourquoi nous vous prions de bien vouloir demander de l'aide. Peut-être que nous manquons l'évidence?
Et oui bien sûr, nous avons des sauvegardes. Mais certains systèmes ont perdu une semaine de données, c'est pourquoi nous aimerions que le système soit à nouveau opérationnel.
Toute aide, suggestions et questions sont les bienvenues.
dd
miroir de tous les disques, juste pour éviter plus de dommages et avoir un plan de secours lorsque vous travaillez sur une vraie solution.