Votre question concerne la récupération après incident matériel. Vous examinez donc les fonctionnalités que la carte d’accès matériel / contrôleur fournit pour vous.
- un BIOS, dans lequel vous pouvez entrer avant le démarrage du système d'exploitation. La configuration peut être faite ici.
- Un processeur ou autre "accellerator" qui s'occupe de gérer le raid et de décider où les lectures / écritures sont dirigées.
- Un schéma permettant d'identifier quel disque physique appartient à quelle partie du RAID.
- Un moyen de vous informer sur l'état du RAID.
Votre carte RAID sera livrée avec des pilotes et des logiciels pris en charge sous votre système d'exploitation vous permettant d'effectuer la gestion de la configuration et de l'état sans devoir redémarrer dans ce BIOS.
Pour le matériel serveur, les lecteurs eux-mêmes sont sur des chariots remplaçables à chaud avec des voyants supplémentaires. Celles-ci vous fournissent un retour physique si le contrôleur détecte un problème avec le RAID.
Pour les ordinateurs de bureau, vos lecteurs sont câblés sur la carte RAID ou la carte mère.
Le pilote et le logiciel de votre système d'exploitation peuvent également le détecter et vous alerter d'une autre manière (courrier électronique, etc.).
Une fois qu'un disque a mal tourné, le contrôleur arrête de lire et d'écrire dessus, en s'appuyant sur les disques restants pour servir les données.
Cela s'appelle un état dégradé, vous travaillez toujours, mais un autre échec vous pousse au bord de la perte de données. (2 échecs supplémentaires si vous utilisez RAID 6)
Pour un contrôleur RAID remplaçable à chaud, vous devez simplement extraire le lecteur en panne et en insérer un vierge.
Comment sait-il qu'il est vide? C'est le travail du schéma (3).
Tous les lecteurs ont des données inutilisées au début, la table de partition a beaucoup d’espace libre. Chaque fabricant l'utilisera différemment, mais c'est ici que le contrôleur de raid stockera des données lui indiquant quel lecteur appartient à quelle partie du raid.
Une fois qu'il voit un nouveau lecteur qui n'a pas encore été utilisé par cette carte RAID, il peut démarrer le processus de restauration.
Cela peut être automatique ou déclenché par l'utilisateur, et peut bien sûr effacer complètement le contenu du nouveau disque s'il était déjà formaté pour autre chose.
La récupération ou la reconstruction est gérée en arrière-plan par le contrôleur RAID, il lit chaque secteur à partir des lecteurs restants et calcule ce qui devrait être sur chaque secteur pour le nouveau lecteur.
Pour RAID 1, il suffit de copier tous les secteurs du bon disque existant vers le nouveau disque.
Pour RAID 5 ou 6, tous les lecteurs existants sont lus et les données à écrire sur le nouveau lecteur peuvent être calculées.
Étant donné que ce travail accède aux lecteurs restants, vous pouvez généralement définir une priorité pour ce travail, afin de ne pas ralentir l'ensemble du système.
Cependant, vous devez déterminer si la rapidité de récupération du statut RAID total est plus importante que les travaux en cours.
Certains contrôleurs, par exemple Pour ceux qui sont intégrés à une carte mère de bureau ordinaire, vous devrez peut-être accéder au BIOS pour déclencher la reconstruction à cet emplacement et ne pas vous permettre de démarrer dans le système d’exploitation jusqu’à ce qu’il soit à nouveau prêt. Ce serait un inconvénient, et ce ne serait pas un bon raid HW, car vous voulez une disponibilité et une résilience face à l'échec.
Une carte de raid HW autonome vous donnera l’opportunité d’une reconstruction qui n’affectera pas votre capacité à continuer à travailler.
Si la panne est dans la carte RAID elle-même:
L'ordinateur / le serveur sera probablement tombé en panne et n'est pas amorçable.
A ce stade, vous pouvez supposer que les lecteurs eux-mêmes sont toujours viables, mais il est plus probable que les lecteurs soient dans un état incohérent, c'est-à-dire que les écritures sur un lecteur n'ont pas été entièrement propagées sur d'autres lecteurs.
Vous êtes à la merci du système d'exploitation et de son système de récupération sur erreur du système de fichiers pour cela.
Le pire des cas est que vous devez récupérer les données d'une sauvegarde après avoir réparé l'ordinateur / le serveur.
Si la carte RAID est remplaçable, un modèle identique peut être installé à sa place. Etant donné que les lecteurs individuels signalent toujours la même identification de la même manière que la carte RAID, l'ensemble complet des lecteurs fonctionnera comme avant sans perte complète des données (bien que des incohérences du système de fichiers puissent exister).
Si le contrôleur RAID faisait partie d'une carte mère, vous devez remplacer l'intégralité de la carte mère par une autre avec le même modèle de contrôleur RAID.
Si vous essayez d'utiliser une marque de contrôleur RAID différente, il est fort probable qu'il ne reconnaisse pas les disques et vous demande simplement comment vous souhaitez les configurer à nouveau, ce qui effacera toutes les données existantes.
Dans les serveurs HP, tous les modèles de contrôleurs RAID intégrés et plug-ins partagent le même schéma d'identification du disque. Il est donc préférable de remplacer un contrôleur intégré par un plug-in ou un plug-in avec un plug-in plus puissant. modèle est possible sans perte de données.
Dans les deux cas, vous devez également veiller à ce que le firmware de la carte RAID de remplacement soit mis à jour vers la même version ou une version plus récente de celle à remplacer.
Encore une fois, avec les serveurs HP, un serveur est mort, puis je tire l’ensemble des disques d’un RAID et les branche dans des emplacements vides d’un nouveau serveur (déjà sous tension), et les données sont immédiatement visibles.