J'ai un serveur Netware 3.12 datant de 1998 qui gère tout sur notre campus: grand livre, achats, paie, informations sur les étudiants, notes, vous l'appelez. Le serveur dispose d'un contrôleur RAID Adaptec à deux volumes:
- RAID 1, 2 disques scsi de 17 Go, Seagate ST318417W
- RAID 5, 3 disques scsi de 4 Go, 2 Seagate ST34573W et 1 ST34572W.
Nous sommes actuellement aux premiers stades d'un projet de remplacement de ce système, mais vous ne vous contentez pas de sauter dans un nouveau système comme celui-ci et j'ai donc besoin de garder ce serveur en marche jusqu'au moins novembre 2011.
Cette semaine, nous n'avons pas eu un mais deux disques durs tombent en panne. Heureusement, ils proviennent de volumes différents et nous pouvons continuer à fonctionner pour le moment, mais étant donné la nature proche de ces échecs, j'ai de sérieux doutes que je serai en mesure d'éviter une défaillance catastrophique de ce serveur via la cible de novembre comme sans. restaurer la redondance RAID - cela ne prendra qu'une seule panne de disque de plus n'importe où et je suis complètement irrité.
Nous avons la chance d'avoir des pièces de rechange de correspondance exacte qui traînent pour les deux disques, mais les pièces de rechange sont dans un état inconnu. J'ai essayé de les échanger uniquement, mais le contrôleur RAID n'est pas assez intelligent pour gérer cela et il rend le système impossible à démarrer.
En ce qui concerne le contrôleur RAID lui-même, il existe un utilitaire dans lequel je peux accéder pendant le POST via un raccourci Ctrl-A, mais je ne peux pas faire grand-chose à partir de là. Pour gérer réellement les volumes, je dois d'abord démarrer sur Netware, auquel point je peux utiliser CI/O Array Management Software Version 2.0
pour regarder les informations de volume. Je soupçonne que la façon normale de gérer les choses est de démarrer à partir d'une disquette spéciale avec le logiciel du contrôleur, mais cette disquette a disparu depuis longtemps.
En parcourant les options du logiciel RAID, je pense que la seule façon prise en charge pour remplacer un disque dans un volume RAID existant est d'ajouter physiquement le disque, de le démarrer et de le configurer comme "pièce de rechange" pour un volume, de forcer le volume à utiliser le disque de secours pour remplacer un disque en panne existant (et à ce stade, je ne fais que deviner) afin que le disque en panne devienne le disque de rechange, réparer le volume, retirer le disque de secours du volume, puis arrêter et retirer le disque. Puis recommencez pour l'autre disque défaillant. Tout cela représente beaucoup de temps d'arrêt, en supposant que je puisse même le faire fonctionner et que mes pièces de rechange sont bonnes.
En ce qui concerne la recherche de pièces de rechange fiables, je n'ai aucune idée où commencer à chercher un nouveau lecteur scsi de 4 Go, ni même quel système scsi exact je recherche, car il a traversé plusieurs itérations différentes au fil du temps.
Une autre option consiste à migrer cela vers une machine virtuelle (hyper-v), mais toutes les tentatives précédentes que nous avons faites dans ce domaine n'ont pas réussi à aller très loin. Lorsque cette machine a été installée, je venais tout juste de terminer mes études secondaires, et cela nécessite donc une connaissance de niveau inférieur des réseaux et des dos que je n'ai jamais développé, ou si je l'ai depuis oublié (je ne suis pas exactement un néophyte non plus).
Une partie de mon problème est qu'il s'agit d'un serveur à haute utilisation, et le démonter pendant quelques jours pour comprendre les choses ne va pas très bien voler.
En ce qui concerne la question, je recherche tout ce qui pourrait être utile dans cette situation: une recommandation sur un endroit pour trouver de bonnes pièces de rechange de cette époque, une expérience personnelle de réparation de volumes RAID à l'aide d'un contrôleur similaire ou de construction d'un Hyper-V VM à partir d'un ancien serveur netware, une ligne sur une disquette avec un meilleur logiciel pour le contrôleur RAID, recommandation sur un bon consultant Novell dans le Nebraska qui serait en mesure de corriger les choses, une toute autre option que je n'ai pas encore envisagée, etc.
Mise à jour:
Pour les sauvegardes, nous avons de bonnes sauvegardes (récemment vérifiées via la restauration) des données uniquement - rien pour le logiciel qui exécute réellement les choses.
Mise à jour 2:
juste un rapport d'étape indiquant que j'ai actuellement une installation de Netware 3.12 fonctionnelle dans VMWare Virtual Server 2.0, grâce en grande partie au guide que j'ai trouvé ici:
http://cerbulescubogdan.blogspot.com/2010/11/novell-netware-312 -on-vmware.html
Les étapes suivantes consistent à préparer des volumes netware vides pour correspondre aux volumes supplémentaires sur mon serveur existant, à effectuer un vidage de tout sur le lecteur C: \ et des volumes netware sur mon serveur existant, et à déterminer à partir de ces informations quels modules doivent être ajoutés à netware, installer mes licences (nous avons toujours ce disque, s'il est bon) et déplacer les données.
J'ai l'autorisation d'arrêter le serveur pendant une semaine après le premier de l'année (malheureusement pas avant), donc, à part la création de volumes vides, le reste du travail devra attendre jusque-là.
Dernière mise à jour (5 janvier 2011):
cette semaine, j'ai pu faire fonctionner des pièces de rechange dans les deux baies RAID sans perte de données. Les deux sont désormais répertoriés par le contrôleur comme "FAULT TOLLERANT" (yay!). J'ai également pu m'appuyer sur les progrès de ma dernière mise à jour et j'ai maintenant un serveur "de rechange" fonctionnel dans VMWare Server 2.0. Le disque de rechange peut fonctionner et utiliser notre logiciel erp, mais je ne peux pas le mettre en production car je ne peux pas (encore) imprimer à partir de cette boîte (et je ne sais pas pourquoi). Même ainsi, cette machine virtuelle fera l'affaire si je n'ai pas d'autre choix, et entre elle et les matrices RAID réparées, je suis à l'aise avec la situation jusqu'à ce que je puisse jeter la machine en novembre.
Epilogue (16 janvier 2012):
Le projet de remplacement de ce serveur par un tout nouveau système s'est déroulé comme prévu. Vive le netware! Salutez Sql Server! Le roi est mort. Longue vie au roi!
Nous prévoyons toujours de maintenir l'ancien serveur en service pendant un certain temps, jusqu'à ce que notre audit post-exercice se termine en août. Mais si un échec se produit d'ici là, personne ne se plaindrait trop.