Il y a une faible probabilité de défaillance complète du châssis ...
Vous rencontrerez probablement des problèmes dans votre installation avant de subir une défaillance totale d'un boîtier de lame.
Mon expérience concerne principalement les boîtiers de lames HP C7000 et HP C3000 . J'ai également géré les solutions lames Dell et Supermicro. Le vendeur compte un peu. Mais en résumé, l'équipement HP a été excellent, Dell a fonctionné correctement et Supermicro manquait de qualité, de résilience et était simplement mal conçu. Je n'ai jamais connu d'échec du côté de HP et de Dell. Le Supermicro a eu de graves pannes, nous obligeant à abandonner la plate-forme. Sur HP et Dells, je n’ai jamais rencontré une défaillance complète du châssis.
- J'ai eu des événements thermiques. La climatisation est tombée en panne dans une installation de co-implantation, la température atteignant 46 ° C / 115 ° F pendant 10 heures.
- Surtensions et pannes de ligne: perte d’un côté de l’alimentation A / B. Pannes individuelles d’alimentation. Mes configurations de lame comportent généralement six blocs d'alimentation. Il y a donc beaucoup d'avertissements et de redondances.
- Échecs de serveur lame individuels. Les problèmes d'un serveur n'affectent pas les autres dans l'enceinte.
- Un feu dans le châssis ...
J'ai vu une variété d'environnements et ai eu l'avantage d'installer dans des conditions de centre de données idéales, ainsi que dans des endroits plus difficiles. Du côté des HP C7000 et C3000, l’essentiel est que le châssis soit entièrement modulaire. Les composants sont conçus pour minimiser l’impact d’une défaillance de composant sur l’ensemble de l’unité.
Pensez-y comme ceci ... Le châssis principal du C7000 est composé d'assemblages de fond de panier et de fond de panier avant (passif). L'enceinte structurelle maintient simplement les composants avant et arrière ensemble et supporte le poids du système. Presque toutes les pièces peuvent être remplacées ... croyez-moi, j'en ai démonté beaucoup. Les principales redondances concernent les ventilateurs / systèmes de refroidissement, l’alimentation, les réseaux et la gestion. Les processeurs de gestion ( Onboard Administrator de HP ) peuvent être associés pour la redondance, mais les serveurs peuvent fonctionner sans eux.
Boîtier entièrement peuplé - vue de face. Les six blocs d'alimentation situés en bas couvrent toute la profondeur du châssis et se connectent à un fond de panier d'alimentation modulaire situé à l'arrière du boîtier. Les modes d’alimentation sont configurables: par exemple 3 + 3 ou n + 1. Donc, l'enceinte a définitivement une redondance d'alimentation.
Enceinte entièrement peuplée - vue arrière. Les modules de réseau Virtual Connect à l'arrière disposent d'un répartiteur interne, ce qui me permet de perdre l'un ou l'autre des côtés tout en maintenant la connectivité du réseau aux serveurs. Il existe six blocs d'alimentation remplaçables à chaud et dix ventilateurs remplaçables à chaud.
Enceinte vide - vue de face. Notez qu'il n'y a vraiment rien dans cette partie de l'enceinte. Toutes les connexions sont transmises au fond de panier modulaire.
Assemblage du fond de panier enlevé. Notez les six alimentations pour l’assemblage du fond de panier central en bas.
Assemblage de midplane. C'est là que se passe la magie. Notez les 16 connexions de downplane distinctes: une pour chacun des serveurs lame. Des sockets / baies de serveurs individuels ont échoué sans tuer l'ensemble du boîtier ni affecter les autres serveurs.
Fond de panier d'alimentation. Unité 3ø en dessous du module monophasé standard. J'ai changé la répartition de l'alimentation dans mon centre de données et j'ai simplement échangé le fond de panier de l'alimentation pour gérer la nouvelle méthode d'alimentation en énergie.
Connecteur de châssis endommagé. Cette enceinte particulière a été abandonnée lors de l'assemblage, cassant les broches d'un connecteur de ruban. Cela a passé inaperçu pendant des jours et le châssis en cours de fonctionnement a attrapé FIRE ...
Voici les restes carbonisés du câble ruban du fond de panier. Cela contrôlait une partie de la surveillance de la température et de l'environnement du châssis. Les serveurs lames internes ont continué à fonctionner sans incident. Les parties touchées ont été remplacées à loisir pendant les temps morts, et tout allait bien.