Les serveurs doivent-ils être éteints la nuit?


144

Un serveur est utilisé de 4h30 du matin jusqu'à environ 22h00.

Devrait-il être éteint? Je pense que c'est un serveur et qu'il n'y aura pas de problème à rester, mais des professeurs sérieux me disent que c'est dangereux et que la HD peut échouer d'ici 2 ans. Le propriétaire du serveur pense que son ancien serveur fonctionnant à partir de 1995 sans sauvegarde et qu'un seul disque dur (si le disque dur tombe en panne, il est vissé) n'a eu aucun problème, car il l'éteignait la nuit.

Que croyez-vous pour cela?

Maintenant, il dispose d'une matrice RAID 1, d'une sauvegarde sur disque dur externe et de plusieurs sauvegardes sur disque dur sur DVD et sur Internet.


62
+1 parce que même s’il s’agit d’une question à laquelle je pense qu'aucun de nous n’a jamais pensé, il est clair que certaines personnes l’entendent et qu’il faut y répondre.
Mark Henderson

8
Vos professeurs ne font pas fonctionner de serveurs. Ils exécutent des stations de travail avec des démons de réseau.
morceaux de bacon

4
Ne pouvez-vous pas utiliser certains paramètres d'alimentation pour éteindre les disques durs lorsqu'ils ne sont pas utilisés? Même avantage en termes d'usure, mais vous n'avez pas à éteindre toute la machine.
Brendan Long

34
Des professeurs d'anglais lit?
Iain Holder le

28
Je ne recommanderais pas de prendre conseil auprès de personnes qui ne font pas de sauvegarde. Surtout pas, s'ils le font depuis plus de 15 ans. L'économie d'énergie électrique est le seul argument pour l'éteindre. La durée de vie sera réduite en raison de l'échauffement et du refroidissement journaliers.
Malte

Réponses:


153

Comparons cela à une analogie avec une voiture: un taxi peut parcourir plus de 500 000 kilomètres avant de devoir reconstruire son moteur. La raison en est qu’ils sont toujours en marche, 24 heures sur 24, 7 jours sur 7, et que, une fois que le moteur d’une voiture est à température, son usure est considérablement réduite.

Un ordinateur est un peu la même chose. La plus grande partie de l'usure des pièces peut survenir lorsque le serveur est en train de démarrer. Connectez simplement un ampèremètre à votre ordinateur et allumez-le. Quand il démarre, la puissance qu’il consomme monte très haut, puis il se stabilise une fois que tous les disques ont démarré et que le processeur est initialisé. Pensez également à la quantité d’activité disque que le serveur subit au démarrage et au bon fonctionnement. Il est fort probable que l’accès au disque depuis le démarrage du système d’exploitation constitue une activité relativement solide, tandis que lorsque le système d’exploitation est en cours d’exécution, à moins que ce ne soit un serveur de base de données très lourd (j’imagine que non), les disques resteront probablement inactifs. S'il y a un moment où cela va échouer, il y a des chances pour que ce soit au démarrage.

Allumer et éteindre votre serveur est une idée stupide. Non seulement mentionner que la plupart des serveurs peuvent prendre entre 2 et 5 minutes pour passer les vérifications du BIOS, c'est aussi une énorme perte de temps.


Mise à jour 2018: étant donné que la plupart des ordinateurs sont maintenant entièrement à l'état solide, cette réponse risque de ne plus être aussi précise qu'auparavant. L'analogie de taxi ne convient pas vraiment aux serveurs modernes d'aujourd'hui. Cela dit, en règle générale, vous ne désactivez pas toujours les serveurs.


15
Pourriez-vous ajouter des liens vers des recherches sur ce sujet?
Mafu

15
@mafutrct: WikiBook on HD Failure et Google Labs Une étude sur les défaillances HD montre des preuves inconciliables qui suggèrent que les cycles d'alimentation ont un impact sur la durée de vie du lecteur. Les effets évidents comme les traumatismes physiques ont également le plus d'effet.
Chris S

3
Comment font-ils pour alimenter le taxi s'il est toujours en marche? C'est illégal dans la plupart des juridictions.
Courses de légèreté en orbite

8
@Tomalak - eh bien, le point de l'analogie était que le moteur du Taxi était à la température et que l'usure se produisait moins pendant cette période. Dans les 90 secondes qu'il faut pour ravitailler un taxi, le moteur n'a pas eu la chance de se refroidir et l'usure est donc encore réduite à néant. Sur un ordinateur, il est "refroidi" (aux fins de l'analogie) instantanément, et chaque démarrage est un démarrage "à froid".
Mark Henderson

6
@Fergus - eh bien, cela ne s'applique qu'aux boîtes physiques. Si vous avez une machine virtuelle, n'hésitez pas à l'activer / la désactiver autant que vous le souhaitez. Mais vous ne recevrez aucune économie de vie ou d’énergie.
Mark Henderson

70

La mise hors et sous tension du serveur tous les jours entraînerait probablement une défaillance plus rapide que de le laisser sous tension.


3
Très probablement en raison du stress du disque @ boot; De plus, j'ai eu un serveur qui a fonctionné pendant des années, puis a refusé de revenir au redémarrage. Il s'avère que le disque de démarrage se dégradait lentement, avec le MBR complètement illisible - mais le MBR n'était lu que lors du démarrage, donc personne ne s'en est aperçu. Heureusement, le disque n'est complètement mort qu'après une ruée frénétique pour récupérer ce qui n'avait pas encore été sauvegardé.
Piskvor

Je doute que cela se produise si vous éteignez une fois par jour, même les disques d'entreprise ont un nombre de commutations supérieur à 300 000 dans leurs détails techniques. Le problème vient de la gestion de l'énergie qui le fait toutes les 15 minutes.
Lothar

Je ne comprends pas comment une réponse qui énonce simplement les pensées de quelqu'un sans aucun raisonnement a reçu 70 votes positifs.
Bassie-c

52

La seule chose qui me semble proche de la vérité à propos de ce que l'on vous a dit, c'est que les lecteurs peuvent tomber en panne en 2 ans. Ils peuvent en fait échouer à tout moment. Je suis sûr que la plupart d'entre nous ont reçu au moins un disque tout neuf, le DOA. En moyenne, les lecteurs de serveur dureront à partir de 3 ans environ, 10 ou 20 ans n'étant pas inhabituels. Cela ne signifie pas que chaque lecteur individuel n'échouera pas beaucoup plus tôt.

Les serveurs (c'est-à-dire une machine avec des composants de niveau serveur appropriés) sont conçus pour fonctionner en continu. Il n'y a aucune raison de le fermer la nuit mais quelques très bonnes raisons de le laisser fonctionner. La nuit, ou quelle que soit l'heure, est "silencieuse" pour un système donné, c'est le moment d'exécuter toute la maintenance et l'automatisation.

par exemple, les sauvegardes sont mieux effectuées lorsqu'il n'y a pas ou peu d'activité de l'utilisateur. Cela aide à garantir la cohérence des sauvegardes. Bien sûr, il existe des moyens de contourner ce problème, mais pourquoi ne pas donner à vos sauvegardes toutes les chances de succès, alors que rien n’est à perdre en le faisant?

Quelqu'un qui exécute un "serveur" avec un seul disque et aucune sauvegarde n'est un imbécile, pas un administrateur. La seule raison pour laquelle il s'en est tiré est une pure chance. Cela n'avait absolument rien à voir avec l'arrêt de la machine la nuit.


Je vais prendre une conjecture sauvage et dire que "l'administrateur" qui ne prend pas de sauvegardes n'utilise pas non plus les composants de niveau serveur appropriés.
Intuition le

23

Les serveurs sont conçus pour fonctionner 24x7. Arrêter les serveurs pendant la nuit est extrêmement inhabituel. Les disques durs de serveur sont conçus pour être plus fiables que les disques de bureau et maintenant que vous disposez de sauvegardes et de RAID 1, vous ne risquez pas de perdre de données si l’un de vos deux disques tombe en panne.

Ce qui me préoccupe maintenant pour ce serveur de 16 ans est une panne de carte mère ou d’alimentation non redondante.


Cela semble logique :) C'est un motorola pc power pc .. ne sont pas encore morts!
GorillaApe

13

Je n'ai jamais éteint un serveur la nuit précédente.

Les disques durs vont échouer quand ils vont échouer. Allumer et éteindre la machine ne ralentira pas le lecteur. J'ai vu des disques durs fournis par le fournisseur qui étaient déjà défectueux et j'ai vu des disques fonctionner (et être utilisés activement) pendant plus de 5 ans sans échec.

Vos professeurs sont des idiots.


2
Si vous allumez et éteignez la machine, le lecteur échouera plus lentement s’il est arrêté pendant suffisamment longtemps. Si vous éteignez la machine pendant 10 ans, la durée de vie du disque dur est d'au moins 10 ans. La question est de savoir combien de temps la machine moyenne doit être laissée de côté pour avoir un effet positif.
Intuition le

4
@intuited Si vous allumez la machine après 50 ans d'attente et que le lecteur ne démarre pas, cela a-t-il duré 0 ans, 50 ans ou quoi?
Cade Roux

@Cade Roux: Je n'en ai aucune idée. Qu'importe? Même si nous comptons comme 0, cette valeur aberrante ne changera pas de manière significative la moyenne globale.
Intuition le

1
@intuited c'était une blague - mais en réalité, cela faussera probablement la moyenne des recherches.google.com/archive/disk_failures.pdf Et à partir de ces données, il est possible qu'un nouveau disque allumé après avoir été assis sur le plateau à 5 ans soit plus susceptibles d'échouer qu'un lecteur fonctionnant pendant 5 ans. Le problème est sans objet, car il n’est pas rentable de laisser le matériel inactif plus que de l’éteindre et de le rallumer. Le matériel se dégrade et devient obsolète et il faut que sa valeur maximale soit utilisée avant de l’utiliser et de le remplacer.
Cade Roux

@Cade Roux: D'après les recherches Google auxquelles vous êtes lié: comme cela est courant dans les déploiements en classe serveur, les disques étaient allumés, en rotation et généralement en service pendant la quasi-totalité de leur durée de vie enregistrée. Donc, cette recherche n'est pas pertinente ici. Cela montre que le disque encore neuf aura plus de chances que l’ancien d’échouer pendant une période donnée après sa remise en marche, mais cela suppose que l’ancien n’a pas déjà échoué depuis 5 ans fonctionnement.
intuited

11

Cela met également un "aspect humain" plus important sur le serveur. Même si vous utilisez les paramètres d’alimentation pour l’éteindre et l’allumer au bon moment, demandez à quelqu'un de surveiller le serveur pour vous assurer que tous les services requis, etc., démarrent correctement. C'est un temps précieux pour enseigner aux professeurs les techniques de sauvegarde et RAID.

Quand faites-vous des sauvegardes? Je donnerais n'importe quoi pendant une fenêtre de 6 heures pour exécuter mes sauvegardes quotidiennes, mises à jour, correctifs, etc. Si rien d'autre, ce temps d'indisponibilité peut être utilisé pour cela.

Je vous mets au défi d'aller voir ces "professeurs sérieux" et de fournir des recherches montrant que laisser l'ordinateur allumé en permanence est mauvais pour la vie. J'aimerais revenir sur ce qu'ils disent.


J'ai dit grave parce que l'un d'entre eux a conçu des processeurs, les systèmes embarqués connaissent le noyau Linux de manière très détaillée. En ce qui concerne les sauvegardes, j’ai créé des scripts pour la sauvegarde automatique, mais le propriétaire et l’administrateur qui s’y trouvaient me regardaient comme un mec WTF. "NON, je veux les faire manuellement tous les jours" et ne pas "tarer et les compresser".
GorillaApe

2
@Parhs En termes simples, vous êtes plus intelligent que vos supérieurs. Il serait sage de votre part de cesser de fumer et de trouver un vrai mentor avant d’avoir passé trop de temps à l’ombre d’idiots qui ne vous laisseront pas faire la bonne chose.
Skyhawk

10

De manière réaliste, la plupart des serveurs devraient être disponibles 24h / 24 et 7j / 7. Clair et simple.

Si vous ne l'êtes pas, il y a vraiment un débat entre ce qui causera plus d'usure sur votre serveur, la dilatation et la contraction constantes entre l'allumage de votre serveur et son échauffement, puis son extinction et son refroidissement. , ou l’usure des composants lors d’une utilisation constante.

Je n'ai pas encore vu de recherches sur ce qui est pire, et je doute fort que votre professeur ait accès à des recherches prétendant différemment.

En fin de compte, vous devrez prendre la décision en fonction de vos besoins, mais l’avantage financier pour la plupart des entreprises est de disposer de leurs serveurs et services tout le temps, et pas seulement lorsque quelqu'un entre et l’active. Surtout en cas de débat, vous risquez de causer plus de problèmes à vos serveurs en les désactivant.


7

Ce qui est plus important, c'est le refroidissement. Le refroidissement fait une grande différence. La température à l'intérieur de la boîte peut être beaucoup plus élevée que la pièce. Je voudrais installer un logiciel pour surveiller cela comme tout le monde. En comparant le disque dur moderne à celui que vous avez remplacé, ils fonctionnent à chaud. Certains ont besoin de ventilateurs pour les refroidir Parfois, un petit ventilateur peut faire toute la différence. La durée de vie du disque dur et du serveur dépendra du refroidissement.


5

Ouais pas une option. Dites à vos professeurs que la norme en vigueur dans l'industrie consiste à les laisser fonctionner 24 heures sur 24, 7 jours sur 7 et à garantir les matériels défaillants. Si le serveur a 16 ans, j'imagine que vous n'obtiendrez pas cette garantie.
Si le serveur explose, quel temps de récupération faudrait-il pour en créer un nouveau avec les informations sauvegardées? Je commencerais par laisser entendre aux clients que leur serveur était en fin de vie et qu'ils devraient commencer à chercher des fonds pour en acheter un nouveau.


5

Il est vrai que les contraintes mécaniques du cycle de puissance sont lourdes pour le disque dur. En outre, certains disques plus anciens (qui, une fois suffisamment refroidis), pouvaient cesser de fonctionner en raison de "problèmes".

Avec des circuits mal conçus, les courants d’allumage provenant de la mise sous tension de la machine pourraient également stresser certains composants, bien que cela ne soit pas tout à fait probable.

Cela dit, il est vrai que laisser la machine en marche a des conséquences néfastes: les condensateurs. Les nombreux condensateurs électrolytiques de la carte mère sont probablement le maillon faible de la fiabilité du système. Ces condensateurs sont conçus pour leur capacité de traitement du courant / de la tension, leur température de fonctionnement et leur durée de vie. Les condensateurs typiques seront évalués pendant plusieurs milliers d’heures. Les capuchons à usage intensif / longue durée de vie sont conçus pour plusieurs dizaines de milliers d'heures et des températures plus élevées.

C'est pourquoi vous voyez parfois des cartes mères à vendre comportant des «condensateurs de niveau serveur», parce que ces machines fonctionnent à pleine vitesse 24x7 et durent toute la vie de la carte mère.


Il y a 15 ans, j'ai entendu parler de «statistication de disque» ou quelque chose du genre. L'explication fournie était qu'après avoir fonctionné pendant des années, les polymères dans les lubrifiants de disque commençaient à former de longues chaînes et lorsque le disque était mis hors tension et arrêtait de faire tourner les roulements. saisir et ne pas recommencer '. Les pannes de courant sur un contrôleur de domaine signifiaient généralement que de nombreux serveurs ne redémarraient pas. Bien sûr, je n'ai aucune idée de ce que les disques utilisent comme / à la place des roulements maintenant.
jqa

+1 pour striction. Je me demandais si quelqu'un le mentionnerait. @james, cela s'appelle "striction", et beaucoup de travail a été fait pour trouver des lubrifiants pour les disques durs qui ne s'épaississent pas avec le temps, utilisez / abusez. Les choses vont mieux qu'avant, mais il n'est toujours pas judicieux d'allumer et d'éteindre les disques, car ils risquent davantage de mourir lorsque le moteur tombe en panne, soit parce qu'un composant explose, soit que les moteurs d'entraînement ne parviennent pas à faire tourner les plateaux.
Greg

La plupart des cartes mères produites à partir de 2008 (peut-être plus tôt) utilisent désormais des condensateurs à l'état solide, qui ont une durée de vie BEAUCOUP supérieure à celle des dispositifs électrolytiques. Les alimentations électriques sont désormais le seul endroit où vous voyez encore des condensateurs électrolytiques.
Mircea Chirea le

C'est stiction (bâton + frottement), pas striction. :-)
kindall

2

Lorsque le fabricant a demandé une maintenance préventive mensuelle au serveur, celui-ci a commencé par un arrêt mensuel. Cela avait tendance à entraîner des défaillances de composants. L'horaire a changé pour trimestriel, puis pour seulement quand nécessaire. Je ne recommanderais pas d'arrêter un système si vieux à moins que cela ne soit nécessaire.


Oui, j'ai également vu des serveurs avec plus de 1000 jours d'activité. Mais ne pas redémarrer régulièrement (chaud) est un péché; Il est préférable de rencontrer un système défaillant après un redémarrage prévu plutôt qu’après un redémarrage imprévu. De plus, ces redémarrages ont tendance à révéler les problèmes de configuration.
Sjas

1

Une chose qui n’a pas été mentionnée est que la plupart des serveurs exécutent des tâches de maintenance sur une base quotidienne, hebdomadaire ou mensuelle. Celles-ci sont presque toujours programmées pour le milieu de la nuit, lorsque l'activité devrait être au plus bas.

Sur un système Red Hat, par exemple, ces activités commencent à 4 h 02, heure du serveur. Selon le serveur, ces opérations peuvent durer de quelques secondes à une heure ou plus. Si vous mettez le serveur sous tension à 4h30, ces tâches de maintenance démarreront immédiatement (par anacron) et les premiers utilisateurs à se connecter entre 5h et 5h du matin seraient affectés dans une certaine mesure.

En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.