Quel est le plus grand gain de temps que vous avez mis en place? [fermé]


37

Quels sont les changements que vous avez mis en œuvre qui ont eu le plus grand impact sur le gain de temps dans votre charge de travail quotidienne administrateur système? Quelles sont vos astuces pour travailler plus efficacement et faire plus de choses ou travailler moins pour les mêmes résultats?

Je pense à l’automatisation, aux changements de flux de travail / processus, aux nouveaux outils, à l’arrêt complet, à la sous-traitance, à une meilleure délégation, au changement de logiciel / matériel, à la réduction de la bureaucratie, etc.


Cette question est hors sujet selon les règles d'actualité actuelles.
HopelessN00b

Réponses:


30

surveillance + alerte - ce qui est un excellent filet de sécurité. de même que les développeurs écrivent des tests unitaires pour s’assurer que tout ne soit pas gâché lors de la mise à jour du code, je me fie à la surveillance en tant que filet de sécurité supplémentaire au cas où j’aurais bousillé quelque chose [déconnecter un serveur, refuser le trafic de production sur le pare-feu, etc.] . cela donne une tranquillité d'esprit - si les choses se cassent, je le saurai avant que les clients n'appellent.


De plus, nous avons un grand téléviseur accroché au mur, affichant des diagrammes rotatifs de notre réseau (réalisés avec nagios et nagvis). Crée une grande visibilité et la dernière version de nagvis est un produit étonnant. Donne à votre patron et à vos utilisateurs le sentiment que vous êtes en contrôle (ce que vous êtes une fois que vous avez cela).
Wolfgangsz

26

Pour moi, il s’agit d’une authentification centralisée.

Je suis arrivé au point d’administrer une quarantaine de machines Slackware, et chacune d’elles disposait d’une authentification locale PLUS d’une authentification Samba locale. J'avais aussi une solution VPN où chaque compte devait être configuré, ainsi qu'un serveur Jabber interne et un serveur de messagerie interne. Tout avait son propre compte. MAC (Moves, Adds, Changes) étaient insensés.

Alors, je suis passé de Slackware à CentOS, j'ai créé une infrastructure Active Directory et utilisé Likewise Open pour authentifier toutes mes machines Linux auprès d'AD. Cela m'a probablement fait gagner 20 heures par mois sans même plaisanter.

Maintenant, tout ce que je peux authentifié par AD est authentifié et cela fonctionne extrêmement bien. Je ne peux pas recommander assez d'authentification centralisée si vous faites toujours les choses à l'ancienne.


Savez-vous si la même ouverture résoudra le problème des domaines sécurisés que fait samba? Voir serverfault.com/questions/35492/…
chmeee

1
chmeee: Je ne sais pas, mon infrastructure n’est pas aussi compliquée que la tienne. Je vous suggère de l'essayer sur une boîte de rechange. De même, Open est gratuit et ne fait aucune modification de domaine, mis à part l'ajout de la machine à l'unité d'organisation des ordinateurs AD.
Matt Simmons

Pourquoi AD et non OpenLDAP ou celui de Redhat / Netscape? Est-ce principalement un réseau Windows?
David Gardner

Parce que je connaissais AD et pas OpenLDAP ou Redhat Directory Server
Matt Simmons

20

Je suis d'accord avec les choix évidents ici; Automatisation et authentification centralisée. Cependant, il semble que je doive être le type à mentionner la documentation .

En documentant autant de problèmes, de flux de travail, d'installations et de guides que possible, les personnes ont pu résoudre certains de leurs problèmes sans qu'il soit nécessaire que notre service en prenne connaissance.

Un autre bon gain de temps est le suivi des problèmes .

Être capable de hiérarchiser les tâches, de les assigner aux membres de l’équipe et de se débarrasser de tout le fouillis de personnes envoyant des demandes par courrier électronique, msn ou venant simplement au bureau. Cela aide également nos bons amis, les responsables, à voir votre efficacité (si vous le souhaitez).

Ensuite, bien sûr, la cerise sur le gâteau serait ma tasse «RTFM» (Read The Fine Manual) qui est souvent soulevée.


Surveiller + Alerter à mon humble avis est bien meilleur que la documentation. C'est de la documentation implicite (ce n'est pas que je n'aime pas les documents écrits). Accord sur le suivi des problèmes, ne pourrait pas faire sans
serverhorror

2
Monitonring + Alerting sont le "quoi". La documentation est le "pourquoi".
David Mackintosh

Vous pouvez avoir toute la surveillance et toutes les alertes que vous voulez, mais si vous ne possédez aucune documentation sur ce qu'il faut faire lorsque le pageur s'éteint ou des notes sur la manière d'étendre la surveillance, vous serez bloqué pour répondre à toutes les pages et pour conserver toutes les informations. la surveillance vous-même. La documentation permet le transfert de connaissances afin que vous puissiez construire votre équipe et laisser les autres intervenir pour partager le travail.
dannyman

17

L'automatisation d'infrastructure avec un outil tel que Chef ou Puppet est la meilleure chose que j'ai implémentée sur les systèmes que je gère. La surveillance est excellente et tout, mais souvent, il est très laborieux de faire en sorte que les différents éléments fonctionnent bien avec le reste de l’infrastructure. Chef et Puppet automatisent parfaitement l’ensemble de l’infrastructure en fournissant beaucoup de colle qui était écrite à la main. Rassembler particulièrement quels serveurs fournissent quels services.

Chef a intégré la possibilité d'interroger le serveur pour connaître les attributs et les recettes appliqués aux autres nœuds. Vous pouvez ainsi savoir qui sont les serveurs Web de production ou le maître de la base de données, ce qui facilite grandement l'automatisation. Puppet peut le faire aussi, mais cela nécessite un outil de classification de nœud externe tel que iClassify .

Cela devrait avoir des implications évidentes pour les outils de surveillance et de tendance tels que Nagios et Munin. Il peut également, par exemple, fournir une configuration automatisée des environnements équilibrés en charge, de sorte que les LB puissent interroger tous les serveurs Web devant être couverts pour une application particulière.

L’autre autre grand gain de temps que j’ai implémenté dans divers environnements est celui des versions automatisées, telles que kickstart (redhat / centos) et preseed (debian / ubuntu). Cela devrait être évident pour la plupart des gens, mais il peut être surprenant de voir combien de sites construisent encore des systèmes à partir de CD. C'est encore mieux si la construction automatisée prépare le système à exécuter Chef ou Puppet afin de préparer tous les autres produits.


2
La gestion de la configuration (j'ai utilisé marionnette) et le serveur PXE (cordonnier) m'ont permis de gagner beaucoup de temps. Mais la plus grande économie de temps vient de la "gestion du temps". Le livre "Gestion du temps pour les administrateurs système" de Tom Limoncelli est inestimable à cet égard. Maintenant que ma journée est plus structurée et planifiée, je passe moins de temps à «planifier» et à remettre à plus tard et plus de temps à faire ce qui est pertinent.
aussielunix

De bons outils d’automatisation, mais connaissez-vous des outils similaires à Chef ou Puppet qui ne sont pas basés sur Ruby?
Andrioid

@Android - cfEngine, mais Chef et Puppet sont plus agréables à utiliser, tout comme Ruby: D.
jtimberman

Découvrez Bcfg2. Ses capacités sont similaires à celles de Puppet, mais écrites en Python.
Kamil Kisiel

16

Plusieurs moniteurs, avec une fenêtre ouverte sur la console de chaque serveur dont j'étais responsable.


6
Cela n'échelonnera que jusqu'à présent.
Teddy

Oui. Bien que je puisse continuer à ajouter des machines supplémentaires avec des moniteurs supplémentaires, vous ne pouvez vraiment pas aller aussi loin.
Alan H

7

La surveillance est excellente, bien sûr, mais je ne suis pas sûr que ce soit un gain de temps. Pour mon argent, il s'agissait d'une journalisation centralisée, avec un système de visualisation qui filtrait le quotidien, mettait en évidence le dangereux (panne de disque, recherche de virus) et affichait tout le reste pour la catégorisation.

syslog (et perl) pour la victoire.

Cela m'a permis de lire les journaux d'événements de tous les ordinateurs du réseau tout en mangeant mon bagel; au moins un contrôle rapide pour rechercher quelque chose d'effrayant. D'énormes gains de temps.


+1 journalisation centralisée et création de rapports scriptés Perl.
David Mackintosh

Nous déployons logcheck sur nos serveurs. Il faut un peu de temps pour ajouter des filtres pour les lignes qui ne nous intéressent pas, mais c'est utile.
David Pashley

1
Je connais sa publicité, mais jetez un coup d'œil à splunk, un système de centralisation des bûches avec une magnifique extrémité avant.
James

6

Suppression des droits d'administrateur local pour tous les utilisateurs. (si je peux)

Cela a eu pour effet que je n'ai pas à traiter avec l'un des, comment puis-je installer l'application X (parce que vous n'êtes pas autorisé à le faire maintenant), mon ordinateur a un virus / un logiciel espion, mon ordinateur est lent et à peu près tout ce qui a trait à cela.

Je n'avais jamais remarqué à quel point cela rendait les postes de travail stables jusqu'à ce que je tombe sur un poste qui avait été complètement oublié lors des audits, des mises à jour de Windows, etc. Il fonctionnait depuis environ 4 ans sans qu'une seule mise à jour ne soit effectuée. Je pense que c'était sur Windows SP1. Ce site ne s'est jamais plaint d'un problème avec lui et quand je l'ai découvert, je l'ai trouvé très bien.


C'est un très bon conseil pour une petite entreprise qui effectue la transition délicate vers une entreprise de taille moyenne.
staticsan

1
Laissez-moi juste ajouter que cela ne fonctionne pas de regrouper tous les utilisateurs dans une politique comme celle-ci. S'il existe des utilisateurs légitimes (développeurs, par exemple), ils doivent être traités différemment. Sinon, a) ils ne peuvent pas faire leur travail et b) ils le subvertiront de toute façon, ce qui causera d'autres problèmes. Ainsi, la stratégie doit prendre en compte de nombreux types d'utilisateurs.
Jplindstrom

Ne présumez pas que les développeurs ont besoin d'un accès administrateur. S'ils n'ont pas accès à l'administrateur, ils développeront peut-être des programmes fonctionnant correctement en tant qu'utilisateurs limités (pour un changement). Certains utilisateurs en ont besoin, c'est pourquoi on leur attribuerait un deuxième compte pour installer un logiciel, etc., de sorte que leur compte quotidien reste un utilisateur limité. Cela ressemble beaucoup au fonctionnement du monde Linux. S'ils le subvertissent, c'est facile, limitez la première personne, le reste se mettra très vite en ligne. S'ils ont besoin de quelque chose installé pour faire leur travail, demandez-leur ce dont ils ont besoin, pas un accès administrateur.
SpaceManSpiff

6

Virtualisation (VMware)

Entre le déploiement de serveurs à partir de modèles, la gestion de serveurs à partir d’une interface unique et la surveillance matérielle détaillée intégrée au client d’infrastructure, cela a vraiment changé la manière dont nous gérons notre infrastructure.

Et l'impact qu'il a eu sur la façon dont nous pensons à notre "matériel" en a vraiment fait un changeur de jeu. Les clusters ne sont plus "trop ​​chers" car nous pouvons les déployer virtuellement. Besoin de plus de serveurs Citrix, clonez-le. Tant que nous maintenons notre batterie de matériel physique en fournissant les ressources adéquates (et que ces serveurs sont réellement des produits de base), tout est parfait.


4

cfengine pour la gestion de la configuration sous debian / linux.

openvpn pour connecter les stations satellites

Tighvnc via le vpn pour atteindre les 2300 clients Windows dans les stations satellites.

munin et nagios pour la surveillance et les rapports

smartmontools sur les serveurs pour des contrôles sains automatiques (et des messages d'état, en cas de problème)

raid1 (mise en miroir) sur les serveurs. Si un disque tombe en panne, le serveur fonctionne toujours, ce qui est vraiment important pour la gestion de mon temps.

Méta

TeamWork - Inutile de tout faire soi-même. partager le travail et ensemble, vous êtes plus productif.

Ambiance de travail: respectez vos amis, faites des blagues et riez - c’est extrêmement utile pour une atmosphère positive et créative.

Profitez de votre travail! mec, j'aime mon travail! Cela me fait vraiment goog (je pense;))


4

Pour moi, c'était pour embaucher un très bon administrateur système.


3

Fantoche. L'idée de changer un endroit et d'avoir tous les systèmes affectés est fantastique.

Ajoutez à cela des installations standard et il est très rapide de mettre en place un nouveau système. Vous lancez sur le réseau et lancez une installation stock, puis marionnette prend le relais et tout est configuré.

Enfin, standardisez. Non, vous ne voulez vraiment pas 35 distributions Linux différentes et 4 versions différentes de Solaris. Travaillez pour passer à une installation standard. Chaque système unique que vous désactivez vous fait gagner beaucoup de temps.


2

Ajouter un autre vote pour la surveillance. Le principe est assez simple: je veux savoir ce qui se passe avant que les utilisateurs ne soient affectés. L’administration système devrait idéalement jouer un rôle transparent. Les utilisateurs ne doivent ni savoir ni se soucier de ce que vous faites. De leur point de vue, cela devrait simplement fonctionner. Les utilisateurs heureux et satisfaits doivent égaler les administrateurs heureux et satisfaits.

Une chose qui est souvent négligée dans les TI est que les ordinateurs sont là pour fonctionner pour nous, pas l'inverse. Néanmoins, je connais des administrateurs qui passent une bonne partie de leur journée à vérifier manuellement leurs serveurs et les journaux. Pourquoi? Les ordinateurs peuvent se surveiller les uns les autres et avec un peu de script, vous ne pouvez recevoir que la partie intéressante des journaux. En réalité, vous n'avez pas besoin de parcourir quelques millions d'entrées informatives, telles que le travail d'impression de Fred ou le transfert DNS réussi. Dis-moi juste quand ils ne le sont pas.


2

Le gain de temps le plus important que j'ai mis en œuvre est l'imagerie de disque de nos postes de travail de production. Ils sont tous identiques et personne ne stocke quelque chose localement, donc s'il y a un problème, je re-crée une image de la machine et tout est prêt à fonctionner, comme neuf.


2

Le gain de temps est le plus important lorsque les systèmes sont en panne.

J'ai documenté toutes les informations sur les contrats d'assistance dans des fichiers texte normalisés dans une structure de répertoires normalisée. J'avais une centrale et je gardais plus d'une copie.

Chaque bit d'information (portail Web, numéro de téléphone, point de contact, date d'expiration, numéro de contrat, raccourcis du menu du téléphone, etc.) était précédé par une balise standard au format .ini ancien (balise: données).

Trouver un numéro de téléphone était aussi simple que d'aller dans le répertoire de niveau supérieur et de lancer:

grep Phone */*support.txt | more

Où le premier caractère générique étendu au fournisseur et / ou au nom du produit.

Je n'ai pas utilisé Excel, Word, OpenOffice, une base de données, etc., simplement parce que, lorsque quelque chose est en panne, cela peut être la chose même qui détient vos informations de support. De plus, ils ne sont pas facilement visibles depuis un écran de console en mode texte.

J'ai également documenté toutes les procédures de la même manière.


Upvote pour réaliser la valeur commerciale du temps.
jplindstrom

2

J'ai mis en place un wiki du département informatique (en utilisant Mediawiki pour les personnes intéressées) il y a plusieurs années. Lorsque nous avons commencé à nous familiariser avec son utilisation, la réponse à de nombreuses questions posées dans le bureau était "Avez-vous vérifié le wiki?" Il nous a fallu un peu de temps pour nous habituer à vérifier le wiki pour des informations spécifiques, mais une fois que nous l’avons fait, nous avons réalisé que c’était un potentiel énorme. Nous avons toutes les informations dont nous avons besoin à portée de main - s'il y a quelque chose qui n'y est pas, nous avons la possibilité d'ajouter / de changer une page rapidement.



1

Je suis d'accord avec pQd sur la surveillance.

Bien que nous n'ayons pas encore vu tous les avantages, la mise en œuvre de la gestion de la configuration à l'aide de Puppet promet de nous faire gagner un temps considérable et de réduire considérablement les erreurs.


1

J'ai trouvé AutoIt et plus tard AutoHotkey et tombé amoureux de .

Mon dernier emploi concernait un fabricant de véhicules personnalisés. Les assembleurs étaient des utilisateurs d’ordinateurs peu compétents et ont réussi à bloquer le programme qu’ils devaient utiliser pour entrer le travail sur lequel ils travaillaient. Chaque jour, plusieurs fois par jour, je devais parcourir plus de 15 postes de travail répartis dans 3 bâtiments différents, puis supprimer le programme bloqué, le relancer et le ramener à l'écran de saisie de données. J'ai finalement installé VNC pour pouvoir le faire à distance, ce qui réduisait le temps de déplacement, mais impliquait toujours que je me souvienne d'entrer et de réinitialiser les machines de temps en temps. Quand j'ai trouvé AutoIt, j'ai réalisé que je pouvais configurer le programme pour qu'il surveille l'ordinateur. S'il n'y avait aucune entrée pendant 5 minutes, il pouvait réinitialiser le programme, taper et cliquer sur tout ce qui était nécessaire pour le ramener à l'écran de saisie.


1

++ pour l'authentification centrale et la gestion de compte, y compris la création de compte ET la gestion des terminaisons. Nous avons AD (deux forêts) et LDAP (et jusqu'à récemment NDS) avec divers groupes accédant à des ressources existant dans l'un ou l'autre annuaire. Le temps que nous avons mis à synchroniser les répertoires et à gérer toutes les ressources dans l’un ou l’autre des répertoires en a valu la peine.

L'autre grande victoire a été l'automatisation, qu'il s'agisse de nettoyage de compte, de centralisation de la configuration ou autre.

Je ne sais pas trop combien de temps la surveillance enregistre, mais c'est essentiel. Il n'en faut pas beaucoup pour qu'un environnement devienne suffisamment grand ou complexe pour que la "vérification manuelle" soit impossible et inefficace. De plus, il est agréable de dormir parfois. ;)

C'est peut-être un peu en dehors de la pensée principale à ce sujet, mais nous avons également eu un gain énorme lorsque nous avons normalisé notre plate-forme matérielle. Nous avons choisi une plate-forme de serveur utilisable en interne pour tous les systèmes d'exploitation et que nous utilisons depuis plusieurs années. Nous avons appris le matériel et la gestion à distance, ce qui permet d'économiser temps et énergie de différentes manières:

  1. Plus besoin de prendre en charge une demi-douzaine ou plus de types de serveurs fantasques, chacun ayant ses propres défauts
  2. Support inter-équipes: en ce qui concerne le matériel, les utilisateurs d’Unix le savent, les gens de Windows le savent, même les gens du réseau le connaissent suffisamment pour pouvoir tenir dans la main selon les besoins, car plusieurs de leurs appliances s’exécutent sur le matériel.
  3. pièces de rechange!

Il en va de même pour les versions de système d'exploitation standard, documentées et révisées. Cela peut sembler élémentaire, mais je rencontre souvent des magasins où les versions ne sont pas standard et il n’ya pas de limite à déconner pour savoir si cet outil est présent ou si un serveur particulier a les paramètres adéquats. Ce genre de chaos peut transformer même les tâches et les problèmes les plus élémentaires en projets fired.


1

Apprendre à déléguer et à faire confiance à mes collègues - une fois que vous savez que vous pouvez céder du travail à d’autres personnes, la vie devient beaucoup plus détendue. Et pas parce que je suis paresseux et que tout le monde fait mon travail pour moi; c'est la tranquillité d'esprit que de savoir que vous disposez d'une bonne sauvegarde. Et, bien sûr, des configurations de système d'exploitation normalisées et bien surveillées sur du matériel standard. Ça coule de source.

Mon objectif en matière d’automatisation a toujours été de recevoir à nouveau un courrier électronique me demandant: et puis une fois que j'ai envoyé le bogue aux développeurs, je peux revenir à la lecture du journal et au café. Nous n'en sommes pas encore là, mais nous avons parcouru un long chemin depuis le chaos réactif que nous affrontions tous les jours.


1

J'ai récemment implémenté AntHill Pro au travail et toutes nos versions et déploiements pour un certain nombre de projets sont complètement automatisés et suivis. Cela incluait la création d'une bibliothèque Ant de déploiement Tomcat partagée que tous les projets utilisaient, simplifiant ainsi la maintenance de ces projets dans AHP. La prochaine étape consiste à créer une bibliothèque similaire pour les déploiements de CDA de site.

Bien que cela ne me fasse pas gagner du temps personnellement, cela fait gagner du temps à nos développeurs et à notre personnel d'exploitation. J'aime être le bidon d'huile pour les roues des autres. :-)

J'espère pouvoir consulter Chef et Puppet pour aider à automatiser les processus d'infrastructure.

Oh, et la documentation est une aide énorme. Cela fait gagner beaucoup de temps de simplement orienter les gens vers un document bien écrit plutôt que de répondre à la même question 20 fois.


1

Mon plus gros gain de temps a été l’utilisation de scripts préconfigurés pour l’installation de nos stations de travail Linux. nous avons des sous-traitants qui vont et viennent tout le temps, nous avons donc un pool de postes de travail qui sont régulièrement réutilisés. Quand ils reviennent au service informatique, nous insérons le CD d’installation, ajoutons le fichier de préconfiguration à la commande d’installation et, dans les 20 minutes (sans autre frappe au clavier), la boîte revient à une nouvelle les outils et préconfigurés pour fonctionner dans notre réseau. Plug'n'play.

En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.