Evan a réussi quelques bons points, mais voici peut-être un moyen rentable spécifique d'obtenir un temps de récupération inférieur à 1 heure en cas d'échecs.
Les petites entreprises signifient probablement un petit matériel, il peut donc ne pas être très coûteux de faire des choses simples qui ajoutent en fait une quantité importante de résilience face aux problèmes. L'idée principale est simplement d'avoir du matériel supplémentaire prêt à l'emploi.
Tout d'abord, familiarisez-vous avec l'idée d'une adresse IP virtuelle. Il s'agit de l'adresse IP à laquelle les utilisateurs parleront, mais elle peut résider sur n'importe quel serveur auquel vous la communiquez. Il s'agit de l'adresse IP que vous utilisez et les applications voudront parler. Et ce sera le plus utile pour ultimement toute solution que vous choisirez. Avoir un VIP signifie que vous ne devriez pas avoir à reconfigurer l'une des applications lors du basculement. Gardez également à l'esprit que le fait d'avoir du matériel redondant a également pour effet d'augmenter les frais d'administration, en effectuant deux mises à jour de configuration au lieu d'une.
Si nous commençons avec votre serveur de routage / proxy Web, c'est probablement le plus simple car leur état réel ne devra pas être stocké sur la boîte elle-même. Il suffit donc d'obtenir un double de la même boîte et de le configurer de la même manière. Je garderais les deux branchés sur le segment LAN, et en supposant que vous êtes sur Internet sur une autre interface, échangez les câbles si leur échec. Du point de vue du routage, vous définissez tous vos clients LAN pour cibler l'adresse .1 (VIP) pour leur route par défaut et le serveur proxy donne au serveur A l'adresse .2 et au serveur B l'adresse .3. De cette façon, ils peuvent tous deux être gérés pour les mises à jour de configuration (s'applique aux deux). Et tout ce que vous avez à faire pour basculer est de supprimer l'affectation IP .1 de .2 et de la déplacer vers .3, et de déplacer la connexion Internet vers l'autre interface. Ce n'est pas très compliqué, facile à faire et à comprendre, et coûte le matériel supplémentaire d'une deuxième boîte. Si vous pouvez obtenir une redondance du côté Internet, vous pouvez ajouter de la complexité et obtenir un basculement automatique en utilisant quelque chose comme VRRP.
Sans détails, c'est difficile à dire, mais votre serveur Web peut être tout aussi simple. Ajoutez un deuxième serveur avec une configuration identique, créez un vIP entre les deux et déplacez le VIP vers la sauvegarde en cas d'échec. Cela ne me dérange généralement pas si l'état de la session est perdu lors d'un basculement (c'est un problème critique de provoquer un basculement). Donc, si les utilisateurs doivent se reconnecter, ce n'est pas grave. Encore une fois, vrrp peut probablement être utilisé pour le basculement automatique.
Passer à votre base de données, c'est beaucoup plus complexe. La plupart des bases de données ont une sorte de modèle principal / secondaire, dans lequel vous sauvegardez la base de données d'origine sur le secondaire, puis copiez tous les journaux de transactions ou les modifications de base de données dans le secondaire. Encore une fois, vous pouvez combiner cela avec des VIP pour les applications / utilisateurs qui accèdent réellement à la base de données. Cependant, le basculement est plus compliqué. En fonction de l'échec du serveur principal, vous devrez peut-être réellement installer les disques pour les copier et les journaux de transactions restants. Amenez ensuite le secondaire actif. Si vous pouvez tolérer certaines données perdues, vous pouvez immédiatement activer le secondaire. Après le basculement, le serveur B est maintenant votre serveur principal, et votre travail consiste à restaurer le serveur A et à le transformer en nouvelle sauvegarde afin qu'il soit prêt à être défaillant lorsque le serveur b finit par rencontrer des problèmes.
Les serveurs de fichiers sont toujours la partie la plus difficile, car contrairement aux bases de données, il est beaucoup plus difficile d'obtenir une fonction intégrée du système de fichiers. Cependant, un certain niveau de résilience peut être atteint en ayant un deuxième serveur, et en écrivant simplement un script qui analyse le système de fichiers pour les modifications, et en copiant tous les nouveaux fichiers sur votre secondaire. Vous pouvez essentiellement exécuter rsync sur un cron que je crois faire. Encore une fois, vous utilisez un VIP que vous donnez aux utilisateurs, que vous déplacez si vous effectuez un basculement. Dans votre script, je vous recommande fortement de vérifier que le système est le propriétaire du VIP avant de transférer des fichiers. Vous ne voulez vraiment vraiment pas que le rsync s'exécute dans la mauvaise direction et écrase toutes les modifications que vous faites. Cela pourrait perdre certains fichiers en cas d'échec,
Je n'ai aucune idée de ce que vous pourriez faire à propos de votre système téléphonique ... cela dépend vraiment du fournisseur et de la configuration. Le fournisseur peut avoir une solution standard pour la résilience.
Quelques derniers mots d'avertissement. Assurez-vous de tester soigneusement toute configuration que vous allez utiliser. Assurez-vous de savoir comment le basculer sans perdre ces informations critiques. Testez test test pour vous assurer qu'il fonctionnera lorsque vous en aurez besoin. Assurez-vous que des processus sont en place pour que les modifications de configuration, les mises à jour logicielles, etc. soient appliquées correctement aux sauvegardes principales et. La bonne nouvelle est que vous pouvez probablement effectuer des basculements contrôlés lorsque vous souhaitez mettre un serveur à niveau, etc. Ce n'est pas une configuration active-active, vous n'avez donc aucune idée si le secondaire fonctionnera lorsque vous en aurez besoin.
Je travaille dans les télécoms et nos équipements sont très redondants, y compris dans la plupart des cas la redondance géographique. Notre point de défaillance numéro 1 est que la redondance n'est pas testée après les modifications et que les utilisateurs apportent des modifications qui ne savent pas comment fonctionne le modèle de redondance. Cependant, nous avons le problème supplémentaire que tous nos équipements doivent prendre en charge le basculement automatique en quelques secondes au maximum. Vous pouvez tolérer une intervention manuelle dans vos basculements si vous n'avez besoin d'être opérationnel qu'en 30 à 60 minutes. Vous avez juste besoin d'être préparé. Bonne chance.