Il existe de nombreuses façons de gérer des données de cette taille. Cela dépend en grande partie de votre environnement et du montant que vous êtes prêt à dépenser. En général, il existe quelques stratégies globales pour «retirer les données du serveur»:
- Sur l'Ethernet Comme il est dit sur la boîte, les données sont transmises à Some Where Else pour être gérées. 20 To prendront beaucoup de temps à copier sur 1 GbE, mais cela peut être fait. Le matériel peut vous aider (comme les liaisons 10 GbE ou, dans certains cas, la liaison NIC).
- Sur le sous-système de stockage Si vous êtes sur Fibre Channel, envoyez-le à un autre périphérique sur le réseau FC. Si vous avez SAS, envoyez-le à un périphérique connecté à SAS. Généralement plus rapide qu'Ethernet.
- Envoyez-le à une autre baie de disques Envoyez-le à un autre morceau de stockage connecté au même serveur.
C'est la vue à 100 km. Une fois que vous commencez à zoomer, les choses deviennent beaucoup plus fragmentées. Comme déjà mentionné, LTO5 est une technologie de bande spécifique conçue pour ces types de charges haute densité. Une autre baie de stockage identique est une bonne cible, surtout si vous pouvez utiliser quelque chose comme GlusterFS ou DRBD pour obtenir les données là-bas. De plus, si vous avez besoin d'une sauvegarde rotation de ou simplement de la possibilité de continuer à fonctionner en cas de défaillance de la baie, cela affectera ce que vous mettez en place.
Une fois que vous avez opté pour une méthode d'affichage à 100 km, entrer dans le logiciel sera la prochaine grande tâche. Les facteurs qui influencent cela sont ce que vous pouvez installer sur votre serveur de stockage en premier lieu (si c'est un NetApp, c'est une chose, un serveur Linux avec un tas de stockage est une tout autre chose, tout comme un serveur Windows avec un tas de stockage) , quel matériel vous choisissez (tous les packages de sauvegarde FOSS ne gèrent pas bien les bibliothèques de bandes, par exemple), et quel type de rétention de sauvegarde vous avez besoin.
Vous devez vraiment déterminer le type de récupération après sinistre que vous souhaitez. La réplication en direct simple est plus facile, mais ne vous permet pas de restaurer à partir de la semaine dernière seulement maintenant. Si la capacité de restauration à partir de la semaine dernière est importante pour vous, alors vous devez concevoir pour ce genre de chose. Selon la loi (aux États-Unis et ailleurs), certaines données doivent être conservées pendant plus de 7 ans.
La réplication simple est la plus simple à faire. C'est ce que DRBD est conçu pour faire. Une fois la copie initiale effectuée, elle envoie simplement les modifications. Les facteurs de complication ici sont la localité du réseau, si votre 2e baie n'est pas proche du DRBD principal peut ne pas être faisable. Vous aurez besoin d'un deuxième serveur de stockage avec au moins autant d'espace de stockage que le premier.
À propos de la sauvegarde sur bande ...
LTO5 peut contenir 1,5 To de données sans compression. Nourrir ces monstres nécessite une mise en réseau très rapide, soit Fibre Channel ou SAS 6 Go. Étant donné que vous devez sauvegarder plus de 1,5 To en un clin d'œil, vous devez vous pencher sur les chargeurs automatiques (voici un exemple: link , un chargeur automatique à 24 logements de 1 lecteur de HP). Avec un logiciel qui les prend en charge, ils géreront pour vous le changement des bandes en cours de sauvegarde. Ils sont super. Vous devrez toujours retirer les bandes pour les envoyer hors site, mais c'est une sacrée vue mieux que de traîner toute la nuit pour charger les bandes vous-même lorsque la sauvegarde les appelle.
Si la bande vous donne les heebiegeebies « hérités, ew », une bibliothèque de bandes virtuelle peut être plus rapide (comme celle de Quantum: lien ). Ceux-ci prétendent être des bibliothèques de bandes pour sauvegarder des logiciels tout en stockant les choses sur le disque avec des techniques de déduplication robustes (vous l'espérez). Les plus amateurs copieront même des bandes virtuelles sur des bandes réelles pour vous, si vous aimez ce genre de chose, ce qui peut être très pratique pour les rotations hors site.
Si vous ne voulez pas vous fâcher avec des bandes même virtuelles, mais que vous voulez toujours faire des sauvegardes directes sur disque, vous aurez besoin d'une matrice de stockage suffisamment grande pour gérer ces 20 To, plus les données de changement net que vous souhaitez à garder. Différents packages de sauvegarde gèrent cela différemment. Certaines technologies de déduplication sont vraiment agréables, d'autres sont des plaisanteries hacky. Personnellement, je ne connais pas l'état des logiciels de sauvegarde FOSS dans ce domaine (j'ai entendu parler de Bacula), mais ils peuvent être suffisants. De nombreux packages de sauvegarde commerciaux ont des agents locaux que vous installez sur des serveurs à sauvegarder afin d'augmenter le débit, ce qui présente de nombreux avantages.