Réponse courte
Il est impossible de garantir une longue période à cause de l'entropie (également appelée mort!). Les données numériques se décomposent et meurent, comme toute autre chose dans l'univers. Mais cela peut être ralenti.
Il n'existe actuellement aucun moyen fiable et scientifiquement prouvé de garantir plus de 30 ans d'archivage de données froides. Certains projets visent à le faire, comme le projet Rosetta Disks du musée Long Now , bien qu'ils restent très coûteux et avec une faible densité de données (environ 50 Mo).
Entre-temps, vous pouvez utiliser des supports optiques résilients éprouvés scientifiquement pour le stockage frigorifique, tels que les disques Blu-ray type HTL tels que Panasonic ou les DVD + R de type archivistique tels que Verbatim Gold Archival, et les conserver dans un endroit protégé haute température) et hors de la lumière.
Soyez également REDONDANT : créez plusieurs copies de vos données (au moins 4) et calculez les hachages pour vérifier régulièrement que tout va bien, et toutes les quelques années, vous devez réécrire vos données sur de nouveaux disques. En outre, utilisez beaucoup de codes de correction d’erreur , ils vous permettront de réparer vos données corrompues!
Longue réponse
Pourquoi les données sont-elles corrompues avec le temps? La réponse réside dans un mot: entropie . C’est l’une des forces principales et inévitables de l’univers, qui rend les systèmes de moins en moins ordonnés dans le temps. La corruption de données est exactement cela: un désordre dans l'ordre des bits. En d'autres termes, l'univers déteste vos données .
Combattre l'entropie, c'est comme combattre la mort: vous ne réussirez probablement jamais. Mais vous pouvez trouver des moyens de ralentir la mort, tout comme vous pouvez ralentir l'entropie. Vous pouvez également tromper l'entropie en réparant les corruptions (en d'autres termes: vous ne pouvez pas arrêter les corruptions, mais vous pouvez les réparer après qu'elles se soient produites si vous avez pris des mesures à l'avance!). Comme pour tout ce qui concerne la vie et la mort, il n’existe pas de solution miracle, ni de solution unique pour tous, et les meilleures solutions vous obligent à vous engager directement dans la conservation numérique de vos données. Et même si vous faites tout correctement, vous n'êtes pas assuré de garder vos données en sécurité, vous maximisez seulement vos chances.
Maintenant, bonne nouvelle: il existe maintenant des moyens assez efficaces de conserver vos données si vous combinez des supports de stockage de bonne qualité et de bonnes stratégies d'archivage / conservation : vous devez concevoir en cas d'échec .
Quelles sont les bonnes stratégies de curation? Soyons clairs: la plupart des informations que vous trouverez concerneront les sauvegardes, et non l'archivage. Le problème est que la plupart des gens vont transférer leurs connaissances sur les stratégies de sauvegarde aux archives, et ainsi beaucoup de mythes sont maintenant entendus. En effet, stocker des données pendant quelques années (sauvegarde) et les stocker le plus longtemps possible (au moins plusieurs décennies) (archivage) sont des objectifs totalement différents et nécessitent donc des outils et des stratégies différents.
Heureusement, il y a beaucoup de recherches et de résultats scientifiques, je vous conseille donc de vous référer à ces articles scientifiques plutôt que sur des forums ou des magazines. Ici, je vais résumer certaines de mes lectures.
Aussi, méfiez-vous des allégations et des études scientifiques non indépendantes , prétendant que tel ou tel moyen de stockage est parfait. Rappelez-vous le célèbre projet BBC Domesday: «Digital Domesday Book dure 15 ans et non pas 1000» . Vérifiez toujours les études avec des papiers vraiment indépendants, et s'il n'y en a pas, supposez toujours que le support de stockage n'est pas bon pour l'archivage.
Clarifions ce que vous recherchez (d'après votre question):
Archivage à long terme : vous souhaitez conserver des copies de vos données "personnelles" sensibles et non reproductibles. L'archivage est fondamentalement différent de la sauvegarde , comme expliqué ici : les sauvegardes concernent des données techniques dynamiques régulièrement mises à jour et doivent donc être actualisées dans les sauvegardes (par exemple, le système d'exploitation, la disposition des dossiers de travail, etc.), tandis que les archives sont des données statiques qui vous n'écririez probablement qu'une fois et ne lisiez que de temps en temps . Les archives sont destinées à des données intemporelles , généralement personnelles.
Stockage à froid : vous voulez éviter autant que possible la maintenance de vos données archivées. Il s’agit là d’une contrainte BIG, car le support doit utiliser des composants et une méthodologie d’écriture qui restent stables pendant très longtemps, sans aucune manipulation de votre part, et sans nécessiter de connexion à un ordinateur ni à une alimentation électrique.
Pour faciliter notre analyse, étudions d’abord les solutions d’entreposage frigorifique, puis les stratégies d’archivage à long terme.
Milieu de stockage à froid
Nous avons défini ci-dessus ce que devrait être un bon support de stockage à froid: il devrait conserver les données pendant une longue période sans aucune manipulation (c'est pourquoi on l'appelle "froid": vous pouvez simplement le stocker dans un placard et vous n'avez pas besoin de le brancher) un ordinateur pour gérer les données).
Le papier peut sembler être le support de stockage le plus résistant sur Terre, car nous trouvons souvent des manuscrits très anciens datant d’antiquités. Cependant, le papier présente des inconvénients majeurs: premièrement, la densité de données est très faible (ne peut pas stocker plus de 100 Ko sur un papier, même avec des caractères et des outils informatiques minuscules), et il se dégrade avec le temps sans aucun moyen de le contrôler: le papier , tout comme les disques durs, souffrent de corruption silencieuse. Mais alors que vous pouvez surveiller les corruptions silencieuses sur des données numériques, vous ne pouvez pas sur papier. Par exemple, vous ne pouvez pas garantir qu’une image conservera les mêmes couleurs pendant une décennie seulement: les couleurs se dégradent et vous n’avez aucun moyen de trouver les couleurs originales. Bien sûr, vous pouvez organiser vos images si vous êtes un professionnel de la restauration, mais cela prend beaucoup de temps, alors qu'avec les données numériques, vous pouvez automatiser ce processus de curation et de restauration.
Disques durs (HDD) de sont connus pour avoir une durée de vie moyenne de 3 à 8 ans: ils ne se dégradent un peu plus de temps, ils sont garantis finissent par mourir (ex: inaccessible). Les courbes suivantes montrent cette tendance pour tous les disques durs à mourir à une vitesse vertigineuse:
Courbe de la baignoire illustrant l'évolution du taux d'échec du lecteur de disque dur, en fonction du type d'erreur (également applicable à tout appareil technique):
Courbe indiquant le taux d'échec du disque dur, tous les types d'erreur ont été fusionnés:
Source: Backblaze
Vous pouvez voir qu'il existe 3 types de disques durs relativement à leur défaillance: les modèles qui meurent rapidement (par exemple: erreur de fabrication, disques durs de mauvaise qualité, défaillance de la tête, etc.), ceux à taux de mort constant (bonne fabrication, ils meurent pour divers " raisons "normales", c’est le cas de la plupart des disques durs), et enfin des plus robustes qui vivent un peu plus longtemps que la plupart des disques durs et finissent par mourir peu de temps après les "normales" (par exemple: des disques durs chanceux, peu utilisés, conditions environnementales idéales, etc.). Ainsi, vous êtes assuré que votre disque dur mourra.
Pourquoi les disques durs meurent si souvent? Je veux dire, les données sont écrites sur un disque magnétique, et le champ magnétique peut durer des décennies avant de s'estomper. Ils meurent parce que le support de stockage (disque magnétique) et le matériel de lecture (carte électronique + tête rotative) sont couplés : ils ne peuvent pas être dissociés, vous ne pouvez pas simplement extraire le disque magnétique et le lire avec une autre tête, car la carte électronique (qui convertit les données physiques en numérique) est différente pour presque chaque disque dur (même de la même marque et référence, cela dépend de l'usine d'origine), et le mécanisme interne avec la tête rotative est si complexe qu'il est aujourd'hui impossible de le faire pour un humain de placer parfaitement une tête en rotation sur des disques magnétiques sans les tuer.
De plus, les disques durs sont connus pour se démagnétiser avec le temps s'ils ne sont pas utilisés (y compris les disques SSD). Ainsi, vous ne pouvez pas simplement stocker des données sur un disque dur, les stocker dans un placard et penser qu’elles seront conservées sans aucune connexion électrique: vous devez connecter votre disque dur à une source électrique au moins une fois par an ou par couple d’années . Ainsi, les disques durs ne sont clairement pas adaptés à la conservation par le froid.
Bandes magnétiques : elles sont souvent décrites comme étant la solution idéale pour les besoins en matière de sauvegarde et, par extension, pour l'archivage. Le problème des bandes magnétiques est qu’elles sont TRÈS sensibles: les particules d’oxyde magnétique peuvent être facilement détériorées par le soleil, l’eau, l’air, les rayures, être démagnétisées par le temps ou par tout dispositif électromagnétique ou tout simplement tomber avec le temps ou par impression . C'est pourquoi ils ne sont généralement utilisés que dans des centres de données par des professionnels. En outre, il n’a jamais été prouvé qu’ils pouvaient conserver des données plus d’une décennie. Alors, pourquoi sont-ils souvent conseillés pour les sauvegardes? Parce qu'ils étaient bon marché: à l'époque, l'utilisation des bandes magnétiques coûtait de 10 à 100 fois moins chère que celle des disques durs, et les disques durs avaient tendance à être beaucoup moins stables qu'aujourd'hui. Donc, les bandes magnétiques sont principalement conseillées pour les sauvegardes en raison de la rentabilité, pas par résilience, c’est ce qui nous intéresse le plus pour l’archivage des données.
Les cartes CompactFlash et Secure Digital (SD) sont connues pour être assez robustes et capables de résister à des conditions catastrophiques .
Les cartes mémoire de la plupart des appareils photo sont pratiquement indestructibles, selon le magazine Digital Camera Shopper. Cinq formats de carte mémoire ont survécu après avoir été bouillis, piétinés, lavés et trempés dans du café ou du cola.
Cependant, comme tout autre support magnétique, il repose sur un champ électrique pour conserver les données. Par conséquent, si la carte manque de temps, les données risquent d'être totalement perdues. Ainsi, cela ne convient pas parfaitement au stockage à froid (car il est parfois nécessaire de réécrire toutes les données de la carte pour actualiser le champ électrique), mais cela peut être un bon support pour les sauvegardes et l’archivage à court ou à moyen terme.
Supports optiques: les supports optiques sont une classe de supports de stockage reposant sur le laser pour lire les données, comme les CD, DVD ou Blu-ray (BD). Cela peut être vu comme une évolution du papier, mais nous rédigeons les données dans un format si petit que nous avions besoin d’un matériau plus précis et plus résistant que le papier, et les disques optiques ne sont que cela. Les deux principaux avantages des supports optiques sont que le support de stockage est découplé du matériel de lecture (par exemple, si votre lecteur de DVD tombe en panne, vous pouvez toujours en acheter un autre pour lire votre disque) et qu'il est basé sur le laser, qui le rend universel preuve d’avenir (c’est-à-dire que tant que vous savez fabriquer un laser, vous pouvez toujours le modifier pour lire les bits d’un disque optique par émulation, comme l’a fait CAMILEON pour le projet Domesday BBC ).
Comme toute technologie, les nouvelles itérations offrent non seulement une plus grande densité (espace de stockage), mais également une meilleure correction des erreurs et une meilleure résistance à la dégradation de l'environnement (pas toujours, mais généralement vrai). Le premier débat sur la fiabilité d'un DVD a opposé DVD-R à DVD + R, et même si les DVD-R sont encore courants, les DVD + R sont reconnus pour être plus fiables et plus précis . Il existe maintenant des DVD de qualité archivistique, spécialement conçus pour le stockage à froid, affirmant qu’ils peuvent résister à un minimum de ~ 20 ans sans aucun entretien:
Le DVD-R Verbatim Gold Archival [...] a été classé comme le DVD-R le plus fiable lors d'un test de résistance approfondi à long terme par le magazine allemand bien connu c't (c't 16/2008, pages 116-123 ) atteignant une durabilité minimale de 18 ans et moyenne de 32 à 127 ans (à 25 ° C, 50% d'humidité). Aucun autre disque n’a été aussi proche de ces valeurs, le deuxième meilleur DVD-R n’a duré que 5 ans.
De LinuxTech.net .
En outre, certaines sociétés se sont spécialisées dans l' archivage de DVD à très long terme et en ont largement commercialisé, comme le M-Disc de Millenniata ou le DataTresorDisc, affirmant qu'elles peuvent conserver des données pendant plus de 1000 ans et vérifiées par des études ( non indépendantes) (de 2009) parmi les moins scientifiques .
Tout cela semble très prometteur! Malheureusement, il n'y a pas assez d'études scientifiques indépendantes pour confirmer ces affirmations, et les rares qui sont disponibles ne sont pas aussi enthousiastes:
L'humidité (80% HR) et la température (80 ° C) ont accéléré le vieillissement de plusieurs DVD sur plus de 2000 heures (environ 83 jours) de test avec un contrôle régulier de la lisibilité des données:
Traduit de l'Institut français d'archivage de données numériques (Archives de France), étude réalisée en 2012.
Le premier graphique montre les DVD avec une lente évolution de la dégradation. Le second DVD avec des courbes de dégradation rapide. Et le troisième concerne les DVD spéciaux "à très long terme" tels que M-Disc et DataTresorDisc. Comme nous pouvons le constater, leurs performances ne correspondent pas tout à fait aux revendications, étant inférieures ou égales aux DVD standard non archivistiques!
Cependant, les disques optiques inorganiques tels que M-Disc et DataTresorDisc ont un avantage: ils sont assez insensibles à la dégradation par la lumière:
Vieillissement accéléré à la lumière (750 W / m²) pendant 240 heures:
Ce sont d'excellents résultats, mais un DVD de qualité archivistique tel que Verbatim Gold Archival atteint également les mêmes performances. De plus, la lumière est le paramètre le plus contrôlable pour un objet: il est assez facile de placer un DVD dans une boîte fermée ou un placard. en supprimant tout impact possible de la lumière. Il serait beaucoup plus utile d’avoir un DVD très résistant à la température et à l’humidité que la lumière.
Cette même équipe de recherche a également étudié le marché des disques Blu-ray pour déterminer s'il existait une marque offrant un bon support pour le stockage à froid à long terme. Voici leur conclusion:
Le vieillissement accéléré en température et en humidité sur plusieurs marques de disques Blu-ray, avec les mêmes paramètres que pour les DVD:
Vieillissement accéléré sur plusieurs marques BluRays, mêmes paramètres:
Traduit de cette étude d'Archives de France, 2012.
Deux résumés de tous les résultats ici et ici .
En résumé, le meilleur disque Blu-ray (de Panasonic) a des performances similaires à celles du meilleur DVD de qualité archivistique en test d’humidité + température, tout en étant pratiquement insensible à la lumière! Et ce disque Blu-ray n’est même pas de qualité archivistique. De plus, les disques Blu-ray utilisent un code de correction d'erreur amélioré par rapport aux DVD (utilisant eux-mêmes une version améliorée par rapport aux CD), ce qui minimise davantage les risques de perte de données. Ainsi, il semble que certains disques BluRay peuvent constituer un très bon choix pour le stockage à froid.
En effet, certaines entreprises commencent à travailler sur des disques Blu-ray de stockage haute densité de qualité archivistique tels que Panasonic et Sony, en annonçant qu'elles pourront offrir une capacité de stockage de 300 Go à 1 To avec une durée de vie moyenne de 50 ans. De plus, les grandes entreprises se tournent vers des supports optiques pour le stockage à froid (car ils consomment beaucoup moins de ressources car ils peuvent être stockés à froid sans aucune alimentation électrique), comme Facebook qui a développé un système robotique permettant d'utiliser les disques Blu-ray comme des disques "à froid". stockage " pour les données auxquelles leur système a rarement accès.
Initiative archivistique Long Now: Il existe d’autres pistes intéressantes, comme le projet Rosetta Disc du musée Long Now , qui consiste à écrire des pages de la Genèse à l’échelle microscopique dans toutes les langues sur lesquelles elle a été traduite. C’est un projet formidable, qui est le premier à offrir un support permettant de stocker 50 Mo pour un stockage à froid vraiment à très long terme (car il est écrit en carbone), et avec un accès évolutif car il suffit d’une loupe pour accéder au données (pas de spécifications de format étranges ni de problèmes technologiques à gérer comme le faisceau violet du Blu-ray, il suffit juste d’une loupe!). Cependant, ceux-ci sont toujours fabriqués manuellement et coûtent donc environ 20 000 dollars, ce qui est un peu trop pour un système d'archivage personnel, je suppose.
Solutions basées sur Internet: Encore un autre moyen de stocker vos données en froid sur le net. Cependant, les solutions de sauvegarde sur le cloud ne conviennent pas, car la principale préoccupation que les sociétés d'hébergement en nuage peuvent ne pas vivre aussi longtemps que vous souhaitez conserver vos données. D'autres raisons incluent le fait qu'il est terriblement lent à sauvegarder (puisqu'il transfère via Internet) et que la plupart des fournisseurs exigent que les fichiers existent aussi sur votre système pour les garder en ligne. Par exemple, CrashPlan et Backblaze supprimeront définitivement les fichiers qui ne sont pas vus au moins une fois sur votre ordinateur au cours des 30 derniers jours. Par conséquent, si vous souhaitez télécharger des données de sauvegarde que vous stockez uniquement sur des disques durs externes, vous devrez brancher votre ordinateur. Disque dur USB au moins une fois par mois et synchronisez-le avec votre nuage pour réinitialiser le compte à rebours. cependant, Certains services en nuage offrent la possibilité de conserver vos fichiers indéfiniment (à condition que vous payiez bien entendu) sans compte à rebours, comme SpiderOak. Faites donc très attention aux conditions et à l’utilisation de la solution de sauvegarde sur cloud que vous choisissez.
Une alternative aux fournisseurs de sauvegarde en nuage est de louer votre propre serveur privé en ligne et, si possible, d’en choisir un avec sauvegarde / sauvegarde automatique de vos données en cas de défaillance matérielle de leur côté (quelques-uns vous garantissent même contre la perte de données dans leurs contrats). , mais bien sur c’est plus cher). C'est une excellente solution, d'abord parce que vous possédez toujours vos données, et ensuite parce que vous n'avez pas à gérer les pannes matérielles, cette tâche incombe à votre hôte. Et si un jour votre hôte cesse ses activités, vous pouvez toujours récupérer vos données (choisissez un hôte sérieux pour qu'il ne s'éteigne pas la nuit mais le prévient au préalable, vous pouvez peut-être demander de l'inscrire dans le contrat), et réhéberger ailleurs.
Si vous ne souhaitez pas configurer votre propre serveur en ligne privé et si vous en avez les moyens, Amazon propose un nouveau service d'archivage de données, appelé Glacier . Le but est exactement de stocker à froid vos données sur le long terme: il est donc coûteux de stocker des données sur un glacier, mais cela coûte encore plus cher de récupérer ces données, car ce service est conçu pour stocker des données hors de portée. , ne pas conserver les données auxquelles vous souhaitez accéder souvent. Cela signifie que ce service affiche des prix pour l’écriture des données, mais aussi pour leur lecture. Ce service a un coût énorme, mais il peut s’avérer une bonne affaire pour certaines de vos données les plus sensibles (c’est-à-dire: si vous avez quelques fichiers texte ou images TRES sensibles, car ce type de données est généralement de petite taille, ne vous coûtera pas très cher de stocker dans un glacier).
Lacunes du stockage à froid : Cependant, il existe un gros défaut dans tout support de stockage à froid: il n’existe aucune vérification de l’intégrité, car les supports de stockage à froid NE PEUVENT PAS vérifier automatiquement l’intégrité des données (ils peuvent simplement mettre en œuvre des mécanismes de correction des erreurs pour les dommages après corruption sont survenus, mais ils ne peuvent pas être évités ni gérés automatiquement!) car, contrairement à un ordinateur, il n’existe aucune unité de traitement pour calculer / journaliser / vérifier et corriger le système de fichiers. Par contre, avec un ordinateur et plusieurs unités de stockage, vous pouvez automatiquement vérifier l’intégrité de vos archives et les transférer si nécessaire sur une autre unité en cas de corruption dans une archive de données (à condition que vous disposiez de plusieurs copies de la même archive).
Archivage à long terme
Même avec les meilleures technologies actuellement disponibles, les données numériques ne peuvent être stockées au froid que pendant quelques décennies (environ 20 ans). Ainsi, à long terme, vous ne pouvez pas compter uniquement sur le stockage froid: vous devez configurer une méthodologie pour votre processus d'archivage des données afin de garantir que vos données puissent être récupérées à l'avenir (même avec les changements technologiques) et que vous minimisez les risques. de perdre vos données. En d'autres termes, vous devez devenir le conservateur numérique de vos données, en réparant les corruptions lorsqu'elles se produisent et en recréant de nouvelles copies en cas de besoin.
Il n'y a pas de règles à toute épreuve, mais voici quelques stratégies de conservation établies , et notamment un outil magique qui facilitera votre travail:
- Principe de redondance / réplication : la redondance est le seul outil qui puisse inverser les effets de l'entropie , principe basé sur la théorie de l'information. Pour conserver des données, vous devez dupliquer ces données. Les codes d'erreur sont exactement une application automatique du principe de redondance. Cependant, vous devez également vous assurer que vos données sont redondantes.: copies multiples des mêmes données sur différents disques, copies multiples sur différents supports (de sorte qu'en cas d'échec d'un support en raison de problèmes intrinsèques, il y a peu de chances que les autres sur des supports différents échouent également au même moment), etc. , vous devez toujours disposer d’au moins 3 copies de vos données, également appelée redondance 3 modulaire en ingénierie, afin que, si vos copies sont corrompues, vous puissiez effectuer un vote à la majorité simple pour réparer vos fichiers à partir de vos 3 copies. Rappelez-vous toujours le conseil de compas du marin:
Il est inutile d’apporter deux boussoles, car si l’un se trompe, vous ne pouvez jamais savoir lequel est correct ou si les deux sont incorrects. Prenez toujours une boussole, ou plus de trois.
Codes de correction d'erreur : c'est l'outil magique qui vous facilitera la vie et sécurisera vos données. Les codes de correction d'erreur (ECC) sont une construction mathématique qui générera des données pouvant être utilisées pour réparer vos données. Ceci est plus efficace, car les ECC peuvent réparer beaucoup plus de vos données en utilisant beaucoup moins d’espace de stockage que la simple réplication (c’est-à-dire faire plusieurs copies de vos fichiers), et ils peuvent même être utilisés pour vérifier si votre fichier contient des données. la corruption, et même localiser où sont ces corruptions. En fait, c'est exactement une application du principe de redondance, mais d'une manière plus intelligente que la réplication. Cette technique est largement utilisée dans toutes les communications à longue portée, telles que la 4G, le WiMax et même les communications spatiales de la NASA. Malheureusement, bien que les CEC soient omniprésents dans les télécommunications, ils ne sont pas en réparation de fichiers, peut-être parce que c'est un peu complexe. Cependant, certains logiciels sont disponibles, tels que PAR2, bien connu (mais maintenant ancien), DVD Disaster (qui offre l’ajout de codes de correction d’erreur sur les disques optiques) et pyFileFixity (que je développe en partie pour surmonter les limitations et problèmes de PAR2). Il existe également des systèmes de fichiers qui implémentent éventuellement Reed-Solomon, tels que ZFS pour Linux ou ReFS pour Windows, qui constituent techniquement une généralisation de RAID5.
Vérifiez régulièrement l'intégrité de vos fichiers: Hachez vos fichiers et vérifiez-les de temps en temps (une fois par an, mais cela dépend du support de stockage et des conditions environnementales). Lorsque vous constatez que vos fichiers ont souffert de corruption, il est temps de réparer à l'aide des ECC que vous avez générés si vous l'avez fait et / ou de créer une nouvelle copie de vos données sur un nouveau support de stockage. Vérifier les données, réparer les erreurs et créer de nouvelles copies est un très bon cycle de conservation qui garantit la sécurité de vos données. Le contrôle en particulier est très important car vos copies de fichiers peuvent être corrompues en silence, et si vous copiez ensuite les copies qui ont été falsifiées, vous obtiendrez des fichiers totalement corrompus. Ceci est encore plus important avec les supports de stockage froids, tels que les disques optiques, qui NE PEUVENT PAS vérifier automatiquement l’intégrité des données (ils implémentent déjà des ECC pour guérir un peu, mais ils ne peuvent pas vérifier ni créer automatiquement de nouvelles copies fraîches, c’est votre travail!). Pour surveiller les modifications de fichiers, vous pouvez utiliser le script rfigc.py depyFileFixity ou d'autres outils UNIX tels que md5deep . Vous pouvez également vérifier l'état de santé de certains supports de stockage, tels que les disques durs, à l'aide d'outils tels que Hard Drive Sentinel ou les smartmontools open source .
Stockez vos archives dans différents endroits (avec au moins une copie à l'extérieur de votre maison!) Pour éviter des catastrophes telles que des inondations ou des incendies. Par exemple, un disque optique au travail ou une sauvegarde dans le nuage peut être une bonne idée pour répondre à cette exigence (même si les fournisseurs de nuage peuvent être fermés à tout moment, tant que vous avez d'autres copies, vous serez en sécurité. , les fournisseurs de cloud serviront uniquement d’archives hors site en cas d’urgence).
Stocker dans des conteneurs spécifiques avec des paramètres environnementaux contrôlés : pour les supports optiques, stocker à l'abri de la lumière et dans un carton étanche pour éviter l'humidité. Pour les disques durs et les cartes SD, stockez-les dans des pochettes anti-magnétiques pour éviter toute électricité résiduelle susceptible d'altérer le lecteur. Vous pouvez également stocker dans un sac / boîte étanche à l’air et à l’eau et au congélateur: les températures lentes ralentiront l’entropie et vous pourrez prolonger considérablement la durée de vie de tout support de stockage de ce type (assurez-vous simplement que l’eau gagne). n'entrez pas dedans, sinon votre média mourra rapidement).
Utilisez du matériel de bonne qualité et vérifiez-le au préalable (par exemple, lorsque vous achetez une carte SD, testez toute la carte avec un logiciel tel que HDD Scan pour vérifier que tout va bien avant d'écrire vos données). Ceci est particulièrement important pour les lecteurs optiques, car leur qualité peut considérablement altérer la qualité de vos disques gravés, comme le montre l'étude d'Archives de France (un mauvais graveur de DVD produira des DVD beaucoup moins durables).
Choisissez soigneusement vos formats de fichiers: tous les formats de fichiers ne résistent pas à la corruption, certains sont même manifestement faibles. Par exemple, les images .jpg peuvent être totalement brisées et illisibles en altérant un ou deux octets. Idem pour les archives 7zip. C'est ridicule, alors faites attention au format de fichier des fichiers que vous archivez. En règle générale, le texte clair et simple est ce qu'il y a de mieux, mais si vous devez compresser, utilisez un zip non solide et pour les images, utilisez JPEG2 (pas encore open-source ...). Plus d'infos et commentaires sur les curateurs numériques professionnels ici , ici et ici .
Stockez à côté de vos archives de données tous les logiciels et spécifications nécessaires à la lecture des données. N'oubliez pas que les spécifications changent rapidement et que vos données risquent de ne plus être lisibles, même si vous pouvez accéder au fichier. Par conséquent, vous devriez préférer les formats et logiciels open source et stocker le code source du programme avec vos données afin de pouvoir toujours adapter le programme à partir du code source afin de le lancer à partir d'un nouveau système d'exploitation ou d'un nouvel ordinateur.
Beaucoup d'autres méthodes et approches sont disponibles ici , ici et dans diverses parties d'Internet.
Conclusion
Je conseille d’utiliser ce que vous pouvez avoir, mais respectez toujours le principe de redondance (faites 4 copies!), Et vérifiez toujours l’intégrité (vous devez donc générer au préalable une base de données de hachages MD5 / SHA1) et créer de nouvelles données. copies en cas de corruption. Si vous le faites, vous pouvez techniquement conserver vos données aussi longtemps que vous le souhaitez, quel que soit votre support de stockage. Le délai entre chaque vérification dépend de la fiabilité de vos supports de stockage: s'il s'agit d'une disquette, vérifiez tous les 2 mois, s'il s'agit d'une Blu-ray HTL, vérifiez tous les 2/3 ans.
Maintenant, dans les conditions optimales, je conseille, pour le stockage frigorifique, d’utiliser des disques Blu-ray HTL ou des disques DVD de qualité archivistique stockés dans des boîtes opaques étanches à l’eau et dans un lieu frais. En outre, vous pouvez utiliser des cartes SD et des fournisseurs basés sur un nuage tels que SpiderOak pour stocker les copies redondantes de vos données, ou même des disques durs, si ceux-ci sont plus accessibles.
Utilisez beaucoup de codes de correction d'erreur , ils vous feront gagner du temps. Vous pouvez également faire plusieurs copies de ces fichiers ECC (mais plusieurs copies de vos données sont plus importantes que plusieurs copies des ECC car les fichiers ECC peuvent se réparer eux-mêmes!).
Ces stratégies peuvent toutes être mises en œuvre à l'aide de l'ensemble d'outils que je développe (open source): pyFileFixity . En fait, cet outil a été lancé par cette discussion après avoir constaté qu’il n’existait aucun outil gratuit permettant de gérer complètement la fixité des fichiers. De plus, veuillez vous référer au fichier Lisez-moi et au wiki du projet pour plus d'informations sur la fixité des fichiers et la curation numérique.
Pour terminer, j'espère vraiment que davantage de recherche et développement seront consacrés à ce problème. Il s’agit d’un enjeu majeur pour notre société actuelle, qui a de plus en plus de données numérisées, mais sans aucune garantie que cette masse d’informations survivra plus de quelques années. C'est assez déprimant, et je pense vraiment que cette question devrait être mise davantage au premier plan, de sorte que cela devienne un argument marketing pour les constructeurs et les entreprises qui souhaitent créer des dispositifs de stockage pouvant durer pour les générations futures.
/ EDIT: lisez ci-dessous pour une routine de curation pratique .