Réponses:
La déduplication est l'endroit où vous regardez le contenu d'un ensemble de données, notez tous les bits en double qui sont présents et stockez les données une seule fois, en remplaçant toutes ces copies de données autrement par un pointeur sur la copie. Cela est particulièrement utile avec les sauvegardes car lorsque vous sauvegardez des choses comme les serveurs, une grande partie des données est la même. Imaginez, par exemple, que vous sauvegardez 1 000 serveurs Windows - une grande partie du contenu de ces boîtes sera identique.
La déduplication est si populaire aujourd'hui pour 3 raisons:
Dernièrement, tout le monde est obsédé par la création de solutions de récupération après sinistre qui utilisent des serveurs hors site. Pour ce faire, vous devez répliquer de nombreuses données de production sur le site distant et la bande passante est un énorme problème. Toute réduction de la quantité de données que vous devez répliquer aide beaucoup.
La quantité de données que les entreprises conservent explose - grâce à un stockage moins cher et à des exigences multi-industrielles pour la conservation des enregistrements.
La technologie a relativement récemment atteint le point idéal. Nous avons eu des choses comme la déduplication depuis longtemps (stockage à instance unique, etc.), ce qui a aidé, mais seulement au cours de la dernière année environ, nous avons constaté une véritable déduplication qui peut réduire considérablement la quantité de stockage dans le courant dominant.
L'une des choses que nous avons découvert dans mon entreprise en travaillant avec Netapp est que la déduplication ne fonctionne vraiment bien dans un environnement de machine virtuelle que si vos disques sont alignés. Ce qui est un problème pour nous car nous avons beaucoup de machines Windows Server 2003 et aucun des disques n'est aligné. Ce qui signifie que vous récupérez à peine environ un quart de l'espace possible si les disques sont correctement alignés.
On nous dit cependant qu'une fois que les disques sont correctement alignés, nous devrions être en mesure de récupérer 40 à 60% de notre espace avec la déduplication.