Cette réponse a été modifiée après clarification de la question.
Quelles sont les autres raisons pour lesquelles les nuages préfèrent le DAS
Où «DAS» signifie Direct Attached Storage, c'est-à-dire les disques durs SATA ou SAS.
Les fournisseurs de cloud utilisent tous DAS car il offre des améliorations d'ordre de grandeur en termes de prix / performances. Il s'agit d'une mise à l'échelle horizontale .
En bref, les disques durs SATA et les contrôleurs SATA sont des produits bon marché. Ce sont des produits de grande consommation et leur prix est très bas. En construisant un grand cluster de PC bon marché avec des disques SATA bon marché, Google, Amazon et d'autres obtiennent une grande capacité à un prix très bas. Ils ajoutent ensuite leur propre couche logicielle sur le dessus. Leur logiciel effectue la réplication multi-serveurs pour les performances et la fiabilité, la surveillance, le rééquilibrage de la réplication après une panne matérielle, etc.
Vous pouvez jeter un œil à MogileFS comme un représentant plus simple du type de logiciel que Google, Amazon et d'autres utilisent pour le stockage. Bien sûr, il s'agit d'une implémentation différente, mais elle partage bon nombre des mêmes objectifs et solutions de conception que les systèmes à grande échelle. Si vous le souhaitez, voici un point de départ pour en savoir plus sur GoogleFS .
indiqué plus loin dans le document, les nuages doivent utiliser SAN ou NAS car le DAS n'est pas approprié lorsqu'une machine virtuelle se déplace vers un autre serveur
Il y a 2 raisons pour lesquelles les SAN ne sont pas utilisés.
1) Prix.
Les SAN sont extrêmement chers à grande échelle. Bien qu'ils puissent être la «meilleure» solution technique, ils ne sont généralement pas utilisés dans des installations à très grande échelle en raison de leur coût.
2) Le théorème
du CAP Le théorème du CAP d'Eric Brewer montre qu'à très grande échelle, vous ne pouvez pas maintenir une cohérence élevée tout en conservant une fiabilité, une tolérance aux pannes et des performances acceptables. Les SAN sont une tentative de rendre la cohérence matérielle forte. Cela peut très bien fonctionner pour une installation de serveur 5.000, mais il n'a jamais été prouvé que cela fonctionne pour les 250.000+ serveurs de Google.
Résultat:
jusqu'à présent, les fournisseurs de cloud computing ont choisi de pousser la complexité de la maintenance de l'état du serveur au développeur de l'application. Les offres de cloud actuelles ne fournissent pas d'état cohérent pour chaque machine virtuelle. Les serveurs d'applications (machines virtuelles) peuvent se bloquer et leurs données locales peuvent être perdues à tout moment.
Chaque fournisseur a ensuite sa propre implémentation de stockage persistant, que vous êtes censé utiliser pour les données importantes. Les offres d'Amazon sont de bons exemples; MySQL , SimpleDB et Simple Storage Service . Ces offres elles-mêmes reflètent le théorème CAP - l'instance MySQL a une forte cohérence, mais une évolutivité limitée. SimpleDB et S3 évoluent de manière fantastique, mais ne sont finalement cohérents.