Avec Hadoop et CouchDB partout dans les blogs et les actualités associées, qu'est-ce qu'un stockage (moteur) tolérant aux pannes qui fonctionne réellement?
- CouchDB n'a pas de fonctionnalités de distribution intégrées, à ma connaissance, la colle pour distribuer automatiquement des entrées ou même des bases de données entières est tout simplement manquante.
- Hadoop semble être très largement utilisé - au moins, il obtient une bonne presse, mais a toujours un seul point de défaillance: le NameNode. De plus, il ne peut être monté que via FUSE, je comprends que le HDFS n'est pas réellement l'objectif principal de Hadoop
- GlusterFS a un concept de partage de rien, mais récemment j'ai lu plusieurs articles qui m'amènent à penser qu'il n'est pas aussi stable
- Lustre a également un point de défaillance unique car il utilise un serveur de métadonnées dédié
- Ceph semble être le joueur de choix, mais la page d'accueil indique qu'il est toujours en phase alpha.
La question est donc de savoir quel système de fichiers distribué possède l'ensemble de fonctionnalités suivant (sans ordre particulier):
- Compatible POSIX
- ajout / retrait facile des nœuds
- concept de partage de rien
- fonctionne sur du matériel bon marché (processeurs AMD Geode ou VIA Eden)
- authentification / autorisation intégrée
- un système de fichiers réseau (j'aimerais pouvoir le monter simultanément sur différents hôtes)
Agréable d'avoir:
- fichiers accessibles localement: je peux prendre un nœud vers le bas monter la partition avec un système de fichiers local standard (ext3 / xfs / que ce soit ...) et toujours accéder aux fichiers
Je ne recherche pas d'applications hébergées, plutôt quelque chose qui me permettra de prendre par exemple 10 Go de chacun de nos boîtiers matériels et d'avoir ce stockage disponible sur notre réseau, facilement montable sur une multitude d'hôtes.