Hadoop est un projet open source Apache qui fournit des logiciels pour une informatique distribuée fiable et évolutive. Le noyau se compose d'un système de fichiers distribué (HDFS) et d'un gestionnaire de ressources (YARN). Divers autres projets open source, tels qu'Apache Hive, utilisent Apache Hadoop comme couche de persistance.