Hadoop ist ein Open-Source-Software-Framework, das die Verarbeitung und Speicherung von extrem großen Datenmengen in einer verteilten Computerumgebung unterstützt.
Alle Module des Hadoop-Frameworks basieren auf der Grundannahme, dass Hardware-Fehler häufig vorkommen und vom Framework automatisch behandelt werden sollten.