Was ist Apache Hadoop?
Apache Hadoop ist ein frei lizenziertes Software-Framework, das von der Apache Software Foundation entwickelt wurde und für die Entwicklung datenintensiver, verteilter Computer verwendet wird. Hadoop wurde entwickelt, um von einer einzelnen Maschine bis zu Tausenden von Computern zu skalieren. Ein zentrales Hadoop-Konzept besteht darin, dass Fehler auf der Anwendungsebene behandelt werden, während die Zuverlässigkeit der Hardware abhängt.
Hadoop wurde von Google MapReduce- und Google File System-Papieren inspiriert. Es ist ein Projekt, das mit erstklassigen Spezifikationen entwickelt wurde, und eine Gemeinschaft von Programmierern, die weltweit an dem Programm mit Java beteiligt waren. Yahoo Inc. war ein wichtiger Hadoop-Unterstützer.
Doug Cutting wird die Kreation von Hadoop zugeschrieben, die er für den Spielzeugelefanten seines Sohnes nannte. Das ursprüngliche Ziel von Cutting war es, die Erweiterung des Apache Nutch-Suchmaschinenprojekts zu unterstützen.