Was ist Apache Sqoop?
Apache Sqoop (‚SQL to Hadoop‘) ist eine Java-basierte Anwendung im Konsolenmodus, die für die Übertragung von Massendaten zwischen Apache Hadoop- und Nicht-Hadoop-Datenspeichern wie relationalen Datenbanken, NoSQL-Datenbanken und Data Warehouses entwickelt wurde. Version 1.4.4 wurde am 31. Juli 2013 veröffentlicht.
Unternehmen, die Hadoop verwenden, halten es für notwendig, einen Teil ihrer Daten von traditionellen relationalen Datenbankverwaltungssystemen (RDBMS) an das Hadoop-Ökosystem zu übertragen.
Sqoop, ein integraler Bestandteil von Hadoop, kann diese Übertragung auf automatisierte Weise durchführen. Darüber hinaus können die in Hadoop importierten Daten mit MapReduce konvertiert werden, bevor sie wieder in das RDBMS exportiert werden. Sqoop kann auch Java-Klassen für die programmgesteuerte Interaktion mit importierten Daten generieren.
Sqoop verwendet eine Connector-basierte Architektur, die es ermöglicht, Plugins für die Verbindung mit externen Datenbanken zu verwenden.