Was ist Apache Drill?
Apache Drill ist ein Open-Source-Programm, das die interaktive Analyse von auf verschiedenen Computern vorhandenen Massen-Datasets ermöglicht. Die Hauptfunktion von Apache Drill ist die distributive Anwendung von Datenanalyse und Datenspeicherung. Drill ermöglicht das Verbinden einer einzelnen Datenentität mit mehreren Datenspeichern und Anwendungen. Apache Drill ist eine Datenbank-Engine im industriellen Maßstab und äußerst benutzerfreundlich.
Drill ist ein Apache-Projekt auf oberster Ebene. Apache Drill ist die Open-Source-Version des Google-Dremel-Systems. Einer der größten Vorteile von Drill ist sein Datenoptimierer, der die Datenstruktur automatisch neu anordnen kann, um Platz und interne Verarbeitungskapazitäten eines Datenspeichers zu sparen. Drill ist auch in der Lage, den Speicherort von Daten zu speichern, sodass Drill und Datenspeicher an denselben Knoten ohne Verwechslungen lokalisiert werden können.
Apache Drill ist in der Lage, Petabyte von Daten zu verarbeiten, die auf 10.000 Servern und Millionen von Datensätzen in Sekunden gespeichert sind.