Πίνακας περιεχομένων:
Μόνο μέσω μεγάλων αναλυτικών στοιχείων, η πραγματική αξία των μεγάλων δεδομένων καθίσταται σαφής. Όμως, αυτές οι αναλύσεις απαιτούν στατιστικές και τεχνικές γνώσεις για την υλοποίηση οποιασδήποτε μεγάλης λύσης δεδομένων. Επομένως, η υπόθεση ήταν ότι πρέπει να είσαι επιστήμονας δεδομένων για να εξάγεις νόημα από μεγάλα δεδομένα. Αυτό είναι όπου Apache τρυπάνι έρχεται μέσα. Παρέχει την ευελιξία να κάνει μεγάλη ανάλυση δεδομένων για Hadoop χωρίς να χρειάζεται να έχουν τη γνώση ενός επιστήμονα δεδομένων.
Apache Drill - Τι είναι αυτό;
Το Apache Drill είναι ένα πλαίσιο λογισμικού το οποίο μπορεί να χτυπήσει μεγάλα δεδομένα και να προσφέρει τις ιδέες που χρειάζεστε, κρύβοντας κάτω από τα petabytes των συνόλων δεδομένων. Από τεχνική άποψη, το Apache Drill είναι ένα ανοικτού κώδικα, πρότυπο ANSI SQL, το οποίο μπορεί να χρησιμοποιηθεί ως μηχανισμός ερωτήματος χαμηλού λανθάνοντος χρόνου στο δημοφιλές πλαίσιο προγραμματισμού Hadoop που βασίζεται στην Java.
Μπορεί επίσης να λειτουργήσει με ένα κοπάδι εκκολαπτόμενων βάσεων δεδομένων NoSQL όπως το MongoDB, το HBase και επίσης με διακομιστές δεδομένων cloud, όπως το Amazon S3 και το Google Cloud Storage. Προστιθέμενο σε αυτά, χτυπάει επίσης το επίπεδο άλλων βιομηχανικών προτύπων API (διεπαφές προγραμματισμού εφαρμογών) όπως ODBC / JDBC και RESTful API.