Ερ: Είναι ο Hadoop για όλους;
Α: Ο πόρος διαχείρισης δεδομένων Hadoop του Apache ανοιχτού κώδικα και τα συναφή εργαλεία καθίστανται επιρροή στον μεγάλο κόσμο των δεδομένων. Αλλά στον αγώνα για υιοθέτηση νεότερων, πιο σύγχρονων λύσεων πληροφορικής, οι εταιρείες διερωτώνται εάν το Hadoop είναι ένα καθολικό εργαλείο που θα πρέπει να εφαρμοστεί ευρέως σε μεγάλες διαδικασίες δεδομένων και αναλύσεων.
Στην πραγματικότητα, υπάρχουν διάφορες εκτιμήσεις για το κατά πόσον ένα σύστημα πρόκειται να ωφεληθεί πολύ από την εφαρμογή του Hadoop. Το ένα είναι το εάν μεγάλα δεδομένα σχετίζονται με τη βιομηχανία. Με άλλα λόγια, αν η επιχείρηση θα τρέξει στην απόκτηση και την ανάλυση εξαιρετικά μεγάλων συνόλων δεδομένων, σύνολα δεδομένων μεγαλύτερα από αυτά που μπορούν να αναλυθούν χρησιμοποιώντας μια παραδοσιακή σχεσιακή βάση δεδομένων.
Επιπλέον, οι εταιρείες μπορούν να επιλέξουν μεταξύ του Hadoop και άλλων ιδιόκτητων εργαλείων που μπορεί να απαιτούν λιγότερες τεχνικές ικανότητες. Ορισμένες άλλες εταιρείες τεχνολογίας κατασκευάζουν παρόμοια μεγάλα εργαλεία δεδομένων που μπορεί να έχουν πιο διαισθητικές διεπαφές ή συντομεύσεις, ώστε να επιτρέπουν σε λιγότερο έμπειρους χρήστες να κάνουν περισσότερα με μεγάλα δεδομένα.
Ταυτόχρονα, υπάρχει συναίνεση ότι τα περισσότερα μεγάλα έργα δεδομένων μπορούν να επωφεληθούν από τον Hadoop με επαρκή διοίκηση. Εργαλεία όπως ο σχεδιασμός αποθήκης Apache Hive και η σύνταξη προγραμματισμού Apache Pig για μεγάλα δεδομένα επεκτείνουν αυτό που μπορεί να κάνει ο Hadoop. Άλλες εξελίξεις, όπως το Hadapt και το MapR, καθιστούν τη σύνταξη και τη χρήση του Hadoop πιο διαφανή σε μια ευρύτερη ποικιλία χρηστών, ή με άλλα λόγια, αρχίζοντας να εξαλείφουν το πρόβλημα "techiness".
Σε γενικές γραμμές, η επιχείρηση πρέπει να εξετάσει πόσα μεγάλα δεδομένα χρησιμοποιεί και από πού προέρχονται αυτά τα δεδομένα. Τα στελέχη και οι ηγέτες πρέπει να εξετάσουν ποιος πρόκειται να εργαστεί για τα εμπλεκόμενα έργα πληροφορικής και τις δεξιότητες και το υπόβαθρό τους. Πρέπει να κατανοήσουν τη διαφορά μεταξύ της εφαρμογής διαφόρων μεγάλων εργαλείων δεδομένων. Αυτό θα βοηθήσει τις ομάδες ηγεσίας να καταλάβουν εάν ο Hadoop έχει δίκιο για τα έργα τους.
