Η συγχώνευση πηγών δεδομένων στο Hadoop είναι μια πολύπλοκη επιχείρηση. Μερικοί από τους λόγους για αυτό περιλαμβάνουν:
- Προσαρμοσμένα σενάρια ειδικά για πηγές που συνδυάζουν πηγές δεδομένων είναι προβληματικές.
- Η χρήση εργαλείων για την ολοκλήρωση δεδομένων ή την επιστήμη των δεδομένων εισάγει υπερβολική αβεβαιότητα.
- Η προσθήκη δεδομένων από εξωτερικές πηγές είναι σχεδόν αδύνατη.
Σήμερα, θα συζητήσω πώς βελτιώνεται η ανάλυση Hadoop μέσω τεχνολογιών πηγής-αγνωστικής, οι οποίες διευκολύνουν το συνδυασμό των εσωτερικών και εξωτερικών πηγών δεδομένων. Εκτός από την περιγραφή του τρόπου με τον οποίο λειτουργούν οι μέθοδοι πηγής-αγνωστικής, θα καλύψω επίσης γιατί οι αναλυτές Hadoop χρειάζονται ενσωματωμένες δυνατότητες μεταφοράς πληροφοριών και γνώσης, κατανόηση των σχέσεων και των χαρακτηριστικών δεδομένων και μια κλιμακωτή και υψηλής απόδοσης αρχιτεκτονική.
Webinar: Πίνακες νοήματος: Σύνδεση των κουκίδων μέσα στο Hadoop - Εγγραφείτε εδώ |