Πίνακας περιεχομένων:
- Μύθος: Ο καθένας μας μπροστά μας υιοθετεί μεγάλα δεδομένα.
- Μύθος: Έχουμε τόσα πολλά στοιχεία. δεν χρειάζεται να ανησυχούμε για κάθε μικρό σφάλμα δεδομένων.
- Μύθος: Η μεγάλη τεχνολογία δεδομένων θα εξαλείψει την ανάγκη για ενσωμάτωση δεδομένων.
- Μύθος: Η χρήση αποθήκης δεδομένων για προηγμένες αναλύσεις είναι άσκοπη.
- Μύθος: Οι λίμνες δεδομένων θα αντικαταστήσουν την αποθήκη δεδομένων.
- Μεγάλα δεδομένα - Νέες μέθοδοι χειρισμού δεδομένων δεν μπορούν
Πίσω τον Μάιο του 2014, η Forrester Research εξέδωσε δύο εκθέσεις με συγκεκριμένα συμπεράσματα σχετικά με τη διαφημιστική εκστρατεία που περιβάλλει τα μεγάλα δεδομένα. Η ερευνητική εταιρεία εξέτασε περισσότερα από 250 στελέχη μάρκετινγκ και ανάπτυξης επιχειρήσεων. Σύμφωνα με τους συγγραφείς της έκθεσης, η μεγάλη ρητορική δεδομένων είναι σε υψηλό επίπεδο όλων των εποχών, και οι προμηθευτές τεχνολογίας διαφημίζουν προϊόντα με ό, τι φαίνεται να είναι απίστευτοι ισχυρισμοί.
Η Gartner συμφωνεί με την Forrester Research. σημαντική διαφημιστική εκστρατεία περιβάλλει μεγάλα δεδομένα. Στην έκθεση του Σεπτεμβρίου 2014, η Gartner αποκαλύπτει πέντε από τους μεγαλύτερους μύθους δεδομένων και οι αναλυτές της Gartner προσφέρουν τη γνώμη τους για το τι είναι παρεξηγημένο για τα μεγάλα δεδομένα και τους χειρισμούς τους. Έτσι, ποιοι είναι οι μεγαλύτεροι μύθοι των μεγάλων δεδομένων; Ας ρίξουμε μια ματιά.
Μύθος: Ο καθένας μας μπροστά μας υιοθετεί μεγάλα δεδομένα.
Η Gartner λέει ότι το ενδιαφέρον για τα μεγάλα δεδομένα είναι σε υψηλό επίπεδο. Παρόλα αυτά, το 13% των ερωτηθέντων έχει λειτουργικά συστήματα. Ο λόγος: οι περισσότερες εταιρείες δεν έχουν ακόμη καταλάβει πώς να εξορύσσουν οποιαδήποτε αξία από μεγάλες αποθήκες δεδομένων. Εδώ, η έρευνα της Gartner είναι πιο αισιόδοξη από την έκθεση Forrester, η οποία διαπίστωσε ότι μόνο το 9% των συμμετεχόντων στην έρευνα δήλωσαν ότι σχεδίαζαν να εφαρμόσουν τεχνολογίες μεγάλων δεδομένων κατά το επόμενο έτος. (Τα μεγάλα δεδομένα έχουν πολλά να προσφέρουν. Μάθετε περισσότερα σε 5 προβλήματα του πραγματικού κόσμου που μπορούν να λύσουν τα μεγάλα δεδομένα.)Μύθος: Έχουμε τόσα πολλά στοιχεία. δεν χρειάζεται να ανησυχούμε για κάθε μικρό σφάλμα δεδομένων.
Η Gartner ανησυχεί για την άπνοια που έχουμε οι άνθρωποι: "Έχουμε τόσα πολλά, το μικρό που είναι κακό δεν θα έχει σημασία". Ο Ted Friedman, αντιπρόεδρος και διακεκριμένος αναλυτής της Gartner πιστεύει ότι αυτός είναι ο λάθος τρόπος να εξετάσουμε την κατάσταση.
"Στην πραγματικότητα, αν και κάθε μεμονωμένο ελάττωμα έχει πολύ μικρότερο αντίκτυπο σε ολόκληρο το σύνολο δεδομένων από ό, τι έκανε όταν υπήρχαν λιγότερα δεδομένα, υπάρχουν περισσότερα ελαττώματα από ό, τι πριν, επειδή υπάρχουν περισσότερα δεδομένα", δήλωσε ο Friedman. "Ως εκ τούτου, ο συνολικός αντίκτυπος των δεδομένων κακής ποιότητας σε ολόκληρο το σύνολο δεδομένων παραμένει το ίδιο."
Ο Friedman προσθέτει έναν άλλο λόγο ανησυχίας. Η συλλογή μεγάλων δεδομένων περιλαμβάνει συχνά δεδομένα εκτός της επιχείρησης, τα οποία επομένως έχουν άγνωστη δομή και προέλευση. Αυτό αυξάνει τις πιθανότητες για σφάλματα.
Μύθος: Η μεγάλη τεχνολογία δεδομένων θα εξαλείψει την ανάγκη για ενσωμάτωση δεδομένων.
Υπάρχουν δύο βασικές στρατηγικές ανάλυσης δεδομένων που μπορούν να εφαρμοστούν στα μεγάλα δεδομένα: "σχήμα για εγγραφή" ή "σχήμα για ανάγνωση". Μέχρι πρόσφατα, το σχήμα γραφής ήταν η μόνη μέθοδος που χρησιμοποιήθηκε. Το σχήμα στη διαβάσει είναι η τρέχουσα τρέλα στη διαχείριση βάσεων δεδομένων. Σε αντίθεση με το σχήμα σχετικά με την εγγραφή, το οποίο απαιτεί μια δομημένη μορφή, τα δεδομένα φορτώνονται σε βάσεις δεδομένων σχήματος σε μορφή σε ακατέργαστη μορφή. Στη συνέχεια, οι προγραμματιστές - χρησιμοποιώντας μη δομημένες πλατφόρμες βάσης δεδομένων όπως ο Hadoop - λυγίζουν τα διαφορετικά δεδομένα σε μια χρήσιμη μορφή. Το σχήμα στη διαβάθμιση έχει προφανή πλεονεκτήματα αλλά, όπως αναφέρει η Gartner, η ενσωμάτωση δεδομένων πρέπει να συμβεί σε κάποιο σημείο.Μύθος: Η χρήση αποθήκης δεδομένων για προηγμένες αναλύσεις είναι άσκοπη.
Η δαπάνη του χρόνου για τη δημιουργία μιας αποθήκης δεδομένων φαίνεται άσκοπη σε πολλούς διαχειριστές πληροφοριών, ιδίως όταν τα δεδομένα που συλλέχθηκαν πρόσφατα είναι διαφορετικά από αυτά της αποθήκης δεδομένων. Ωστόσο, η Gartner προειδοποιεί και πάλι ότι ακόμη και τα προηγμένα στοιχεία ανάλυσης δεδομένων θα χρησιμοποιούν αποθήκες δεδομένων και νέα δεδομένα, πράγμα που σημαίνει ολοκληρωτές δεδομένων πρέπει:- Ορίστε νέους τύπους δεδομένων ώστε να είναι κατάλληλοι για ανάλυση
- Αποφασίστε ποια δεδομένα είναι σχετικά και το επίπεδο της ποιότητας των δεδομένων που απαιτείται
- Προσδιορίστε τον τρόπο συγκέντρωσης των δεδομένων
- Κατανοήστε ότι η βελτίωση των δεδομένων μπορεί να συμβεί σε μέρη εκτός της αποθήκης δεδομένων
Μύθος: Οι λίμνες δεδομένων θα αντικαταστήσουν την αποθήκη δεδομένων.
Οι λίμνες δεδομένων αποτελούν αποθήκες διαφορετικών δεδομένων, σε αντίθεση με τις αποθήκες δεδομένων όπου τα δεδομένα είναι δομημένα. Η δημιουργία μιας λίμνης δεδομένων απαιτεί ελάχιστη προσπάθεια εκ των προτέρων (δεν χρειάζεται να μορφοποιηθεί τα δεδομένα) σε σύγκριση με τις αποθήκες δεδομένων, γι 'αυτό και οι λίμνες δεδομένων παρουσιάζουν ενδιαφέρον.
Η Gartner υπογραμμίζει ότι η κατοχή των δεδομένων δεν είναι το σημείο - το να είναι σε θέση να χειριστεί τα συλλαμβανόμενα δεδομένα για τεκμηριωμένη λήψη αποφάσεων είναι το σημείο. Επιπλέον, η χρήση (λίγως μη αποδεδειγμένων) δεδομένων λιμνών για τη διευκόλυνση της λήψης αποφάσεων είναι προβληματική.
"Οι αποθήκες δεδομένων έχουν ήδη τις δυνατότητες να υποστηρίξουν μια ευρεία ποικιλία χρηστών σε έναν οργανισμό", δήλωσε ο Nick Heudecker, διευθυντής έρευνας της Gartner. "Οι ηγέτες διαχείρισης πληροφοριών δεν χρειάζεται να περιμένουν να φθάσουν οι λίμνες δεδομένων". (Μάθετε περισσότερα σχετικά με την υιοθέτηση μεγάλων δεδομένων σε 7 πράγματα που πρέπει να γνωρίζετε για τα μεγάλα δεδομένα πριν από την υιοθεσία.)
Μεγάλα δεδομένα - Νέες μέθοδοι χειρισμού δεδομένων δεν μπορούν
Ο λόγος που ο Gartner δήλωσε ότι "οι μεγαλύτεροι μύθοι δεδομένων" αντί για "μύθους μεγάλων δεδομένων" γίνεται σαφής μετά την ανάγνωση της έκθεσης. Η Gartner δεν θεωρεί τα μεγάλα δεδομένα. Ο Gartner είναι κακός από εκείνους που αισθάνονται ότι οι νεώτερες μέθοδοι χειραγώγησης μεγάλων δεδομένων είναι έτοιμες για "prime time".