Πίνακας περιεχομένων:
Ορισμός - Τι σημαίνουν τα μη δομημένα δεδομένα;
Τα μη δομημένα δεδομένα αντιπροσωπεύουν οποιαδήποτε δεδομένα που δεν έχουν αναγνωρίσιμη δομή. Είναι ανοργάνωτο και ακατέργαστο και μπορεί να μην είναι κείμενο ή κείμενο. Για παράδειγμα, το ηλεκτρονικό ταχυδρομείο είναι μια ωραία απεικόνιση των αδόμητων κειμένων δεδομένων. Περιλαμβάνει πληροφορίες σχετικά με το χρόνο, την ημερομηνία, τον παραλήπτη και τον αποστολέα, θέμα κλπ., Αλλά ένα σώμα ηλεκτρονικού ταχυδρομείου παραμένει αδόμητο. Τα μη δομημένα δεδομένα μπορούν επίσης να αναγνωριστούν ως χαλαρά δομημένα δεδομένα, όπου οι πηγές δεδομένων περιλαμβάνουν μια δομή, αλλά όχι όλα τα δεδομένα σε ένα σύνολο δεδομένων ακολουθούν την ίδια δομή.
Σε επιχειρήσεις με επίκεντρο τον πελάτη, τα δεδομένα που βρίσκονται σε αδόμητη μορφή μπορούν να εξεταστούν για να ενισχύσουν το marketing marketing και τη διαχείριση σχέσεων με τους πελάτες (CRM). Καθώς οι εφαρμογές κοινωνικών μέσων ενημέρωσης, όπως το Facebook και το Twitter, είναι συμβατές, η ανάπτυξη μη δομημένων δεδομένων είναι πιθανό να ξεπεράσει την πρόοδο των δομημένων δεδομένων.
Η Techopedia εξηγεί τα αδόμητα δεδομένα
Τα μη δομημένα δεδομένα αναφέρονται σε δεδομένα που ακολουθούν μια μορφή που είναι λιγότερο διατεταγμένη από στοιχεία όπως σελίδες υπολογιστικών φύλλων, πίνακες βάσεων δεδομένων ή άλλα σύνολα γραμμικών ή παραγγελιών δεδομένων. Στην πραγματικότητα, ο όρος "σύνολο δεδομένων" είναι χρήσιμος επειδή σχετίζεται με δεδομένα που είναι σε καθαρές, προσβάσιμες συστοιχίες, χωρίς επιπλέον περιεχόμενο, και που συνδέεται ή επισημαίνεται σε μια συγκεκριμένη δομή.
Άλλες περιπτώσεις αδόμητων κειμένων περιλαμβάνουν έγγραφα του Word, παρουσιάσεις PowerPoint, άμεσα μηνύματα, λογισμικό συνεργασίας, έγγραφα, βιβλία, δημοσιεύσεις κοινωνικών μέσων και ιατρικά αρχεία. Τα μη δομημένα μη δομημένα δεδομένα γενικά δημιουργούνται σε μέσα, όπως αρχεία ήχου MP3, εικόνες JPEG και αρχεία βίντεο Flash κ.λπ.
Τα μη δομημένα δεδομένα συνήθως δεν περιλαμβάνουν ένα προκαθορισμένο μοντέλο δεδομένων και μπορεί να μην ταιριάζουν καλά με τους σχεσιακούς πίνακες. Τα μη δομημένα δεδομένα είναι συνήθως βαριά. Ωστόσο, μπορεί να περιλαμβάνει αριθμούς και ημερομηνίες, καθώς και γεγονότα. Αυτό οδηγεί σε ασάφειες που είναι δύσκολο να εντοπιστούν χρησιμοποιώντας συμβατικά προγράμματα λογισμικού.
Η αποθήκευση τεράστιων όγκων μη δομημένων δεδομένων που παράγονται μέσα σε μια επιχείρηση, εάν είναι κακή διαχείριση, μπορεί να οδηγήσει σε υψηλότερα έξοδα. Τα δεδομένα σε έντυπη μορφή ή σε ηλεκτρονική μορφή πρέπει να σαρωθούν προκειμένου μια εφαρμογή αναζήτησης να αναλύσει ιδέες, ανάλογα με τις λέξεις που χρησιμοποιούνται σε ορισμένα περιβάλλοντα. Αυτό είναι γνωστό ως επιχείρηση ή σημασιολογική αναζήτηση.
