Σπίτι Βάσεις δεδομένων Τι είναι τα βρώμικα δεδομένα; - ορισμός από την τεχνολογία

Τι είναι τα βρώμικα δεδομένα; - ορισμός από την τεχνολογία

Πίνακας περιεχομένων:

Anonim

Ορισμός - Τι σημαίνουν τα Dirty Data;

Τα βρώμικα δεδομένα αναφέρονται σε δεδομένα που περιέχουν εσφαλμένες πληροφορίες. Μπορεί επίσης να χρησιμοποιηθεί όταν αναφέρεται σε δεδομένα που βρίσκονται στη μνήμη και δεν έχουν ακόμη φορτωθεί σε μια βάση δεδομένων. Η πλήρης απομάκρυνση των βρώμικων δεδομένων από μια πηγή είναι ανέφικτη ή πρακτικά αδύνατη.

Τα παρακάτω δεδομένα μπορούν να θεωρηθούν ως βρώμικα δεδομένα:

  • Παραπλανητικά δεδομένα
  • Διπλότυπο δεδομένων
  • Λανθασμένα δεδομένα
  • Ανακριβή δεδομένα
  • Μη ενσωματωμένα δεδομένα
  • Δεδομένα που παραβιάζουν τους επιχειρηματικούς κανόνες
  • Δεδομένα χωρίς γενική μορφοποίηση
  • Εσφαλμένα σημεία στίξης ή στίγματα

Η Techopedia εξηγεί τα Dirty Data

Εκτός από την εσφαλμένη καταχώρηση δεδομένων, μπορούν να δημιουργηθούν βρώμικα δεδομένα λόγω των ακατάλληλων μεθόδων διαχείρισης δεδομένων και αποθήκευσης δεδομένων. Ορισμένοι τύποι βρώμικων δεδομένων εξηγούνται παρακάτω:

  • Λανθασμένα δεδομένα - Για να διασφαλιστεί ότι τα δεδομένα είναι έγκυρα ή σωστά, η τιμή που εισάγεται πρέπει να συμμορφώνεται με τις έγκυρες τιμές του πεδίου. Για παράδειγμα, η τιμή που εισάγεται στο πεδίο μήνα πρέπει να κυμαίνεται από 1 έως 12 ή η ηλικία ενός ατόμου πρέπει να είναι μικρότερη από 130. Η ορθότητα της τιμής δεδομένων μπορεί να εφαρμοστεί προγραμματικά με τη βοήθεια πινάκων αναζήτησης ή με ελέγχους επεξεργασίας.
  • Ανακριβή δεδομένα - Είναι πιθανό ότι μια τιμή δεδομένων μπορεί να είναι σωστή, αλλά δεν είναι ακριβής. Κατά καιρούς, είναι πρακτικό να εξετάζετε σε σχέση με άλλα αρχεία ή πεδία για να διαπιστώσετε εάν η τιμή των δεδομένων είναι ακριβής βάσει του πλαισίου που χρησιμοποιείται. Ωστόσο, η ακρίβεια μπορεί συχνά να επικυρωθεί μόνο με χειρωνακτική επαλήθευση.
  • Παραβιάσεις επιχειρηματικών κανόνων - Τα δεδομένα που παραβιάζουν τον επιχειρηματικό κανόνα είναι ένας άλλος τύπος βρώμικων δεδομένων. Για παράδειγμα, μια πραγματική ημερομηνία πρέπει πάντα να έρχεται πριν από την ημερομηνία λήξης. Ένα άλλο παράδειγμα παραβίασης επιχειρηματικών κανόνων μπορεί να είναι η ασφαλιστική απαίτηση Medicare του ασθενούς, όπου ο ασθενής μπορεί να εξακολουθεί να βρίσκεται κάτω από την ηλικία συνταξιοδότησης και δεν δικαιούται να κάνει Medicare.
  • Ασυμβίβαστα δεδομένα - Η μη ελεγχόμενη απόλυση δεδομένων οδηγεί σε ασυνέπειες δεδομένων. Κάθε οργανισμός επηρεάζεται από ασυνεπή και επαναλαμβανόμενα δεδομένα. Αυτό είναι ιδιαίτερα τυπικό με τα δεδομένα των πελατών.
  • Μη ολοκληρωμένα δεδομένα - Δεδομένα με τιμές που λείπουν είναι ο κύριος τύπος ατελών δεδομένων.
  • Διπλότυπα δεδομένα - Διπλότυπα δεδομένα ενδέχεται να προκύψουν λόγω επαναλαμβανόμενων υποβολών, ακατάλληλων δεδομένων που συνδέονται ή σφάλματος χρήστη.

Προκειμένου να αυξηθεί η ποιότητα των δεδομένων και να αποφευχθούν τα βρώμικα δεδομένα, οι οργανισμοί πρέπει να ενσωματώσουν μεθοδολογίες για να εξασφαλίσουν την πληρότητα, την εγκυρότητα, τη συνέπεια και την ορθότητα των δεδομένων.

Τι είναι τα βρώμικα δεδομένα; - ορισμός από την τεχνολογία