Σπίτι Στα νέα Τι είναι η προεπεξεργασία δεδομένων; - ορισμός από την τεχνολογία

Τι είναι η προεπεξεργασία δεδομένων; - ορισμός από την τεχνολογία

Πίνακας περιεχομένων:

Anonim

Ορισμός - Τι σημαίνει η προεπεξεργασία δεδομένων;

Η προεπεξεργασία δεδομένων είναι μια τεχνική εξόρυξης δεδομένων που περιλαμβάνει τη μετατροπή των πρώτων δεδομένων σε κατανοητή μορφή. Τα δεδομένα του πραγματικού κόσμου είναι συχνά ελλιπή, ασυμβίβαστα ή / και λείπουν σε ορισμένες συμπεριφορές ή τάσεις και είναι πιθανό να περιέχουν πολλά λάθη. Η προεπεξεργασία δεδομένων αποτελεί αποδεδειγμένη μέθοδο επίλυσης τέτοιων ζητημάτων. Η προεπεξεργασία δεδομένων προετοιμάζει τα ακατέργαστα δεδομένα για περαιτέρω επεξεργασία.


Η προεπεξεργασία δεδομένων χρησιμοποιεί τις εφαρμογές που βασίζονται σε βάσεις δεδομένων, όπως η διαχείριση σχέσεων με τους πελάτες και οι εφαρμογές που βασίζονται σε κανόνες (όπως τα νευρωνικά δίκτυα).

Η Techopedia εξηγεί την Προεπεξεργασία Δεδομένων

Τα δεδομένα περνούν από μια σειρά βημάτων κατά την προεπεξεργασία:

  • Καθαρισμός δεδομένων: Τα δεδομένα καθαρίζονται μέσω διαδικασιών όπως συμπλήρωση ελλειπουσών τιμών, εξομάλυνση των θορυβώδους δεδομένων ή επίλυση των ασυνέπειων στα δεδομένα.
  • Ενσωμάτωση δεδομένων: Τα δεδομένα με διαφορετικές αναπαραστάσεις συνθέτουν και επιλύονται συγκρούσεις εντός των δεδομένων.
  • Μετασχηματισμός δεδομένων: Τα δεδομένα κανονικοποιούνται, συγκεντρώνονται και γενικεύονται.
  • Μείωση δεδομένων: Αυτό το βήμα αποσκοπεί στο να παρουσιάσει μια μειωμένη αναπαράσταση των δεδομένων σε μια αποθήκη δεδομένων.
  • Διασύνδεση δεδομένων: Συμπεριλαμβάνει τη μείωση ενός αριθμού τιμών μιας συνεχούς ιδιότητας διαιρώντας το εύρος των διαστημάτων χαρακτηριστικών.
Τι είναι η προεπεξεργασία δεδομένων; - ορισμός από την τεχνολογία