Πίνακας περιεχομένων:
Ορισμός - Τι σημαίνει η προεπεξεργασία δεδομένων;
Η προεπεξεργασία δεδομένων είναι μια τεχνική εξόρυξης δεδομένων που περιλαμβάνει τη μετατροπή των πρώτων δεδομένων σε κατανοητή μορφή. Τα δεδομένα του πραγματικού κόσμου είναι συχνά ελλιπή, ασυμβίβαστα ή / και λείπουν σε ορισμένες συμπεριφορές ή τάσεις και είναι πιθανό να περιέχουν πολλά λάθη. Η προεπεξεργασία δεδομένων αποτελεί αποδεδειγμένη μέθοδο επίλυσης τέτοιων ζητημάτων. Η προεπεξεργασία δεδομένων προετοιμάζει τα ακατέργαστα δεδομένα για περαιτέρω επεξεργασία.
Η προεπεξεργασία δεδομένων χρησιμοποιεί τις εφαρμογές που βασίζονται σε βάσεις δεδομένων, όπως η διαχείριση σχέσεων με τους πελάτες και οι εφαρμογές που βασίζονται σε κανόνες (όπως τα νευρωνικά δίκτυα).
Η Techopedia εξηγεί την Προεπεξεργασία Δεδομένων
Τα δεδομένα περνούν από μια σειρά βημάτων κατά την προεπεξεργασία:
- Καθαρισμός δεδομένων: Τα δεδομένα καθαρίζονται μέσω διαδικασιών όπως συμπλήρωση ελλειπουσών τιμών, εξομάλυνση των θορυβώδους δεδομένων ή επίλυση των ασυνέπειων στα δεδομένα.
- Ενσωμάτωση δεδομένων: Τα δεδομένα με διαφορετικές αναπαραστάσεις συνθέτουν και επιλύονται συγκρούσεις εντός των δεδομένων.
- Μετασχηματισμός δεδομένων: Τα δεδομένα κανονικοποιούνται, συγκεντρώνονται και γενικεύονται.
- Μείωση δεδομένων: Αυτό το βήμα αποσκοπεί στο να παρουσιάσει μια μειωμένη αναπαράσταση των δεδομένων σε μια αποθήκη δεδομένων.
- Διασύνδεση δεδομένων: Συμπεριλαμβάνει τη μείωση ενός αριθμού τιμών μιας συνεχούς ιδιότητας διαιρώντας το εύρος των διαστημάτων χαρακτηριστικών.