Πίνακας περιεχομένων:
- Ορισμός - Τι σημαίνει η ανακάλυψη γνώσης σε βάσεις δεδομένων (KDD);
- Η Techopedia εξηγεί την ανακάλυψη γνώσεων σε βάσεις δεδομένων (KDD)
Ορισμός - Τι σημαίνει η ανακάλυψη γνώσης σε βάσεις δεδομένων (KDD);
Η ανακάλυψη γνώσεων σε βάσεις δεδομένων (KDD) είναι η διαδικασία ανεύρεσης χρήσιμων γνώσεων από μια συλλογή δεδομένων. Αυτή η ευρέως χρησιμοποιούμενη τεχνική εξόρυξης δεδομένων είναι μια διαδικασία που περιλαμβάνει προετοιμασία και επιλογή δεδομένων, καθαρισμό δεδομένων, ενσωμάτωση προηγούμενων γνώσεων σε σύνολα δεδομένων και ερμηνεία ακριβών λύσεων από τα παρατηρούμενα αποτελέσματα.
Οι κύριοι τομείς εφαρμογής του KDD περιλαμβάνουν το μάρκετινγκ, την ανίχνευση απάτης, τις τηλεπικοινωνίες και την κατασκευή.
Η Techopedia εξηγεί την ανακάλυψη γνώσεων σε βάσεις δεδομένων (KDD)
Παραδοσιακά, η εξόρυξη δεδομένων και η ανακάλυψη γνώσεων πραγματοποιήθηκαν με το χέρι. Με την πάροδο του χρόνου, η ποσότητα των δεδομένων σε πολλά συστήματα αυξήθηκε σε μέγεθος μεγαλύτερο από το terabyte και δεν μπορούσε πλέον να συντηρηθεί χειροκίνητα. Επιπλέον, για την επιτυχή ύπαρξη οποιασδήποτε επιχείρησης, η ανακάλυψη βασικών μοτίβων στα δεδομένα θεωρείται απαραίτητη. Ως αποτέλεσμα, αναπτύχθηκαν διάφορα εργαλεία λογισμικού για να ανακαλύψουν κρυφά δεδομένα και να κάνουν παραδοχές, οι οποίες αποτέλεσαν μέρος της τεχνητής νοημοσύνης.
Η διαδικασία KDD έχει φτάσει στο αποκορύφωμά της τα τελευταία 10 χρόνια. Σήμερα στεγάζει πολλές διαφορετικές προσεγγίσεις στην ανακάλυψη, η οποία περιλαμβάνει την επαγωγική μάθηση, τις Bayesian στατιστικές, τη βελτιστοποίηση των σημασιολογικών επερωτήσεων, την απόκτηση γνώσεων για συστήματα εμπειρογνωμόνων και τη θεωρία των πληροφοριών. Ο απώτερος στόχος είναι η εξαγωγή γνώσεων υψηλού επιπέδου από δεδομένα χαμηλού επιπέδου.
Το KDD περιλαμβάνει διεπιστημονικές δραστηριότητες. Αυτό περιλαμβάνει την αποθήκευση δεδομένων και την πρόσβαση, τους αλγόριθμους κλιμάκωσης σε μαζικά σύνολα δεδομένων και τα αποτελέσματα διερμηνείας. Η διαδικασία καθαρισμού δεδομένων και πρόσβασης δεδομένων που περιλαμβάνονται στην αποθήκευση δεδομένων διευκολύνει τη διαδικασία KDD. Η τεχνητή νοημοσύνη υποστηρίζει επίσης την KDD με την ανακάλυψη εμπειρικών νόμων από πειραματισμούς και παρατηρήσεις. Τα μοτίβα που αναγνωρίζονται στα δεδομένα πρέπει να ισχύουν για νέα δεδομένα και να έχουν κάποιο βαθμό βεβαιότητας. Αυτά τα πρότυπα θεωρούνται νέα γνώση. Τα βήματα που ενέχονται σε ολόκληρη την διαδικασία KDD είναι:
- Προσδιορίστε το στόχο της διαδικασίας KDD από την πλευρά του πελάτη.
- Κατανοήστε τους εφαρμοσμένους τομείς εφαρμογών και τις γνώσεις που απαιτούνται
- Επιλέξτε ένα σύνολο δεδομένων στόχου ή υποσύνολο δειγμάτων δεδομένων για την οποία θα γίνει η πραγματοποίηση της ανίχνευσης.
- Καθαρίστε και προεπεξεργαστείτε τα δεδομένα αποφασίζοντας στρατηγικές για να χειριστείτε πεδία που λείπουν και να τροποποιήσετε τα δεδομένα σύμφωνα με τις απαιτήσεις.
- Απλοποιήστε τα σύνολα δεδομένων αφαιρώντας τις ανεπιθύμητες μεταβλητές. Στη συνέχεια, αναλύστε χρήσιμα χαρακτηριστικά που μπορούν να χρησιμοποιηθούν για την αναπαραγωγή των δεδομένων, ανάλογα με το στόχο ή την εργασία.
- Αντιστοιχίστε στόχους KDD με μεθόδους εξόρυξης δεδομένων για να προτείνετε κρυμμένα μοτίβα.
- Επιλέξτε αλγόριθμους εξόρυξης δεδομένων για να ανακαλύψετε κρυμμένα μοτίβα. Αυτή η διαδικασία περιλαμβάνει την απόφαση σχετικά με τα μοντέλα και τις παραμέτρους που θα μπορούσαν να είναι κατάλληλα για τη συνολική διαδικασία KDD.
- Αναζητήστε μοντέλα ενδιαφέροντος σε μια συγκεκριμένη μορφή αναπαραγωγής, τα οποία περιλαμβάνουν κανόνες ταξινόμησης ή δέντρα, παλινδρόμηση και ομαδοποίηση.
- Ερμηνεύστε τις βασικές γνώσεις από τα εξορυσσόμενα σχέδια.
- Χρησιμοποιήστε τη γνώση και ενσωματώστε την σε ένα άλλο σύστημα για περαιτέρω δράση.
- Τεκμηθείτε και κάνετε εκθέσεις για τα ενδιαφερόμενα μέρη.
