Πίνακας περιεχομένων:
Ορισμός - Τι σημαίνει μείωση του μεγέθους;
Η μείωση των διαστάσεων είναι μια σειρά από τεχνικές μάθησης μηχανών και στατιστικών για τη μείωση του αριθμού τυχαίων μεταβλητών που πρέπει να ληφθούν υπόψη. Περιλαμβάνει την επιλογή χαρακτηριστικών και την εξαγωγή χαρακτηριστικών. Η μείωση της διατομής καθιστά την ανάλυση των δεδομένων πολύ ευκολότερη και ταχύτερη για τους αλγόριθμους μηχανικής μάθησης χωρίς επεξεργασία εξωγενών μεταβλητών, καθιστώντας τους αλγόριθμους μηχανικής μάθησης πιο γρήγορους και απλούστερους με τη σειρά τους.
Η Techopedia εξηγεί τη μείωση των διαστάσεων
Η μείωση των διαστάσεων προσπαθεί να μειώσει τον αριθμό τυχαίων μεταβλητών στα δεδομένα. Συνήθως χρησιμοποιείται η προσέγγιση των πλησιέστερων γειτόνων. Οι τεχνικές μείωσης διαστάσεων χωρίζονται σε δύο κύριες κατηγορίες: επιλογή χαρακτηριστικών και εξαγωγή χαρακτηριστικών.
Οι τεχνικές επιλογής λειτουργιών βρίσκουν ένα μικρότερο υποσύνολο ενός πολυδιάστατου συνόλου δεδομένων για τη δημιουργία ενός μοντέλου δεδομένων. Οι κύριες στρατηγικές για το σετ χαρακτηριστικών είναι το φίλτρο, το περιτύλιγμα (χρησιμοποιώντας ένα μοντέλο πρόβλεψης) και το ενσωματωμένο, τα οποία εκτελούν την επιλογή χαρακτηριστικών κατά την κατασκευή ενός μοντέλου.
Η εξαγωγή χαρακτηριστικών περιλαμβάνει τη μετατροπή δεδομένων υψηλής διαστάσεων σε χώρους με λιγότερες διαστάσεις. Οι μέθοδοι περιλαμβάνουν ανάλυση κύριου συστατικού, PCA πυρήνα, PCA πυρήνα με βάση το γράφημα, ανάλυση γραμμικών διακρίσεων και γενικευμένη ανάλυση διακρίσεων.