Σπίτι Στα νέα Γιατί η επιλογή χαρακτηριστικών είναι τόσο σημαντική στη μηχανική μάθηση;

Γιατί η επιλογή χαρακτηριστικών είναι τόσο σημαντική στη μηχανική μάθηση;

Anonim

Ερ:

Γιατί η επιλογή χαρακτηριστικών είναι τόσο σημαντική στη μηχανική μάθηση;

ΕΝΑ:

Η επιλογή των χαρακτηριστικών είναι εξαιρετικά σημαντική στη μηχανική μάθηση κυρίως επειδή χρησιμεύει ως θεμελιώδης τεχνική για να κατευθύνει τη χρήση των μεταβλητών σε αυτό που είναι πιο αποτελεσματικό και αποτελεσματικό για ένα δεδομένο σύστημα μηχανικής μάθησης.

Οι ειδικοί μιλούν για το πώς η επιλογή χαρακτηριστικών και η λειτουργία εξαγωγής χαρακτηριστικών ελαχιστοποιούν την κατάρα των διαστάσεων ή βοηθούν στην αντιμετώπιση της υπερθέρμανσης - αυτοί είναι διαφορετικοί τρόποι αντιμετώπισης της ιδέας της υπερβολικά περίπλοκης μοντελοποίησης.

Δωρεάν Λήψη: Μηχανική Μάθηση και γιατί έχει σημασία

Ένας άλλος τρόπος για να πούμε αυτό είναι ότι η επιλογή χαρακτηριστικών βοηθά να δοθεί στους προγραμματιστές τα εργαλεία για να χρησιμοποιούν μόνο τα πιο σχετικά και χρήσιμα δεδομένα σε σύνολα εκπαίδευσης μηχανικής μάθησης, τα οποία μειώνουν δραματικά το κόστος και τον όγκο των δεδομένων.

Ένα παράδειγμα είναι η ιδέα της μέτρησης ενός πολύπλοκου σχήματος σε κλίμακα. Καθώς το πρόγραμμα κλιμακώνει, αναγνωρίζει μεγαλύτερο αριθμό σημείων δεδομένων και το σύστημα γίνεται πολύ πιο περίπλοκο. Αλλά ένα σύνθετο σχήμα δεν είναι το τυπικό σύνολο δεδομένων που χρησιμοποιεί ένα σύστημα εκμάθησης μηχανής. Αυτά τα συστήματα μπορούν να χρησιμοποιούν σύνολα δεδομένων που έχουν πολύ διαφορετικά επίπεδα διακύμανσης μεταξύ διαφορετικών μεταβλητών. Για παράδειγμα, στην ταξινόμηση ειδών, οι μηχανικοί μπορούν να χρησιμοποιήσουν την επιλογή χαρακτηριστικών για να μελετήσουν μόνο τις μεταβλητές που θα τους δώσουν τα πιο στοχευμένα αποτελέσματα. Αν κάθε ζώο στο γράφημα έχει τον ίδιο αριθμό ματιών ή ποδιών, τα δεδομένα αυτά μπορεί να αφαιρεθούν ή άλλα συναφή σημεία δεδομένων μπορούν να εξαχθούν.

Η επιλογή χαρακτηριστικών είναι η διακριτική διαδικασία με την οποία οι μηχανικοί κατευθύνουν τα συστήματα μηχανικής μάθησης προς έναν στόχο. Εκτός από την ιδέα της άρσης της πολυπλοκότητας από τα συστήματα σε κλίμακα, η επιλογή χαρακτηριστικών μπορεί επίσης να είναι χρήσιμη για τη βελτιστοποίηση των πτυχών αυτού που οι εμπειρογνώμονες ονομάζουν "αντιστάθμιση διακύμανσης μεροληψίας" στη μηχανική μάθηση.

Οι λόγοι για τους οποίους η επιλογή χαρακτηριστικών βοηθά με την ανάλυση της μεροληψίας και της διακύμανσης είναι πιο περίπλοκη. Μια μελέτη από το Πανεπιστήμιο Cornell σχετικά με την επιλογή χαρακτηριστικών, τη διακύμανση της μεροληψίας και την σάκκο χρησιμεύει για να απεικονίσει πώς σχεδιάζονται τα βοηθήματα επιλογής χαρακτηριστικών.

Σύμφωνα με τους συγγραφείς, το έγγραφο "εξετάζει τον μηχανισμό με τον οποίο η επιλογή χαρακτηριστικών βελτιώνει την ακρίβεια της εποπτευόμενης μάθησης".

Η μελέτη αναφέρει επίσης:

Μια εμπειρική ανάλυση μεροληψίας / διακύμανσης ως εξέλιξη της επιλογής χαρακτηριστικών υποδηλώνει ότι το πιο ακριβές σύνολο χαρακτηριστικών αντιστοιχεί στο καλύτερο σημείο αντισταθμίσεως της μετατόπισης για τον αλγόριθμο μάθησης.

Συζητώντας τη χρήση ισχυρής ή ασθενούς συνάφειας, οι συγγραφείς μιλούν για την επιλογή χαρακτηριστικών ως "μέθοδος μείωσης διακύμανσης" - αυτό έχει νόημα όταν σκέφτεστε τη διακύμανση ως ουσιαστικά το ποσό της μεταβολής σε μια δεδομένη μεταβλητή. Εάν δεν υπάρχει διακύμανση, το σημείο δεδομένων ή ο πίνακας μπορεί να είναι ουσιαστικά άχρηστος. Εάν υπάρχει εξαιρετικά μεγάλη διακύμανση, μπορεί να μεταβιβαστεί σε αυτό που οι μηχανικοί μπορεί να θεωρούν ως "θόρυβο" ή άσχετα, αυθαίρετα αποτελέσματα που είναι δύσκολο να διαχειριστεί το σύστημα εκμάθησης μηχανών.

Υπό το πρίσμα αυτό, η επιλογή χαρακτηριστικών αποτελεί βασικό μέρος του σχεδιασμού της μηχανικής μάθησης.

Γιατί η επιλογή χαρακτηριστικών είναι τόσο σημαντική στη μηχανική μάθηση;