Σπίτι Ήχος Γιατί ορισμένα προγράμματα εκμάθησης μηχανών απαιτούν τεράστιο αριθμό φορέων;

Γιατί ορισμένα προγράμματα εκμάθησης μηχανών απαιτούν τεράστιο αριθμό φορέων;

Anonim

Ερ:

Γιατί ορισμένα προγράμματα εκμάθησης μηχανών απαιτούν τεράστιο αριθμό φορέων;

ΕΝΑ:

Όταν σκέφτεστε τη μηχανική μάθηση, έχετε την τάση να σκέφτεστε ειδικευμένους επιστήμονες δεδομένων που εργάζονται σε πληκτρολόγια σε αίθουσες υπολογιστών. Υπάρχει μεγάλη έμφαση στην ποσοτική ανάλυση και τους αλγορίθμους. Δεν υπάρχουν πολλά άμεσα περιβάλλοντα πραγματικού κόσμου σε πολλά από αυτά τα προγράμματα - τουλάχιστον αυτό είναι που πολλοί θα σκεφτούν.

Ωστόσο, μερικά από τα πιο πρωτοποριακά προγράμματα εκμάθησης μηχανών σήμερα χρησιμοποιούν πραγματικούς στρατούς ανθρώπινων παραγόντων έξω στο δρόμο, στα καταστήματα και οπουδήποτε μπορούν να διαμορφώσουν βασικές ανθρώπινες δραστηριότητες όπως το περπάτημα, την εργασία ή το ψώνισμα.

Δωρεάν Λήψη: Μηχανική Μάθηση και γιατί έχει σημασία

Ένα ενσύρματο άρθρο του Tom Simonite περιγράφει αυτό το πολύ καλά με τον κατάλληλο τίτλο "Για να γίνεις πιο έξυπνος, οι άνθρωποι εκτελούν ξεχασμένες χαμηλές πληρωμές".

Χρησιμοποιώντας το παράδειγμα των μικρών βίντεο που έχουν ληφθεί σε ένα παντοπωλείο Whole Foods, ο Simonite τονίζει τα είδη των εργασιών που θα βοηθήσουν στην οικοδόμηση μιας επόμενης φάσης της μηχανικής μάθησης.

Αυτό οδηγεί στο ερώτημα γιατί όλοι αυτοί οι άνθρωποι ασχολούνται με τη μαγνητοσκόπηση σε μικρά και απλά βίντεο που τεκμηριώνουν τις ενέργειες ως στοιχειώδη όπως η κίνηση ενός χεριού ή ποδιού.

Η απάντηση ρίχνει ένα φως σχετικά με το πού είναι η μηχανική μάθηση και πού πηγαίνει.

"Οι ερευνητές και οι επιχειρηματίες θέλουν να δουν το AI να καταλάβει και να ενεργήσει στον φυσικό κόσμο", γράφει ο Simonite, εξηγώντας γιατί αυτός και οι άλλοι βγαίνουν με κάμερες. "Εξ ου και η ανάγκη για τους εργαζόμενους να παίξουν σκηνές σε σούπερ μάρκετ και σπίτια. Δημιουργούν το υλικό διδασκαλίας για να διδάξουν αλγορίθμους για τον κόσμο και τους ανθρώπους σε αυτό ».

Όπως θα επισημάνουν πολλοί ειδικοί, μερικά από τα μεγαλύτερα σύνορα της μηχανικής μάθησης αφορούν την επεξεργασία εικόνας και την επεξεργασία της φυσικής γλώσσας. Πρόκειται για εξαιρετικά ποσοτικές διαδικασίες - με άλλα λόγια, δεν υπάρχει ένα ευρύ φάσμα εισροών, όπως υπάρχουν σε "επιδόσεις" σε πραγματικό περιβάλλον. Αντ 'αυτού, τα προγράμματα εκμάθησης μηχανών χρησιμοποιούν οπτικά και ηχητικά δεδομένα με πολύ συγκεκριμένους τρόπους για την κατασκευή μοντέλων. Με την επεξεργασία εικόνας, είναι η επιλογή χαρακτηριστικών από ένα (πεπερασμένο) οπτικό πεδίο. Για το NLP, συναρμολογεί φωνήματα.

Η υπέρβαση αυτών των συγκεκριμένων κατηγοριών εισόδου περιλαμβάνει κάτι που μπορεί να ονομάσετε "χάσμα εικόνας και ομιλίας" - πέρα ​​από πράγματα όπως η επεξεργασία εικόνας και η αναγνώριση ομιλίας, κινούνται σε περιοχές όπου οι υπολογιστές πρέπει να είναι αναλυτικοί με διαφορετικούς τρόπους. Τα σετ κατάρτισης θα είναι θεμελιωδώς διαφορετικά.

Εισάγετε το στρατό των βιντεογράφων. Σε ορισμένα από αυτά τα νέα προγράμματα μηχανικής μάθησης, οι μικρότερες ιδέες των ανθρώπινων δραστηριοτήτων είναι τα σετ εκπαίδευσης. Αντί να εκπαιδεύονται να αναζητούν χαρακτηριστικά και ακμές και εικονοστοιχεία που συνθέτουν σε εργασίες ταξινόμησης, οι υπολογιστές χρησιμοποιούν αντ 'αυτού εκπαιδευτικά βίντεο για να αξιολογήσουν ποιους διαφορετικούς τύπους δράσης μοιάζουν.

Το κλειδί είναι τι μπορούν να κάνουν οι μηχανικοί με αυτά τα δεδομένα όταν συγκεντρωθούν και φορτωθούν και όταν ο υπολογιστής εκπαιδεύσει σε αυτό. Σύντομα θα δείτε τα αποτελέσματα σε διάφορα πεδία - για παράδειγμα, αυτό θα κάνει την επιτήρηση εξαιρετικά αποτελεσματική. Οι υπολογιστές θα μπορούν να "βλέπουν" στο οπτικό πεδίο τι κάνουν οι άνθρωποι και να το εφαρμόζουν σε τομείς όπως το μάρκετινγκ και τις πωλήσεις, ή ίσως, σε ορισμένες περιπτώσεις, την κυβερνητική υπηρεσία εργασίας ή την ποινική δικαιοσύνη.

Οι συνέπειες έδωσαν επίσης ένα φως στη συζήτηση μεταξύ των μέγιστων ζητημάτων οφέλους και ιδιωτικότητας. Μεγάλο μέρος της χρήσης αυτών των βίντεο θα δημιουργήσει μοντέλα μηχανικής μάθησης που λειτουργούν για επιτήρηση - αλλά τι γίνεται με ανθρώπους που δεν θέλουν να παρακολουθούνται; Όταν αυτά τα νέα προγράμματα μηχανικής μάθησης αναπτύσσονται στον δημόσιο χώρο, ποια είναι τα δικαιώματα του ατόμου και πού είναι αυτή η γραμμή;

Εν πάση περιπτώσει, οι εταιρείες χρησιμοποιούν αυτά τα είδη ανθρώπινων και βίντεο για να σκάψουν πραγματικά σε μερικούς κύκλους επόμενου επιπέδου της εκμάθησης μηχανικής μάθησης που θα επιτρέψουν στην πραγματικότητα οι υπολογιστές να αναγνωρίσουν τι συμβαίνει γύρω τους, αντί να ταξινομούν εικόνες ή να εργάζονται με τα φωνήματα ομιλία. Πρόκειται για μια εξαιρετικά ενδιαφέρουσα και αμφιλεγόμενη εξέλιξη της τεχνητής νοημοσύνης, και αυτή που αξίζει το μερίδιο της προσοχής της στα μέσα τεχνολογίας και πέραν αυτής.

Γιατί ορισμένα προγράμματα εκμάθησης μηχανών απαιτούν τεράστιο αριθμό φορέων;