Σπίτι Ανάπτυξη Τι είναι η μάθηση ενίσχυσης; - ορισμός από την τεχνολογία

Τι είναι η μάθηση ενίσχυσης; - ορισμός από την τεχνολογία

Πίνακας περιεχομένων:

Anonim

Ορισμός - Τι σημαίνει Ενίσχυση Learning;

Η ενίσχυση της μάθησης, στο πλαίσιο της τεχνητής νοημοσύνης, είναι ένας τύπος δυναμικού προγραμματισμού που εκπαιδεύει αλγορίθμους χρησιμοποιώντας ένα σύστημα ανταμοιβής και τιμωρίας.

Ένας αλγόριθμος μάθησης οπλισμού, ή ένας πράκτορας, μαθαίνει αλληλεπιδρώντας με το περιβάλλον του. Ο πράκτορας λαμβάνει ανταμοιβές με την ορθή εκτέλεση και κυρώσεις για την εσφαλμένη εκτέλεση. Ο πράκτορας μαθαίνει χωρίς παρέμβαση από έναν άνθρωπο μεγιστοποιώντας την ανταμοιβή του και ελαχιστοποιώντας την ποινή του.

Η Techopedia εξηγεί την ενίσχυση της μάθησης

Η ενίσχυση της μάθησης είναι μια προσέγγιση της μηχανικής μάθησης που εμπνέεται από τη συμπεριφοριστική ψυχολογία. Είναι παρόμοιο με το πώς ένα παιδί μαθαίνει να εκτελεί μια νέα εργασία. Η ενίσχυση της μάθησης έρχεται σε αντίθεση με άλλες προσεγγίσεις μηχανικής μάθησης, επειδή ο αλγόριθμος δεν λέει ρητά πώς να εκτελέσει μια εργασία, αλλά εργάζεται μέσω του προβλήματος από μόνο του.

Ως πράκτορας, που μπορεί να είναι αυτοκινούμενο αυτοκίνητο ή πρόγραμμα που παίζει σκάκι, αλληλεπιδρά με το περιβάλλον του, λαμβάνει μια κατάσταση ανταμοιβής ανάλογα με τον τρόπο που εκτελεί, όπως η οδήγηση στον προορισμό με ασφάλεια ή η κατάκτηση ενός παιχνιδιού. Αντίστροφα, ο πράκτορας λαμβάνει ποινή για την εσφαλμένη εκτέλεση, όπως η έξοδος από το δρόμο ή το checkmating.

Ο πράκτορας με την πάροδο του χρόνου λαμβάνει αποφάσεις για να μεγιστοποιήσει την ανταμοιβή του και να ελαχιστοποιήσει την ποινή του χρησιμοποιώντας δυναμικό προγραμματισμό Το πλεονέκτημα αυτής της προσέγγισης στην τεχνητή νοημοσύνη είναι ότι επιτρέπει σε ένα πρόγραμμα AI να μάθει χωρίς προγραμματιστή να εξηγεί πώς ένας πράκτορας πρέπει να εκτελέσει το έργο.

Τι είναι η μάθηση ενίσχυσης; - ορισμός από την τεχνολογία