Ερ:
Πώς μπορεί η έννοια της ισορροπίας να ενημερώσει τα μαθήματα μηχανικής μάθησης;
ΕΝΑ:Σε γενικές γραμμές, μια ισορροπία θα ενημερώνει την εκμάθηση μηχανών προσπαθώντας να σταθεροποιήσει τα περιβάλλοντα μηχανικής μάθησης και να δημιουργήσει αποτελέσματα με ένα συμβατό μείγμα ντετερμινιστικών και πιθανοτικών συστατικών.
Οι εμπειρογνώμονες περιγράφουν μια «ισορροπία» ως μια κατάσταση όπου οι ορθολογικοί συντελεστές ενός συστήματος μηχανικής μάθησης καταλήγουν σε συναίνεση για στρατηγική δράση - συγκεκριμένα, η ισορροπία Nash στη θεωρία παιγνίων περιλαμβάνει δύο ή περισσότερους από αυτούς τους ορθολογικούς παράγοντες που εδραιώνουν τις στρατηγικές αναγνωρίζοντας ότι αλλάζοντας μια συγκεκριμένη στρατηγική εάν οι άλλοι παίκτες δεν αλλάξουν τη δική τους.
Δωρεάν Λήψη: Μηχανική Μάθηση και γιατί έχει σημασία |
Μια ιδιαίτερα δημοφιλής και απλή επίδειξη της ισορροπίας Nash περιλαμβάνει έναν απλό πίνακα όπου δύο παίκτες επιλέγουν το καθένα δυαδικό αποτέλεσμα.
Τα παραπάνω είναι ένας πολύ τεχνικός τρόπος για να περιγράψουμε την ισορροπία και πώς λειτουργεί. Ένας πολύ πιο άτυπος τρόπος για να καταδείξουμε την έννοια της ισορροπίας, ιδιαίτερα το παραπάνω παράδειγμα δύο λογικών ηθοποιών, κάθε ένα με δυαδική επιλογή, είναι να σκεφτούμε τι θα μπορούσατε να αποκαλείτε το σενάριο "περπατώντας το ένα στο άλλο στο διάδρομο του γυμνασίου".
Ας υποθέσουμε ότι δύο άνθρωποι περπατούν σε διαφορετικές κατευθύνσεις κάτω από ένα διάδρομο σχολείου (ή οποιοδήποτε άλλο τύπο περιοχής), που έχει μόνο χώρο για δύο άτομα πλάτους-σοφός. Τα δύο ανοικτά μονοπάτια είναι τα δυαδικά αποτελέσματα. Αν οι δυο λογικοί ηθοποιοί επιλέξουν διαφορετικά δυαδικά αποτελέσματα που δεν έρχονται σε αντίθεση μεταξύ τους, θα περάσουν ο ένας από τον άλλον και θα πούμε γεια. Αν επιλέξουν δύο συγκρουόμενα δυαδικά αποτελέσματα - περπατούν στον ίδιο χώρο και ένας από αυτούς θα πρέπει να αποδώσει.
Στο παραπάνω παράδειγμα, εάν οι δυο λογικοί ηθοποιοί επιλέξουν τα δύο συμβατά και μη συγκρουόμενα αποτελέσματα, η γενική συναίνεση είναι ότι κανένας δεν κερδίζει αλλάζοντας τη στρατηγική τους - στην περίπτωση αυτή τις κατευθύνσεις τους για περπάτημα - εάν το άλλο πρόσωπο δεν αλλάξει τη δική τους.
Τα παραπάνω αποτελούν μια ισορροπία που μπορεί να διαμορφωθεί σε οποιοδήποτε δεδομένο κατασκεύασμα μηχανικής μάθησης. Λαμβάνοντας υπόψη αυτό το απλό παράδειγμα, το αποτέλεσμα θα είναι πάντα οι δύο λογικοί συντελεστές που συνεργάζονται, ή με άλλα λόγια, δύο άνθρωποι περπατώντας ο ένας τον άλλον.
Το αντίθετο θα μπορούσε να ονομαστεί "ανισορροπία" - αν οι δυο λογικοί ηθοποιοί επιλέξουν συγκρουόμενα αποτελέσματα, όπως αναφέρθηκε, ένας από αυτούς θα πρέπει να αποδώσει. Ωστόσο, το μοντέλο του προγράμματος ML θα μπορούσε να πεταχτεί σε έναν άπειρο βρόχο αν και οι δύο αποφασίσουν να αποδώσουν - σαν δύο άτομα να κινηθούν για να προσπαθήσουν να προσαρμοστούν μεταξύ τους και να συνεχίσουν να περπατούν προς σύγκρουση.
Οι ισορροπίες, όπως αυτές που αναφέρονται παραπάνω, θα χρησιμοποιηθούν γενικά στη μηχανική μάθηση για τη δημιουργία συναίνεσης και τη σταθεροποίηση των μοντέλων. Οι μηχανικοί και οι προγραμματιστές θα αναζητήσουν τα σενάρια και τις καταστάσεις που επωφελούνται από τις ισορροπίες και εργάζονται για να αλλάξουν ή να χειριστούν εκείνα που δεν το κάνουν. Εξετάζοντας παραδείγματα πραγματικού κόσμου που αντιστοιχούν στις ισορροπίες ML, είναι εύκολο να δούμε πώς αυτό το είδος της ανάλυσης στο σύστημα μηχανικής μάθησης είναι μοναδικά διδακτικό για να υπολογίσει πώς να μοντελοποιήσει την ανθρώπινη συμπεριφορά δημιουργώντας τους ορθολογικούς παράγοντες και παράγοντες. Αυτό είναι μόνο ένα εξαιρετικό παράδειγμα του πώς μια ισορροπία μπορεί να χρησιμοποιηθεί για να κάνει πρόοδο στην εφαρμογή των μηχανικών συστημάτων μάθησης.