Ερ:
Ποιος είναι ο απλός τρόπος για να περιγράψουμε τη μεροληψία και τη διακύμανση στη μηχανική μάθηση;
ΕΝΑ:Υπάρχουν διάφοροι περίπλοκοι τρόποι για να περιγράψουμε τη μεροληψία και τη διακύμανση στη μηχανική μάθηση. Πολλοί από αυτούς χρησιμοποιούν σημαντικά πολύπλοκες μαθηματικές εξισώσεις και δείχνουν μέσα από το γράφημα πως τα συγκεκριμένα παραδείγματα αντιπροσωπεύουν διάφορες ποσότητες τόσο απόκλισης όσο και απόκλισης.
Εδώ είναι ένας απλός τρόπος για να περιγράψουμε τη μεροληψία, τη διακύμανση και την αντιστάθμιση της μεροληψίας / διακύμανσης στη μηχανική μάθηση.
Στον πυρήνα της, η προκατάληψη είναι μια υπεραπλούστευση. Μπορεί να είναι σημαντικό να προσθέσετε στον ορισμό της προκατάληψης κάποια παραδοχή ή υποτιθέμενο σφάλμα.
Εάν ένα πολύ προκατειλημμένο αποτέλεσμα δεν ήταν λάθος - εάν ήταν με τα χρήματα - θα ήταν εξαιρετικά ακριβές. Το πρόβλημα είναι ότι το απλοποιημένο μοντέλο περιέχει κάποιο σφάλμα, οπότε δεν είναι στο μάτι του ταύρου - το σημαντικό σφάλμα εξακολουθεί να επαναλαμβάνεται ή και να ενισχύεται καθώς λειτουργεί το πρόγραμμα εκμάθησης μηχανών.
Ο απλός ορισμός της διακύμανσης είναι ότι τα αποτελέσματα είναι πολύ διάσπαρτα. Αυτό συχνά οδηγεί σε υπερβολική πολυπλοκότητα του προγράμματος και προβλήματα μεταξύ δοκιμαστικών και εκπαιδευτικών σετ.
Υψηλή διακύμανση σημαίνει ότι οι μικρές αλλαγές δημιουργούν μεγάλες αλλαγές στις εξόδους ή στα αποτελέσματα.
Ένας άλλος τρόπος για να περιγράψουμε απλώς τη διακύμανση είναι ότι υπάρχει υπερβολικό θόρυβο στο μοντέλο και έτσι γίνεται όλο και πιο δύσκολο για το πρόγραμμα εκμάθησης μηχανών να απομονώνει και να αναγνωρίζει το πραγματικό σήμα.
Έτσι, ένας από τους απλούστερους τρόπους σύγκρισης της μεροληψίας και της διακύμανσης είναι να υποδείξουμε ότι οι μηχανικοί μηχανικής μάθησης πρέπει να περπατήσουν μια λεπτή γραμμή μεταξύ υπερβολικής μεροληψίας ή υπεραπλούστευσης και υπερβολικής διακύμανσης ή υπερβολικής πολυπλοκότητας.
Ένας άλλος τρόπος να εκπροσωπηθεί αυτό το πηγάδι είναι με ένα τετράγωνο διάγραμμα που δείχνει όλους τους συνδυασμούς υψηλής και χαμηλής διακύμανσης. Στο τεταρτημόριο χαμηλής μεροληψίας / χαμηλής διακύμανσης, όλα τα αποτελέσματα συγκεντρώνονται σε ένα ακριβές σύμπλεγμα. Σε ένα αποτέλεσμα υψηλής απόκλισης / χαμηλής διακύμανσης, όλα τα αποτελέσματα συγκεντρώνονται σε ένα ανακριβές σύμπλεγμα. Σε ένα αποτέλεσμα χαμηλής μεροληψίας / μεγάλης διακύμανσης, τα αποτελέσματα είναι διάσπαρτα γύρω από ένα κεντρικό σημείο που θα αντιπροσωπεύει ένα ακριβές σύμπλεγμα, ενώ σε ένα αποτέλεσμα υψηλής απόκλισης / μεγάλης διακύμανσης, τα σημεία δεδομένων είναι αμφότερα διασκορπισμένα και συλλογικά ανακριβή.