Ερ:
Γιατί είναι χρήσιμο ένας πίνακας σύγχυσης σε ML;
ΕΝΑ:Υπάρχουν διάφοροι τρόποι να μιλήσουμε για το λόγο που ένας πίνακας σύγχυσης είναι πολύτιμος στη μηχανική μάθηση (ML) - αλλά ένας από τους απλούστερους τρόπους είναι να εξηγήσουμε ότι ο πίνακας συγχύσεων είναι ένας πόρος απεικόνισης δεδομένων.
Ένας πίνακας σύγχυσης επιτρέπει στους θεατές να δουν με μια ματιά τα αποτελέσματα της χρήσης ενός ταξινομητή ή άλλου αλγορίθμου. Χρησιμοποιώντας έναν απλό πίνακα για να δείξετε αναλυτικά αποτελέσματα, ο πίνακας σύγχυσης ουσιαστικά βράζει τις εξόδους σας σε μια πιο εύπεπτη όψη.
Ο πίνακας σύγχυσης χρησιμοποιεί συγκεκριμένη ορολογία για την οργάνωση των αποτελεσμάτων. Υπάρχουν αληθινά θετικά και αληθινά αρνητικά, καθώς και ψευδή θετικά και ψεύτικα αρνητικά. Για μια πιο περίπλοκη μήτρα σύγχυσης ή μία με βάση την ταξινόμηση σύγκρισης, αυτές οι τιμές μπορεί να εμφανίζονται ως πραγματικές και προβλεπόμενες κατηγορίες για δύο διακριτά αντικείμενα.
Ανεξάρτητα από τη σημασιολογική ορολογία, τα αποτελέσματα ομαδοποιούνται σε ένα τετράγωνο (ή ορθογώνιο) πίνακα.
Αυτή η προβολή διευκολύνει τους αναλυτές να δουν πώς σε έναν ακριβή αλγόριθμο ήταν στην ταξινόμηση των αποτελεσμάτων. (Διαβάστε τις νέες γεννήτριες που θέτουν σύγχρονους αλγόριθμους για να δουλέψουν στην τέχνη ASCII.)
Η χρησιμότητα του πίνακα σύγχυσης έχει να κάνει με την πολυπλοκότητα των έργων ML και επίσης με τον τρόπο μορφοποίησης και παράδοσης των πληροφοριών στους χρήστες. Φανταστείτε μια σειρά γραμμικών αποτελεσμάτων, συμπεριλαμβανομένων ψευδών θετικών, ψευδών αρνητικών, αληθινών θετικών και πραγματικών αρνητικών. (Διαβάστε τη μάθηση μηχανών 101.)
Ένας χρήστης θα πρέπει να συγκεντρώσει όλα αυτά τα γραμμικά αποτελέσματα σε ένα γράφημα για να καταλάβει πώς λειτουργεί ο αλγόριθμος και πόσο ακριβής ήταν. Με τη μήτρα σύγχυσης, αυτές οι πληροφορίες παρουσιάζονται απλά σε ένα ισχυρό οπτικό μοντέλο.
Για παράδειγμα, υποθέστε ότι η μηχανή καλείται να ταξινομήσει 20 εικόνες, εκ των οποίων πέντε είναι φρούτα και πέντε είναι λαχανικά. Εάν ένα πλέγμα σύγχυσης έχει τα ακόλουθα περιεχόμενα (από πάνω αριστερά δεξιόστροφα): 7, 5, 3, 5, τότε η μήτρα δείχνει ότι επτά είχαν αναγνωριστεί σωστά ως λαχανικά, ενώ τρεις είχαν ταξινομηθεί σωστά ως φρούτα.
Τα άλλα 10, όπως αναπαρίστανται, είναι αποτελέσματα όπου το πρόγραμμα απέτυχε να αναγνωρίσει σωστά την εικόνα.
Ο πίνακας σύγχυσης θα είναι χρήσιμος σε όλα τα είδη αναλύσεων ML. Παρατηρώντας αυτόν τον πόρο, οι χρήστες μπορούν να καταλάβουν πώς να χειριστούν προβλήματα όπως η διαστασιολόγηση και η υπερκατασκευή και άλλοι τρόποι βελτιστοποίησης ενός αλγορίθμου.