Πίνακας περιεχομένων:
Ορισμός - Τι σημαίνουν τα στοιχεία εκπαίδευσης;
Η ιδέα της χρήσης δεδομένων κατάρτισης στα προγράμματα μηχανικής μάθησης είναι μια απλή ιδέα, αλλά είναι επίσης πολύ θεμελιώδους σημασίας για τον τρόπο με τον οποίο λειτουργούν αυτές οι τεχνολογίες. Τα δεδομένα εκπαίδευσης είναι ένα αρχικό σύνολο δεδομένων που χρησιμοποιούνται για να βοηθήσουν ένα πρόγραμμα να καταλάβει πώς να εφαρμόσει τεχνολογίες όπως τα νευρωνικά δίκτυα για να μάθουν και να παράγουν εξελιγμένα αποτελέσματα. Μπορεί να συμπληρώνεται από τα επόμενα σύνολα δεδομένων που ονομάζονται σύνολα επικύρωσης και δοκιμών.
Τα δεδομένα εκπαίδευσης είναι επίσης γνωστά ως σύνολο κατάρτισης, σύνολο δεδομένων κατάρτισης ή σετ μάθησης.
Η Techopedia εξηγεί τα δεδομένα εκπαίδευσης
Το σετ κατάρτισης είναι το υλικό μέσω του οποίου ο υπολογιστής μαθαίνει πώς να επεξεργάζεται τις πληροφορίες. Η μηχανική μάθηση χρησιμοποιεί αλγορίθμους - μιμείται τις ικανότητες του ανθρώπινου εγκεφάλου να λαμβάνει διάφορες εισόδους και να τις ζυγίζει, προκειμένου να παράγει ενεργοποιήσεις στον εγκέφαλο, στους μεμονωμένους νευρώνες. Οι τεχνητοί νευρώνες αντιγράφουν πολλά από αυτή τη διαδικασία με προγράμματα λογισμικού - μηχανικής μάθησης και προγράμματα νευρωνικών δικτύων που παρέχουν εξαιρετικά λεπτομερή μοντέλα για το πώς λειτουργούν οι ανθρώπινες σκέψεις μας.
Με αυτό το πνεύμα, τα δεδομένα εκπαίδευσης μπορούν να δομηθούν με διαφορετικούς τρόπους. Για διαδοχικά δέντρα αποφάσεων και αυτούς τους τύπους αλγορίθμων, θα ήταν ένα σύνολο ακατέργαστων κειμένων ή αλφαριθμητικών δεδομένων που κατατάσσονται ή αλλοιώνονται με άλλο τρόπο. Από την άλλη πλευρά, για συνελικτικά νευρωνικά δίκτυα που έχουν να κάνουν με την επεξεργασία εικόνας και την όραση του υπολογιστή, το σετ κατάρτισης αποτελείται συχνά από μεγάλο αριθμό εικόνων. Η ιδέα είναι ότι επειδή το πρόγραμμα εκμάθησης μηχανών είναι τόσο περίπλοκο και τόσο εξειδικευμένο, χρησιμοποιεί επαναληπτική εκπαίδευση σε κάθε μια από αυτές τις εικόνες για να είναι σε θέση να αναγνωρίσει χαρακτηριστικά, σχήματα ή ακόμη και θέματα όπως άνθρωποι ή ζώα. Τα δεδομένα εκπαίδευσης είναι απολύτως απαραίτητα για τη διαδικασία - μπορεί να θεωρηθεί ως το "τρόφιμο" που χρησιμοποιεί το σύστημα για να λειτουργήσει.