Πίνακας περιεχομένων:
Ορισμός - Τι σημαίνει το σύνολο δοκιμών;
Ένα σύνολο δοκιμών στη μηχανική μάθηση είναι ένα δευτερεύον (ή τριτογενές) σύνολο δεδομένων που χρησιμοποιείται για τη δοκιμή ενός προγράμματος εκμάθησης μηχανών μετά από την εκπαίδευση του σε ένα σύνολο δεδομένων αρχικής κατάρτισης. Η ιδέα είναι ότι τα μοντέλα πρόβλεψης έχουν πάντοτε κάποιο είδος άγνωστης ικανότητας που πρέπει να δοκιμαστεί, σε αντίθεση με την ανάλυση από την προοπτική προγραμματισμού.
Ένα σύνολο δοκιμών είναι επίσης γνωστό ως σύνολο δεδομένων δοκιμών ή δεδομένα δοκιμών.
Η Techopedia εξηγεί το Test Set
Πολλοί εμπειρογνώμονες θα έλεγαν ότι μια βέλτιστη πρακτική είναι να έχουμε ένα σύνολο δεδομένων δοκιμών που "απομονώνονται" ή διατηρούνται μέχρι το τέλος της διαδικασίας. Οι μηχανικοί αναζητούν υπερκατασκευή του μοντέλου και άλλα θέματα στη διαδικασία κατάρτισης. Στην ιδανική περίπτωση, υπάρχει ένα τρίτο σύνολο, ένα σύνολο δεδομένων επικύρωσης, το οποίο ελέγχει τις παραμέτρους του ταξινομητή. Στη συνέχεια, και μόνο τότε, το σετ δοκιμών μπορεί να αναδειχθεί για να διαπιστωθεί πόσο καλά εκπαιδεύτηκε το πρόγραμμα και εάν το προγνωστικό μοντέλο του είναι ακριβές σε νέα δεδομένα. Παρόλο που ορισμένα μοντέλα μπορεί να αποφύγουν τη δημιουργία ενός εντελώς χωρισμένου συνόλου δοκιμών, αυτό συχνά θεωρείται κοντόφθαλμο, επειδή η έλλειψη πρακτικών δοκιμών μπορεί να αφήσει ένα πρόγραμμα επιρρεπές σε ανακρίβεια.
