Πίνακας περιεχομένων:
Ορισμός - Τι σημαίνει διασταυρούμενη επικύρωση;
Η διασταυρούμενη επικύρωση είναι μια τεχνική που χρησιμοποιείται για την αξιολόγηση της γενίκευσης των αποτελεσμάτων της στατιστικής ανάλυσης σε ένα ανεξάρτητο σύνολο δεδομένων. Η εγκάρσια επικύρωση χρησιμοποιείται σε μεγάλο βαθμό σε ρυθμίσεις όπου ο στόχος είναι πρόβλεψη και είναι απαραίτητο να εκτιμηθεί η ακρίβεια της απόδοσης ενός προγνωστικού μοντέλου. Ο βασικός λόγος για τη χρήση της διασταυρούμενης επικύρωσης και όχι της συμβατικής επικύρωσης είναι ότι δεν υπάρχουν αρκετά διαθέσιμα δεδομένα για την κατανομή τους σε χωριστά σύνολα εκπαίδευσης και δοκιμών (όπως συμβαίνει με τη συμβατική επικύρωση). Αυτό έχει ως αποτέλεσμα την απώλεια της ικανότητας δοκιμής και μοντελοποίησης.
Η εγκάρσια επικύρωση είναι επίσης γνωστή ως εκτίμηση περιστροφής.
Η Techopedia εξηγεί τη Διασταυρούμενη Επικύρωση
Για ένα πρόβλημα πρόβλεψης, ένα μοντέλο είναι γενικά εφοδιασμένο με ένα σύνολο δεδομένων γνωστών δεδομένων, που ονομάζεται σύνολα δεδομένων εκπαίδευσης και ένα σύνολο άγνωστων δεδομένων έναντι των οποίων δοκιμάζεται το μοντέλο, γνωστό ως σύνολο δεδομένων δοκιμών. Ο στόχος είναι να έχουμε ένα σύνολο δεδομένων για τη δοκιμή του μοντέλου στη φάση της κατάρτισης και στη συνέχεια να δώσουμε μια εικόνα για το πώς προσαρμόζεται το συγκεκριμένο μοντέλο σε ένα ανεξάρτητο σύνολο δεδομένων. Ένας κύκλος διασταυρούμενης επικύρωσης περιλαμβάνει το διαχωρισμό των δεδομένων σε συμπληρωματικά υποσύνολα, και στη συνέχεια γίνεται ανάλυση σε ένα υποσύνολο. Μετά από αυτό, η ανάλυση επικυρώνεται σε άλλα υποσύνολα (σύνολα δοκιμών). Για να μειωθεί η μεταβλητότητα, πραγματοποιούνται πολλοί γύροι διασταυρούμενης επικύρωσης χρησιμοποιώντας πολλά διαφορετικά διαμερίσματα και στη συνέχεια λαμβάνεται ένας μέσος όρος των αποτελεσμάτων. Η διασταυρούμενη επικύρωση είναι μια ισχυρή τεχνική στην εκτίμηση της τεχνικής απόδοσης μοντέλου.