Ερ:
Γιατί είναι σημαντικό για τους επιστήμονες δεδομένων να επιδιώξουν τη διαφάνεια;
ΕΝΑ:Η διαφάνεια είναι ουσιαστικά σημαντική στα προγράμματα επιστήμης των δεδομένων και στα προγράμματα μηχανικής μάθησης, εν μέρει λόγω της πολυπλοκότητας και της πολυπλοκότητας που τα οδηγεί - επειδή τα προγράμματα αυτά "μαθαίνουν" (δημιουργώντας πιθανοτικά αποτελέσματα) παρά ακολουθώντας προκαθορισμένες οδηγίες γραμμικού προγραμματισμού και επειδή ως αποτέλεσμα, μπορεί να είναι δύσκολο να καταλάβουμε πώς η τεχνολογία καταλήγει σε συμπεράσματα. Το πρόβλημα "μαύρου κουτιού" των αλγορίθμων μηχανικής μάθησης που δεν μπορούν να εξηγηθούν πλήρως στους υπεύθυνους λήψης αποφάσεων στον άνθρωπο είναι μεγάλο σε αυτόν τον τομέα.
Με αυτό το πνεύμα, η ικανότητα να αποκτήσετε εξειδικευμένη μηχανική μάθηση ή "επεξηγηματικό AI" θα είναι πιθανώς μια κύρια εστίαση στον τρόπο με τον οποίο οι εταιρείες επιδιώκουν την απόκτηση ταλέντων για έναν επιστήμονα δεδομένων. Ήδη το DARPA, το ίδρυμα που μας έφερε στο διαδίκτυο, χρηματοδοτεί μια μελέτη πολλών εκατομμυρίων δολαρίων σε εύχρηστο AI, προσπαθώντας να προωθήσει τις δεξιότητες και τους πόρους που απαιτούνται για τη δημιουργία τεχνολογιών μηχανικής μάθησης και τεχνητής νοημοσύνης που είναι διαφανείς για τον άνθρωπο.
Ένας τρόπος για να το σκεφτεί κανείς είναι ότι συχνά υπάρχει ένα «στάδιο αλφαβητισμού» για την ανάπτυξη ταλέντων και ένα «στάδιο υπερτροφίας». Για έναν επιστήμονα δεδομένων, το παραδοσιακό στάδιο αλφαβητισμού θα ήταν η γνώση του πώς θα μπορούσαμε να φτιάξουμε προγράμματα μηχανικής μάθησης και πώς να οικοδομήσουμε Αλγόριθμοι με γλώσσες όπως η Python. πώς να κατασκευάσετε νευρωνικά δίκτυα και να εργαστείτε μαζί τους. Το στάδιο της υπερκειμενικότητας θα είναι η ικανότητα κύριου επεξηγηματικού AI, η παροχή διαφάνειας στη χρήση αλγορίθμων μηχανικής μάθησης και η διαφύλαξη της διαφάνειας καθώς αυτά τα προγράμματα λειτουργούν προς την κατεύθυνση των στόχων και των στόχων των χειριστών τους.
Ένας άλλος τρόπος για να εξηγήσουμε τη σημασία της διαφάνειας στην επιστήμη των δεδομένων είναι ότι τα σύνολα δεδομένων που χρησιμοποιούνται εξακολουθούν να γίνονται όλο και πιο περίπλοκα και επομένως πιθανότερο να εισβάλλουν στη ζωή των ανθρώπων. Ένας άλλος σημαντικός μοχλός εξηγησιμότητας της εκμάθησης μηχανών και της επιστήμης των δεδομένων είναι ο ευρωπαϊκός κανονισμός για την γενική προστασία δεδομένων που εφαρμόστηκε πρόσφατα για την καταπολέμηση της ανήθικης χρήσης προσωπικών δεδομένων. Χρησιμοποιώντας το GDPR ως δοκιμαστική περίπτωση, οι ειδικοί μπορούν να δουν πώς η ανάγκη εξήγησης των έργων επιστήμης δεδομένων ταιριάζει στις ανησυχίες για την προστασία της ιδιωτικής ζωής και της ασφάλειας, καθώς και στην επιχειρησιακή ηθική.