Ερ:
Ποιες είναι οι τέσσερις βάσεις για να γίνεις καλός επιστήμονας δεδομένων;
ΕΝΑ:Όπως επισημαίνουν πολλοί ειδικοί, η μετατροπή σε έναν σπουδαίο επιστήμονα δεδομένων απαιτεί ένα συνδυασμό δεξιοτήτων και εμπειριών που θα αποκτηθούν μέσω της αφοσίωσης και της ανάλυσης ενός πολύπλοκου πεδίου. Οι επιστήμονες δεδομένων ως διαχειριστές και επιμελητές πολύτιμων στοιχείων δεδομένων είναι σήμερα πολύ απαιτητικοί. Ας δούμε τι ενέχουν ορισμένες από αυτές τις θεμελιώδεις δεξιότητες.
Η πρώτη από τις τέσσερις βασικές συνιστώσες της εργασίας των επιστημόνων δεδομένων είναι τα μαθηματικά και οι στατιστικές. Οι καλοί επιστήμονες δεδομένων θα πρέπει να μάθουν να είναι κατανοητοί σε διάφορες μαθηματικές έννοιες που σχετίζονται με την εποπτευόμενη και ανεξέλεγκτη μηχανική μάθηση, συμπεριλαμβανομένων των τύπων αλγορίθμων όπως τα δέντρα αποφάσεων, τυχαία δάση, υλικοτεχνική παλινδρόμηση, ομαδοποίηση και χρήση διαστάσεων στη μηχανική μάθηση. Σε γενικές γραμμές, θα πρέπει να έχουν μια καλή λαβή για τη συνεργασία με μαθηματικές εξισώσεις και στατιστικές χρησιμοποιώντας πόρους στατιστικής ανάλυσης.
Η δεύτερη σημαντική βασική συνιστώσα της εργασίας της επιστήμης των δεδομένων περιλαμβάνει τον προγραμματισμό και τη διαχείριση της βάσης δεδομένων. Τα άτομα θα πρέπει να είναι ισχυρά σε γλώσσες δέσμης ενεργειών όπως η Python και στατιστικές γλώσσες όπως το R, μαζί με την εμπειρία και τις δεξιότητες με τη βάση δεδομένων και τη σημασιολογία SQL και λειτουργικές τεχνικές. Η γνώση των εξαρτημάτων λογισμικού όπως το Hadoop, MapReduce, Hive and Pig είναι επίσης ελκυστική για τους εργοδότες.
Η τρίτη θεμελιώδης συνιστώσα του να γίνει ένας καλός επιστήμονας δεδομένων είναι το θεωρητικό και φιλοσοφικό στοιχείο της κατανόησης της επιστήμης των δεδομένων και της μηχανικής μάθησης. Αυτά τα άτομα θα πρέπει να είναι αυτοαπασχολούμενοι επίλυση προβλημάτων με περίεργα μυαλά - τελικά, συνδυάζουν την ακατέργαστη ποσοτική ανάλυση με τη δημιουργική κατανόηση της μηχανικής μάθησης και των διαδικασιών επιστήμης δεδομένων. Αντί να είναι απλώς τεχνικοί αριθμοί άνθρωποι, θα πρέπει να έχουν μια βαθιά γείωση σε αυτό που σημαίνει να δημιουργήσουν προγράμματα μάθησης μηχανών και να εργαστούν σε πρωτοβουλίες επιστήμης των δεδομένων από την άποψη των τελικών στόχων και των τελικών αποτελεσμάτων.
Ένας τέταρτος βασικός πυλώνας της εκμάθησης της ύπαρξης καλών επιστημόνων δεδομένων είναι η συνεργασία με τους ανθρώπους και η δυνατότητα χρήσης δεδομένων με τρόπους που έχουν νόημα σε άλλους ανθρώπους.
Οι καλές επιστήμονες δεδομένων μπορούν να είναι αφηγητές - μπορούν να μεταφέρουν ποσοτικά δεδομένα σε αφηγήσεις και ιδέες. Ως εκ τούτου, θα πρέπει να διαθέτουν καλές δεξιότητες επικοινωνίας, ώστε να μπορούν να φέρουν το έργο τους στο τραπέζι και να το διαδίδουν αποτελεσματικά σε πολλούς ενδιαφερόμενους ή σε ένα συγκεκριμένο κοινό. Αυτά είναι μερικά από τα βασικά είδη δεξιοτήτων που δημιουργούν έναν καλό επιστήμονα δεδομένων, ο οποίος είναι έτοιμος να συμμετάσχει στη σημερινή ταχέως αναπτυσσόμενη και ταχέως αναπτυσσόμενη βιομηχανία πληροφορικής.