Ερ:
Πώς μπορούν οι νέες δυνατότητες εκμάθησης μηχανών να επιτρέψουν την εξόρυξη αποθεμάτων για οικονομικά δεδομένα;
ΕΝΑ:Ένα από τα συναρπαστικά νέα σύνορα της μηχανικής μάθησης και της AI είναι ότι οι επιστήμονες και οι μηχανικοί ξεκινούν με διάφορους τρόπους να χρησιμοποιούν εντελώς νέους τύπους πόρων για να προβλέψουν την κίνηση των αποθεμάτων και τα αποτελέσματα των επενδύσεων. Πρόκειται για ένα τεράστιο παιχνίδι αλλαγής στον χρηματοπιστωτικό κόσμο και θα φέρει επανάσταση στις επενδυτικές στρατηγικές με πολύ βαθύ τρόπο.
Μια από τις βασικές ιδέες για την επέκταση αυτού του τύπου έρευνας αποθεμάτων είναι η υπολογιστική γλωσσολογία, η οποία περιλαμβάνει τη μοντελοποίηση της φυσικής γλώσσας. Οι εμπειρογνώμονες διερευνούν τον τρόπο με τον οποίο μπορούν να χρησιμοποιηθούν έγγραφα κειμένου, από καταθέσεις SEC σε επιστολές μετόχων σε άλλους περιφερειακούς πόρους που βασίζονται σε κείμενο, προκειμένου να αυξήσουν ή να τελειοποιήσουν την ανάλυσή τους ή να αναπτύξουν εντελώς νέες αναλύσεις.
Δωρεάν Λήψη: Μηχανική Μάθηση και γιατί έχει σημασία |
Η σημαντική αποκήρυξη είναι ότι όλα αυτά γίνονται εφικτά μόνο μέσω ολοκαίνουργιας προόδου στα νευρωνικά δίκτυα, της μηχανικής μάθησης και της ανάλυσης φυσικών γλωσσών. Πριν από την έλευση του ML / AI, οι τεχνολογίες πληροφορικής χρησιμοποίησαν ως επί το πλείστον γραμμικό προγραμματισμό για να "διαβάσουν" εισόδους. Τα έγγραφα κειμένου ήταν υπερβολικά αδόμητα για να είναι χρήσιμα. Όμως, με την πρόοδο που έγινε στην ανάλυση φυσικών γλωσσών τα τελευταία χρόνια, οι επιστήμονες διαπιστώνουν ότι είναι δυνατόν να "εξορύξουμε" τη φυσική γλώσσα για ποσοτικά αποτελέσματα ή, με άλλα λόγια, αποτελέσματα που μπορούν να υπολογιστούν με κάποιο τρόπο.
Μερικά από τα καλύτερα στοιχεία και τα πιο χρήσιμα παραδείγματα προέρχονται από διάφορες διατριβές και διδακτορικές διατριβές διαθέσιμες στο διαδίκτυο. Σε μια εργασία "Εφαρμογές Μηχανικής Μάθησης και Υπολογιστικής Γλωσσολογίας στη Χρηματοοικονομική Οικονομία", που δημοσιεύθηκε τον Απρίλιο του 2016, ο Lili Gao εξηγεί τις σχετικές διαδικασίες που σχετίζονται με την εξόρυξη των εταιρικών αιτήσεων SEC, κλήσεων μετόχων και μηνυμάτων κοινωνικών μέσων.
"Η εξαγωγή σημαντικών σημάτων από μη δομημένα και υψηλής διαστάσεων δεδομένα κειμένου δεν είναι εύκολο έργο", γράφει ο Γκάο. "Ωστόσο, με την ανάπτυξη της μηχανικής μάθησης και των υπολογιστικών γλωσσικών τεχνικών, η επεξεργασία και στατιστική ανάλυση κειμένων εγγράφων μπορεί να επιτευχθεί και πολλές εφαρμογές της στατιστικής ανάλυσης κειμένων στις κοινωνικές επιστήμες έχουν αποδειχθεί επιτυχείς». Από τη συζήτηση του Gao σχετικά με τη μοντελοποίηση και τη βαθμονόμηση σε αφηρημένη βάση, ολόκληρο το αναπτυγμένο έγγραφο δείχνει πως ορισμένες από αυτές τις αναλύσεις δουλεύουν λεπτομερώς.
Άλλες πηγές για ενεργά έργα περιλαμβάνουν σελίδες όπως αυτή η σύντομη περιγραφή του έργου GitHub και αυτός ο πόρος IEEE μιλά ειδικά για την απόκτηση πολύτιμων οικονομικών πληροφοριών από την "ανάλυση του sentiment Twitter".
Η κατώτατη γραμμή είναι ότι η χρήση αυτών των νέων μοντέλων NLP οδηγεί σε γρήγορη καινοτομία στη χρήση όλων των ειδών κειμένων, όχι μόνο για οικονομική ανάλυση, αλλά και για άλλα είδη ανακαλύψεων αιχμής, θολώντας αυτή την παραδοσιακά καθιερωμένη γραμμή μεταξύ "γλώσσας" και "δεδομένα."