Σπίτι Βάσεις δεδομένων Χρήση αλγορίθμων για την πρόβλεψη των εκλογών: μια συζήτηση με την έλξη linzer

Χρήση αλγορίθμων για την πρόβλεψη των εκλογών: μια συζήτηση με την έλξη linzer

Anonim

Ο Drew θα παρουσιάσει στη Σύνοδο Κορυφής για την Καινοτομία Μεγάλης Πληροφορίας στις 30 και 31 Ιανουαρίου στο Λας Βέγκας: http://analytics.theiegroup.com/bigdata-lasvegas, μαζί με ομιλητές του Ομπάμα για την Αμερική, Best Buy, LinkedIn, The New York Times, Nokia, Bitly, Barnes & Nobles, Walmart Labs και πολλά άλλα.


Σύνδεσμος εγγραφής: http://bit.ly/Zs3wms


Αυτή η συνέντευξη διενεργήθηκε από τον George Hill και δημοσιεύτηκε στο περιοδικό Big Data Innovation Magazine.


Τι είδους αντίδραση έχει υπάρξει στις προβλέψεις σας;


Το μεγαλύτερο μέρος της αντίδρασης επικεντρώθηκε στη διαφορά στην ακρίβεια ανάμεσα σε όσους μελέτησαν τις δημοσκοπήσεις και στις προβλέψεις των «λαϊκών συναισθημάτων» των λαϊκών ειδικών και των σχολιαστών. Στην εκλογική ημέρα, οι αναλυτές δεδομένων όπως εμένα, ο Nate Silver (blog του New York Times FiveThirtyEight), ο Simon Jackman (Πανεπιστήμιο Stanford και Huffington Post) και ο Sam Wang (Consortium Elections Princeton) 332 εκλογικές ψήφοι για τον Ομπάμα ως το πιο πιθανό αποτέλεσμα. Εν τω μεταξύ, οι ειδήμονες όπως ο Karl Rove, ο Γιώργος Will και ο Steve Forbes δήλωσαν ότι ο Romney επρόκειτο να κερδίσει - και σε ορισμένες περιπτώσεις, εύκολα. Αυτό έχει οδηγήσει σε ομιλία για μια «νίκη για τα quants» την οποία ελπίζω ότι θα μεταφέρει σε μελλοντικές εκλογές.


Πώς αξιολογείτε τον αλγόριθμο που χρησιμοποιείται στις προβλέψεις σας;


Το μοντέλο πρόβλεψής μου υπολόγισε τα αποτελέσματα των κρατικών ψηφοφοριών και την τελική εκλογική ψηφοφορία, κάθε ημέρα της εκστρατείας, ξεκινώντας από τον Ιούνιο. Ήθελα η αξιολόγηση αυτών των προβλέψεων να είναι όσο το δυνατόν πιο δίκαιη και αντικειμενική - και να μην με αφήνουν κανένα δωμάτιο κουνώντας αν έκαναν λάθος. Λοιπόν, περίπου έναν μήνα πριν από τις εκλογές, δημοσίευσα στον ιστότοπό μου ένα σύνολο οκτώ κριτηρίων αξιολόγησης που θα χρησιμοποιούσα όταν τα αποτελέσματα ήταν γνωστά. Όπως αποδείχθηκε, το μοντέλο λειτούργησε τέλεια. Προέβλεψε κατά τη διάρκεια του καλοκαιριού ότι ο Ομπάμα θα κερδίσει όλα τα κράτη του 2008 μείον την Ιντιάνα και τη Βόρεια Καρολίνα και μόλις έπεσε από αυτήν την πρόβλεψη, ακόμη και μετά την υποστήριξη του Ομπάμα που σημείωσε άνοδο το Σεπτέμβριο, έπειτα βυθίστηκε μετά την πρώτη προεδρική συζήτηση.


Το μέγεθος των δεδομένων που χρησιμοποιήθηκαν καθ 'όλη τη διάρκεια αυτής της εκστρατείας τόσο από ανεξάρτητους αναλυτές όσο και από ομάδες καμπάνιας ήταν τεράστιο, τι είδους συνέπειες έχει αυτό για τη χρήση δεδομένων το 2016;


Η εκστρατεία του 2012 απέδειξε ότι πολλές, ποικίλες πηγές ποσοτικών πληροφοριών θα μπορούσαν να διαχειρίζονται, να εμπιστεύονται και να εφαρμόζονται επιτυχώς προς διάφορους σκοπούς. Εμείς οι ξένοι μπορούσαμε να προβλέψουμε το αποτέλεσμα των εκλογών πολύ νωρίτερα. Μέσα από τις εκστρατείες, έγιναν τεράστια βήματα στην στόχευση των ψηφοφόρων, την παρακολούθηση της γνώμης, τη συγκέντρωση κεφαλαίων και τη συμμετοχή των ψηφοφόρων. Τώρα που γνωρίζουμε ότι αυτές οι μέθοδοι μπορούν να λειτουργήσουν, νομίζω ότι δεν υπάρχει επιστροφή. Αναμένω ότι οι δημοσιογράφοι και οι σχολιαστές της εκστρατείας θα λάβουν πολύ πιο σοβαρά υπόψη το σύνολο των ερευνών το 2016. Και παρόλο που ο Ομπάμα και οι Δημοκρατικοί φαίνεται να κατέχουν σήμερα ένα πλεονέκτημα στην τεχνολογία των εκστρατειών, θα εκπλαγούσαμε αν οι Ρεπουμπλικάνοι δεν προλάβαιναν γρήγορα.


Πιστεύετε ότι η επιτυχία αυτής της καμπάνιας που βασίζεται σε δεδομένα σήμανε ότι οι διαχειριστές καμπάνιας πρέπει τώρα να είναι αναλυτές καθώς και στρατηγικοί;


Οι διαχειριστές καμπάνιας ίσως να μην χρειάζεται να είναι οι ίδιοι οι αναλυτές, αλλά θα πρέπει να έχουν μεγαλύτερη εκτίμηση για το πώς τα δεδομένα και η τεχνολογία μπορούν να αξιοποιηθούν προς όφελός τους. Οι εκστρατείες χρησιμοποίησαν πάντα έρευνα έρευνας για να διατυπώσουν στρατηγική και να μετρήσουν τα αισθήματα των ψηφοφόρων. Αλλά τώρα υπάρχει μια σειρά από άλλα ισχυρά εργαλεία διαθέσιμα: ιστοσελίδες κοινωνικής δικτύωσης, βάσεις δεδομένων ψηφοφόρων, κινητά smartphones, και μάρκετινγκ ηλεκτρονικού ταχυδρομείου, για να αναφέρουμε μόνο μερικά. Και αυτό είναι παράλληλα με τις πρόσφατες εξελίξεις στις μεθοδολογίες δημοσκοπήσεων και τη μοντελοποίηση της στατιστικής γνώμης. Υπάρχει πολλή καινοτομία που συμβαίνει στην αμερικανική πολιτική εκστρατείας αυτή τη στιγμή.


Μπορείτε να προβλέψετε τα αποτελέσματα των εκλογών 6 μήνες πριν, τι πιστεύετε ότι είναι το ρεαλιστικό μέγιστο χρονικό πλαίσιο για την ακριβή πρόβλεψη ενός αποτελέσματος χρησιμοποιώντας τις τεχνικές ανάλυσης;


Περίπου τέσσερις ή πέντε μήνες είναι περίπου όπως η επιστήμη μας αφήνει να πάμε αυτή τη στιγμή? και αυτό το πιέζει ακόμη και λίγο. Πριν από αυτό, οι δημοσκοπήσεις δεν είναι επαρκώς ενημερωτικές σχετικά με το τελικό αποτέλεσμα: πάρα πολλοί άνθρωποι είτε δεν έχουν αποφασίσει είτε δεν έχουν αρχίσει να δίνουν προσοχή στην εκστρατεία. Οι ιστορικοί οικονομικοί και πολιτικοί παράγοντες που έχουν αποδειχθεί ότι συσχετίζονται με τα αποτελέσματα των εκλογών αρχίζουν επίσης να χάνουν την προγνωστική τους δύναμη όταν ξεπεράσουμε το εύρος των 4-5 μηνών περίπου. Ευτυχώς, αυτό εξακολουθεί να δίνει στις εκστρατείες αρκετό χρόνο για να σχεδιάσουν στρατηγική και να λάβουν αποφάσεις σχετικά με τον τρόπο διάθεσης των πόρων τους.

Χρήση αλγορίθμων για την πρόβλεψη των εκλογών: μια συζήτηση με την έλξη linzer