Η ανθρώπινη διαίσθηση γενικά θεωρείται κάτι το οποίο οι μηχανές δεν θα μπορούσαν ποτέ να αντιγράψουν, ωστόσο αυτό ίσως τελικά να μην ισχύει: Ερευνητές του MIT σκοπεύουν να βγάλουν το ανθρώπινο στοιχείο από την ανάλυση big data μέσω ενός νέου συστήματος το οποίο όχι μόνο αναζητεί μοτίβα σε άγνωστα δεδομένα με σκοπό την πρόγνωση, αλλά σχεδιάζει μόνο του και το επιθυμητό σετ χαρακτηριστικών για την απαιτούμενη διαδικασία.
Για σκοπούς δοκιμών του πρώτου πρωτοτύπου, έγιναν τρεις διαγωνισμοί data science, στους οποίους είχε να ανταγωνιστεί ανθρώπινες ομάδες, με κοινό σκοπό την εύρεση μοτίβων πρόβλεψης σε άγνωστα σετ δεδομένων.
Από τις 906 ομάδες που συμμετείχαν συνολικά, το Dara Science Machine κατάφερε να σημειώσει καλύτερες επιδόσεις από τις 615.
Στους δύο εκ των τριών διαγωνισμών, οι προβλέψεις είχαν ακρίβεια της τάξης του 94% και του 96%, ενώ στην τρίτη «μόλις» 87%.
Ωστόσο, δεν μπορεί να παραλειφθεί το ότι οι άνθρωποι συμμετέχοντες δούλευαν πάνω στους αλγορίθμους πρόγνωσής τους για μήνες, ενώ το Data Science Machine χρειάστηκε μεταξύ 2 και 12 ωρών για την αντίστοιχη εργασία.
Κατά τον Μαξ Κάντερ, στη δουλειά του οποίου έχει βασιστεί το σύστημα, το Data Science Machine αποτελεί «βοήθεια» προς την ανθρώπινη νοημοσύνη/ αναλυτική δυνατότητα.
«Υπάρχουν τόσα πολλά δεδομένα προς ανάλυση εκεί έξω, και αυτή τη στιγμή απλά “κάθονται”, χωρίς να αξιοποιούνται. Οπότε ίσως να μπορούμε να σκεφτούμε μια λύση που, τουλάχιστον, θα μας βοηθήσει να αρχίσουμε πάνω στο αντικείμενο, τουλάχιστον να αρχίσουμε να κινούμαστε».
Το σύστημα χρησιμοποιεί μια σειρά από «κόλπα» για να εξομοιώσει την ανθρώπινη διαίσθηση όσον αφορά στον εντοπισμό μοτίβων, όπως την αξιοποίηση της δομής των βάσεων δεδομένων που αναλύει για τη δημιουργία νέων συγκριτικών δεδομένων, κάτι που ακολουθείται από μια σειρά διαφορετικών υπολογισμών προκειμένου να βρεθούν συσχετισμοί.
Επίσης, ιδιαίτερη προσοχή δίνεται σε συγκεκριμένα δεδομένα (όπως ένας μήνας, ένα όνομα ενός brand ή κάτι ανάλογο), προκειμένου να μελετώνται οι σχέσεις μεταξύ των κατηγοριών τους και των νέων συγκριτικών δεδομένων.