Το «όνειρο» ενός εξελιγμένου προγράμματος το οποίο θα μπορεί να λάβει υπόψιν και να αναλύσει έναν τεράστιο όγκο δεδομένων και να «προβλέψει» το μέλλον είναι πολύ παλιό, ωστόσο εξακολουθεί να γοητεύει τον κόσμο της τεχνολογίας. Και, χάρη στη δουλειά της Microsoft και του ισραηλινού Technion-Israel Institute of Technology, ίσως να βρίσκεται ένα βήμα πιο κοντά.
Σύμφωνα με δημοσίευμα του MIT Technology Review, το λογισμικό αυτό είναι σε θέση να προβλέπει επιδημίες ασθενειών βασιζόμενο στα δημοσιεύματα δύο δεκαετιών των New York Times, καθώς και άλλα δεδομένα που βρίσκονται online. Το πρόγραμμα θα μπορούσε να βοηθήσει σημαντικά στην αντιμετώπιση επιδημιών και άλλων παρεμφερών καταστάσεων, σύμφωνα με τον Έρικ Χόρβιτς, στέλεχος της Microsoft Research- και ο ίδιος θεωρεί πως πρόκειται απλά για μία «γεύση» του τι επιφυλάσσει το μέλλον, καθώς κάποια στιγμή θα μπορεί να επηρεάζει το «πώς εξελίσσονται τα πράγματα για τους ανθρώπους».
Ο Χόρβιτς συνεργάστηκε για τους σκοπούς του προγράμματος με την Κίρα Ραντίνσκι, του ισραηλινού ινστιτούτου. Το σύστημα βασίζεται στη μελέτη ιστορικών δεδομένων: για παράδειγμα, αναφορές περιόδων ξηρασίας στην Αγκόλα το 2006 είχαν ως αποτέλεσμα προειδοποίηση για πιθανή επιδημία χολέρας, καθώς το σύστημα «γνωρίζει», βάσει του παρελθόντος, ότι οι επιδημίες χολέρας είναι πολύ πιθανές σε μία περιοχή όταν έχει προηγηθεί ξηρασία.
Σε μία δεύτερη προειδοποίηση, πάλι σχετικά με επιδημία χολέρας στην Αγκόλα, το γεγονός στο οποίο βασίστηκε το σύστημα ήταν μία σειρά από μεγάλες καταιγίδες στην Αφρική στις αρχές το 2007: μερικές ημέρες μετά, υπήρξαν αναφορές για ξέσπασμα επιδημίας χολέρας στην περιοχή. Αντίστοιχα, έχουν γίνει προβλέψεις ξεσπασμάτων βίας και θανάτων, με ποσοστό επιτυχίας που κυμαίνεται μεταξύ 70 και 90%.
Κατά τον Χόρβιτς, το ποσοστό είναι αρκετά υψηλό για να ενθαρρύνει περαιτέρω έρευνες πάνω στο χώρο. Συστήματα τέτοιου είδους θα μπορούσαν να προσφέρουν σημαντική βοήθεια σε υπηρεσίες που έχουν να κάνουν με την αντιμετώπιση περιστατικών έκτακτης ανάγκης, καθώς θα ενημέρωναν για περιόδους οι οποίες χρήζουν αυξημένης ετοιμότητας.
Κατά τον Χόρβιτς, η ιστορία κάνει κύκλους: όσα και αν άλλαξαν στον κόσμο τις τελευταίες δεκαετίες, η ανθρώπινη φύση και οι γενικές αρχές του περιβάλλοντος παραμένουν ίδιες, οπότε και μπορεί να είναι δυνατόν για ένα πρόγραμμα να αντιλαμβάνεται «μοτίβα» που παρατηρήθηκαν στο παρελθόν, χάρη στη μελέτη αρχείων, και να κάνει προβλέψεις για το μέλλον βάσει αυτών. Ο ίδιος δηλώνει ότι θα ήθελε να προσθέσει στη «δεξαμενή» πληροφοριών αρχεία που πάνε ακόμα πιο πίσω στο χρόνο.
Το σύστημα αντλεί τις πληροφορίες του από υλικό 22 ετών (1986-2007) από τα αρχεία των Νew York Τimes, καθώς και από το Web. Μία πηγή την οποία η Ραντίνσκι χαρακτήρισε ως εξαιρετικά χρήσιμη ήταν η DBpedia, που ουσιαστικά αποτελεί μία οργανωμένη δομή των πληροφοριών της Wikipedia, που έχει αναπτυχθεί μέσω crowdsourcing. Άλλες πολύτιμες πηγές είναι το WordNet (έχει να κάνει με τις ερμηνείες λέξεων) και το OpenCyc (μία βάση δεδομένων «κοινής γνώσης).
Το σύνολο των πληροφοριών αυτών επιτρέπει την εξαγωγή γενικών συμπερασμάτων περί συνθηκών που έπονται γεγονότων: το σύστημα μπορεί να «δει» συνδέσεις μεταξύ γεγονότων υπό συγκεκριμένες συνθήκες σε κάποιες χώρες, και στη συνέχεια να εκτιμήσει ότι αντίστοιχα γεγονότα θα συμβούν και σε χώρες με επαρκή κοινά χαρακτηριστικά/δεδομένα, οι οποίες βιώνουν παρόμοιες συνθήκες.
Παρόμοια προγράμματα έχουν υπάρξει και στο παρελθόν (το Project Web Bot ήταν ένα από τα πιο γνωστά), ενώ στον τομέα δραστηριοποιούνται και φιλόδοξες startups όπως η Recorded Future, η οποία συνεργάζεται και με κρατικές υπηρεσίες πληροφοριών, που κάνει προβλέψεις διερευνώντας online ανακοινώσεις- προαναγγελίες.