Πρόγραμμα που μαθαίνει μόνο του «τα πάντα για τα πάντα»

Τετάρτη, 18 Ιουνίου 2014 16:26
UPD:16:26
University of Washington/LEVAN

To όνομα του προγράμματος είναι LEVAN (Learning Everything About Anything), και αναζητεί σε εκατομμύρια πηγές και φωτογραφίες στο Web για να «μάθει» όλες τις πιθανές εκδοχές μίας έννοιας. Στη συνέχεια παρουσιάζει στους χρήστες τα αποτελέσματα ως μία αναλυτική λίστα εικόνων, βοηθώντας στην γρήγορη και λεπτομερή κατανόηση διαφόρων θεμάτων.

A- A A+

Το πρώτο πλήρως αυτοματοποιημένο πρόγραμμα υπολογιστή το οποίο διδάσκει μόνο του στον εαυτό του όλα όσα πρέπει να γνωρίζει για οποιαδήποτε οπτική έννοια δημιούργησαν ερευνητές του University of Washington (UW) και του Allen Institute for Artificial Intelligence.

To όνομα του προγράμματος είναι LEVAN (Learning Everything About Anything), και αναζητεί σε εκατομμύρια πηγές και φωτογραφίες στο Web για να «μάθει» όλες τις πιθανές εκδοχές μίας έννοιας. Στη συνέχεια παρουσιάζει στους χρήστες τα αποτελέσματα ως μία αναλυτική λίστα εικόνων, βοηθώντας στην γρήγορη και λεπτομερή κατανόηση διαφόρων θεμάτων.

«Όλη η υπόθεση είναι ο εντοπισμός συσχετισμών μεταξύ οπτικών δεδομένων και δεδομένων σε κείμενο» αναφέρει ο Άλι Φαράντι, επίκουρος καθηγητής επιστήμης υπολογιστών του University of Washington. «Το πρόγραμμα μαθαίνει να συνδυάζει πλούσια σετ φράσεων με πίξελ σε εικόνες. Αυτό σημαίνει ότι μπορεί να αναγνωρίζει περιπτώσεις συγκεκριμένων νοημάτων όταν τα βλέπει».

Η ομάδα θα παρουσιάσει το project και ένα σχετικό paper μέσα στο μήνα στη συνδιάσκεψη Computer Vision and Pattern Recognition στο Κολόμπους του Οχάιο. Το πρόγραμμα μαθαίνει ποιοι όροι είναι σχετικοί «κοιτώντας» στο περιεχόμενο των εικόνων που βρίσκει στο Web και εντοπίζοντας χαρακτηριστικά «μοτίβα» μέσω της χρήσης αλγορίθμων αναγνώρισης αντικειμένων. Διαφέρει από τις online «βιβλιοθήκες» εικόνων επειδή αντλεί από ένα μεγάλο σετ φράσεων προκειμένου να κατανοήσει και να καταδείξει φωτογραφίες βάσει του περιεχομένου και της διάταξης των pixels- όχι μόνο από λέξεις σε λεζάντες.

Οι χρήστες μπορούν να περιηγηθούν στην υπάρχουσα «βιβλιοθήκη», όπου υπάρχουν περίπου 175 έννοιες, από «αερογραμμές» και «παράθυρα» μέχρι «όμορφο», «λαμπερό», «καρκίνος», «καινοτομία», «ρομπότ», «άλογο» κ.α.

LEVAN

Mία αναζήτηση για «σκύλο» (dog) θα εμφανίσει φωτογραφίες από υποκατηγορίες όπως  «chihuahua dog», «black dog», «swimming dog» κ.α., καθώς και «dog nose», «sad dog» κλπ.

Εάν η ζητούμενη έννοια δεν υπάρχει, ο ενδιαφερόμενος μπορεί να υποβάλει έναν όρο αναζήτησης και το πρόγραμμα θα αρχίσει αυτόματα να δημιουργεί μία εκτενή λίστα εικόνων που μπορεί να σχετίζονται με αυτήν. Για παράδειγμα, μία αναζήτηση για «σκύλο» (dog) θα εμφανίσει φωτογραφίες από υποκατηγορίες όπως  «chihuahua dog», «black dog», «swimming dog» κ.α., καθώς και «dog nose», «sad dog» κλπ.  

Στην «καρδιά» της τεχνικής αυτής βρίσκεται η αναζήτηση σε κείμενα από εκατομμύρια βιβλία γραμμένα στην αγγλική γλώσσα τα οποία είναι διαθέσιμα στο Google Books, όπου το πρόγραμμα αναζητεί κάθε περίπτωση όπου συναντάται η αναζητούμενη έννοια. Στη συνέχεια ο αλγόριθμος προχωρά σε φιλτράρισμα, αφήνοντας έξω λέξεις που δεν έχουν «οπτικό» χαρακτήρα- για παράδειγμα, στο «άλογο» (horse) θα κρατήσει φράσεις όπως «jumping horse», αλλά θα αφήσει έξω φράσεις όπως «my horse» και «last horse». Όταν βρει τις φράσεις που είναι σχετικές, κάνει μία αναζήτηση εικόνων στο Ίντερνετ, αναζητώντας ομοιομορφία σε αυτές που βρίσκει και μετά «αναγνωρίζει» όλες τις εικόνες που σχετίζονται με τη ζητούμενη φράση.

«Μεγάλες πηγές πληροφοριών όπως τα λεξικά και οι εγκυκλοπαίδειες κινούνται προς την κατεύθυνση της παρουσίασης οπτικών πληροφοριών στους χρήστες επειδή είναι ευκολότερη η κατανόηση και η πλοήγηση μέσα σε έννοιες. Ωστόσο, έχουν περιορισμένες δυνατότητες ʽκάλυψηςʼ καθώς πολύ συχνά η τακτοποίηση/ διαχείρισή τους γίνεται χειροκίνητα. Το νέο πρόγραμμα δεν χρειάζεται ανθρώπινη επίβλεψη και έτσι μπορεί να μάθει αυτόματα το οπτικό περιεχόμενο κάθε έννοιας» αναφέρει ο Σαντός Ντιβάλα, του Allen Institute for Artificial Intelligence.

Το πρόγραμμα ξεκίνησε τη λειτουργία του τον Μάρτιο. Προς το παρόν η ταχύτητά με την οποία «μαθαίνει» για μια έννοια περιορίζεται λόγω της διαθέσιμης υπολογιστικής ισχύος που απαιτείται για κάθε αναζήτηση (χρειάζονται μέχρι και 12 ώρες για κάποιες ευρείες έννοιες). Οι ερευνητές εργάζονται πάνω στην αύξηση των δυνατοτήτων και της ταχύτητας επεξεργασίας, ενώ ευελπιστούν στη χρήση του προγράμματος ως εκπαιδευτικού εργαλείου και «τράπεζας» πληροφοριών για επιστήμονες που δουλεύουν πάνω στον τομέα του computer vision.

Η έρευνα χρηματοδοτήθηκε από το  U.S. Office of Naval Research, το National Science Foundation και το UW.

Προτεινόμενα για εσάς