Η «εκμάθηση» της κοινής λογικής μέσω της συνεχούς ανάλυσης εικόνων από το Ίντερνετ, 24 ώρες την ημέρα, βρίσκεται στο επίκεντρο του προγράμματος NEIL (Never Ending Image Learner), του Πανεπιστημίου Κάρνεγκι Μέλον στις ΗΠΑ.
Ο στόχος είναι να διαπιστωθεί εάν ένας υπολογιστής είναι σε θέση να μάθει, όπως θα μάθαινε ένας άνθρωπος, να «συνδέει» μεταξύ τους εικόνες εξάγοντας «συμπεράσματα» και μαθαίνοντας έτσι να κατανοεί καλύτερα το περιβάλλον του.
Το πρόγραμμα χρηματοδοτείται από το αμερικανικό Πεντάγωνο και την Google. Σύμφωνα με δημοσίευμα του ΒΒC, από τον Ιούλιο ο NEIL έχει «κοιτάξει» τρία εκατομμύρια εικόνες. Ως αποτέλεσμα, έχει μπορέσει να αναγνωρίσει 1.500 αντικείμενα μέσα σε μισό εκατομμύριο εικόνες και 1.200 «σκηνές» μεταξύ εκατοντάδων χιλιάδων εικόνων, κάνοντας παράλληλα 2.500 «συνδέσεις».
Η ομάδα που εργάζεται πάνω στο πρόγραμμα ελπίζει ότι o ΝΕΙL θα μάθει τις «σχέσεις» μεταξύ διάφορων αντικειμένων χωρίς να χρειαστεί να τις «διδαχθεί».
Τα προγράμματα υπολογιστή είναι ήδη σε θέση να αναγνωρίζουν και να ταυτοποιούν αντικείμενα μέσω computer vision, ωστόσο οι ερευνητές του NEIL ελπίζουν ότι το πρόγραμμα μπορεί να επιτρέψει περαιτέρω ανάλυση των δεδομένων.
CARNEGIE MELLON UNIVERSITY
«Οι εικόνες είναι ο καλύτερος τρόπος να μάθει κανείς να αντιλαμβάνεται οπτικές ιδιότητες» λέει ο Αμπχινάβ Γκούπτα, του Ινστιτούτου Ρομποτικής του πανεπιστημίου. «Περιλαμβάνουν επίσης πολλές πληροφορίες “κοινής λογικής” για τον κόσμο. Οι άνθρωποι το μαθαίνουν αυτό από μόνοι τους, και, μέσω του NEIL, ελπίζουμε ότι θα αρχίσουν να το κάνουν και οι υπολογιστές».
Παραδείγματα των «συνδέσεων/ συμπερασμάτων» στα οποία προέβη ο ΝΕΙL είναι ότι σε δρόμους μπορεί κανείς να δει αυτοκίνητα και ότι οι πάπιες και ότι οι χήνες μοιάζουν μεταξύ τους.
Ωστόσο, το πρόγραμμα κάνει και λάθη, όπως επισημαίνουν οι ερευνητές, οπότε και, σύμφωνα με τον Αμπχινάβ Σριβαστάβα, διδακτορικό φοιτητή που εργάζεται πάνω στον NEIL, πάντα θα χρειάζονται άνθρωποι στο πλαίσιο της διαδικασίας «εκπαίδευσης».
«Οι άνθρωποι δεν ξέρουν πάντα τι ή πώς να διδάξουν έναν υπολογιστή. Αλλά είναι καλοί στο να λένε στους υπολογιστές πότε κάνουν λάθος» λέει σχετικά.
Ένας άλλος λόγος για τη λειτουργία του NEIL είναι η δημιουργία της μεγαλύτερης βάσης οπτικών δεδομένων στον κόσμο, με μεγάλο όγκο αντικειμένων, σκηνών, δραστηριοτήτων και σχέσεων μεταξύ τους.
«Αυτό που μάθαμε στα τελευταία πέντε με δέκα χρόνια της έρευνας πάνω στο computer vision είναι ότι, όσο περισσότερα στοιχεία έχουμε, τόσο καλύτερο γίνεται» λέει ο Γκούπτα.
Για τη λειτουργία του NEIL απαιτείται τεράστια υπολογιστική ισχύς, και τρέχει σε δύο συγκροτήματα υπολογιστών, με 200 πυρήνες επεξεργαστή.