Ρομπότ «μαθαίνουν» να ακολουθούν καλύτερα φωνητικές οδηγίες

Τετάρτη, 25 Ιουνίου 2014 15:58
UPD:15:59
Cornell University

Το ρομπότ μπορεί να είναι «εφοδιασμένο» με κώδικα που περιέχει εντολές όπως «βρες», «πιάσε», «μετέφερε», «γέμισε» κλπ. Το λογισμικό του Σαξένα μεταφράζει ανθρώπινες προτάσεις στη «γλώσσα των ρομπότ».

A- A A+

Τα ρομπότ μπορεί να γίνονται όλο και πιο έξυπνα, αλλά εξακολουθούν να χρειάζονται οδηγίες για εργασίες τις οποίες δεν έχουν κάνει ξανά, οι οποίες δίνονται μέσω πολύπλοκου κώδικα υπολογιστή. Αυτό σκοπεύουν να αλλάξουν ερευνητές του Cornell University, οι οποίοι επιδιώκουν την παροχή οδηγιών σε ρομπότ μέσω συζήτησης με ανθρώπους σε απλή γλώσσα- όπως θα δίνονταν οδηγίες σε ένα παιδί.

Στο Robot Learning Lab ο Ασουτός Σαξένα, επίκουρος καθηγητής επιστήμης υπολογιστών, διδάσκει σε ρομπότ πώς να κατανοούν οδηγίες σε φυσική γλώσσα από διάφορους ομιλητές, να αναπληρώνουν τα κενά πληροφοριών και να προσαρμόζονται στο περιβάλλον τους.

Ο Σαξένα και οι φοιτητές Ντιπέντρα Κ. Μίσρα και Τζαεγιόνγκ Σουνγκ θα παρουσιάσουν τις μεθόδους τους στη συνδιάσκεψη Robotics: Science and Systems στο  University of California, Berkeley, στα μέσα στου Ιουλίου.

Το ρομπότ μπορεί να είναι «εφοδιασμένο» με κώδικα που περιέχει εντολές όπως «βρες», «πιάσε», «μετέφερε», «γέμισε» κλπ. Το λογισμικό του Σαξένα μεταφράζει ανθρώπινες προτάσεις στη «γλώσσα των ρομπότ». Ακόμα και αν κάποιο κομμάτι πληροφοριών παραλειφθεί (για παράδειγμα η οδηγία να ανάψει το μάτι της κουζίνας σε μία ακολουθία εντολών για μαγείρεμα φαγητού), το ρομπότ πρέπει να είναι αρκετά έξυπνο για να αντιληφθεί μόνο του το «βήμα» που λείπει.

Το ρομπότ του Σαξένα, εξοπλισμένο με 3-D κάμερα, σαρώνει το περιβάλλον του και αναγνωρίζει τα αντικείμενα που υπάρχουν σε αυτό, χρησιμοποιώντας λογισμικό computer vision που έχει αναπτυχθεί στο εργαστήριο. Το ρομπότ έχει «εκπαιδευτεί» να σχετίζει αντικείμενα με τις «δυνατότητές» τους: ένα σκεύος μπορεί να δεχτεί νερό ή να χύσει νερό, τα μάτια της κουζίνας μπορούν να δεχθούν πάνω τους αντικείμενα και να τα θερμάνουν κ.ο.κ. Οπότε το ρομπότ μπορεί να  αναγνωρίσει το σκεύος, να δει μία βρύση και ένα μάτι κουζίνας και να συσχετίσει αυτές τις πληροφορίες. Αν του πει κάποιος να «ζεστάνει νερό» μπορεί να προβεί στις κατάλληλες ενέργειες, και να κάνει το ίδιο και την επόμενη ημέρα, ακόμα και αν έχουν σημειωθεί μεταβολές στο περιβάλλον του.

Η ομάδα του Σαξένα χρησιμοποιεί τεχνικές machine learning με στόχο την «εκπαίδευση» του εγκεφάλου του ρομπότ έτσι ώστε να συσχετίζει εντολές με πιο «ευέλικτα/ ευρέως» καθορισμένες ενέργειες. Στον υπολογιστή δίνονται animated βίντεο της πράξης, που έχουν δημιουργηθεί από ανθρώπους μέσω διαδικασιών αντίστοιχων αυτών που παρατηρούνται στα ηλεκτρονικά παιχνίδια, με τη συνοδεία ηχογραφημένων φωνητικών εντολών από μία ποικιλία ομιλητών. Ο υπολογιστής αποθηκεύει τους συνδυασμούς αυτούς έτσι ώστε όταν «ακούει» κάτι ανάλογο με κάτι που έχει ακούσει στο παρελθόν να μπορεί να κάνει τον αντίστοιχο παραλληλισμό.  

Φυσικά, το ρομπότ δεν καταφέρνει να προβεί στις σωστές ενέργειες πάντοτε, ωστόσο το ποσοστό επιτυχίας του ανέρχεται στο 64% των περιπτώσεων, κάτι που συνιστά μεγάλη βελτίωση σε σχέση με προηγούμενες μεθόδους.

Προτεινόμενα για εσάς