Επιστήμονες του Oxford University ανέπτυξαν ένα σύστημα τεχνητής νοημοσύνης που μπορεί να διαβάζει τα χείλη καλύτερα από τους ανθρώπους.
Σύμφωνα με το BBC, το εν λόγω σύστημα, ονόματι LipNet, παρακολουθεί το βίντεο κάποιου που μιλά και προβαίνει σε αντιστοίχιση κειμένου με την κίνηση του στόματος με ακρίβεια της τάξης του 93%, αναφέρουν οι ερευνητές, που υποστηρίζουν πως η αυτοματοποίηση της διαδικασίας θα μπορούσε να βοηθήσει εκατομμύρια ανθρώπους.
Η ανάγνωση των χειλιών είναι δύσκολη υπόθεση, με τους επαγγελματίες του αντικειμένου να είναι ικανοί να ερμηνεύουν σωστά μόνο στο 60% των περιπτώσεων. «Οι μηχανικοί αναγνώστες χειλιών έχουν μεγάλες δυνατότητες, με εφαρμογές σε εφαρμογές σε βελτιωμένα βοηθήματα ακοής, σιωπηλή υπαγόρευση σε δημόσιους χώρους, “συγκαλυμμένες” συζητήσεις, αναγνώριση ομιλίας σε θορυβώδη περιβάλλοντα, βιομετρική ταυτοποίηση κ.ά.» αναφέρουν οι ερευνητές.
Όπως είπαν, το σύστημα τεχνητής νοημοσύνης έλαβε πλήρεις προτάσεις, έτσι ώστε να μπορεί να εκπαιδευτεί από μόνο του στο ποιο γράμμα αντιστοιχεί σε ποια κίνηση χειλιών. Για την εκπαίδευση της τεχνητής νοημοσύνης, η ομάδα του εργαστηρίου τεχνητής νοημοσύνης του πανεπιστημίου, του παρείχαν περίπου 29.000 βίντεο, τα οποία συνοδεύονταν από το σχετικό κείμενο. Κάθε βίντεο είχε προτάσεις τριών δευτερολέπτων, και ακολουθήσει παρόμοιο μοτίβο γραμματικής. Τη στιγμή που οι άνθρωποι- testers, σε αντίστοιχα βίντεο, είχαν ποσοστό λάθους 47,7%, η τεχνητή νοημοσύνη είχε μόλις 6,6%.
Το project χρηματοδοτήθηκε εν μέρει από την DeepMind της Google.