Τεχνολογία-Επιστήμη
Δευτέρα, 29 Οκτωβρίου 2018 18:56

Ανιχνευτής ψεύδους για γραπτό κείμενο

Επιστήμονες ανέπτυξαν ένα σύστημα το οποίο είναι σε θέση να «αντιληφθεί» εάν κάποιος έχει υποβάλει ψευδή δήλωση/καταγγελία στην αστυνομία, απλά και μόνο με βάση το κείμενο που περιλαμβάνεται σε αυτήν.

Επιστήμονες ανέπτυξαν ένα σύστημα το οποίο είναι σε θέση να «αντιληφθεί» εάν κάποιος έχει υποβάλει ψευδή δήλωση/καταγγελία στην αστυνομία, απλά και μόνο με βάση το κείμενο που περιλαμβάνεται σε αυτήν.

Χρησιμοποιώντας έναν συνδυασμό αυτόματης ανάλυσης κειμένου και προηγμένων τεχνικών machine learning, το εργαλείο αυτό ήταν σε θέση να αναγνωρίζει επιτυχώς ψευδείς αναφορές ληστειών, με ακρίβεια άνω του 80%. Αυτή τη στιγμή το εργαλείο διατίθεται ανά την Ισπανία, προκειμένου να βοηθά τους αστυνομικούς, υποδεικνύοντας πού απαιτείται περαιτέρω έρευνα.

Γνωστό ως VeriPol, το εργαλείο προορίζεται ειδικά για αναφορές ληστειών. Είναι σε θέση να αναγνωρίζει μοτίβα που είναι σχετικά συχνά σε ψευδείς καταγγελίες, όπως για παράδειγμα το είδος των αντικειμένων που αναφέρεται πως κλάπηκαν, μικρότερες λεπτομέρειες και περιγραφές των δραστών.

Η ομάδα των ερευνητών, που περιλαμβάνει ειδικούς στην επιστήμη υπολογιστών από το Cardiff University και το UC3M (Universidad Carlos III de Madrid), θεωρεί πως το εργαλείο αυτό θα μπορούσε να εξοικονομήσει χρόνο στην αστυνομία, ενισχύοντας και βελτιώνοντας υπάρχουσες ερευνητικές τεχνικές, και παράλληλα αποθαρρύνοντας την υποβολή ψευδών καταγγελιών.

Τα αποτελέσματα της έρευνας δημοσιεύτηκαν στο Knowledge-Based Systems. Το Veripol εντάσσεται εν μέρει σε μια διαδικασία γνωστή ως natural language processing, ένας τομέας της τεχνητής νοημοσύνης που βοηθά τους υπολογιστές να κατανοούν, ερμηνεύουν κι επεξεργάζονται την ανθρώπινη γλώσσα. Για παράδειγμα, το εργαλείο χρησιμοποιεί αλγορίθμους για να εντοπίζει και ποσοτικοποιεί διάφορα χαρακτηριστικά στο κείμενο, όπως επίθετα, ακρωνύμια, ρήματα, ουσιαστικά κ.ά.

Μια αρχική μελέτη πάνω σε 1.000 αναφορές της ισπανικής αστυνομίας έδειξε πως το VeriPol ήταν ιδιαίτερα αποτελεσματικό ως προς το να διακρίνει τις ψευδείς και τις αληθινές αναφορές, με το ποσοστό επιτυχίας να ανέρχεται στο 80%. Το σύστημα εντόπιζε έναν αριθμό «τάσεων» που ήταν κοινές μεταξύ των καταγγελιών, όπως πιο σύντομες αναφορές, όπου δινόταν περισσότερη έμφαση στο τι εκλάπη από ό,τι στο περιστατικό το ίδιο, έλλειψη λεπτομερειών για το ίδιο το περιστατικό, περιορισμένες λεπτομέρειες για τον δράστη, έλλειψη μαρτύρων ή άλλων ισχυρών στοιχείων κ.ά.

Το σύστημα δοκιμάστηκε πιλοτικά στη Μούρθια και τη Μάλαγα της Ισπανίας τον Ιούνιο του 2017. Μέσα σε μόλις μία εβδομάδα, εντοπίστηκαν στη Μούρθια 25 περιπτώσεις ψευδών καταγγελιών ληστείας, οδηγώντας σε κλείσιμο των υποθέσεων, και άλλες 39 στη Μάλαγα. Συγκριτικά, μέσα σε διάστημα οκτώ ετών (2008-2016), ο μέσος όρος των αναφορών που διαπιστώνονταν ως ψευδείς ήταν 3,33 για τη Μούρθια και 12,14 για τη Μάλαγα.