H γνωστή εταιρεία του χώρου της τεχνητής νοημοσύνης, DeepMind, ανακοίνωσε ότι δημιούργησε την πρώτη τεχνητή νοημοσύνη που φτάνει στην κορυφαία κατηγορία ενός εκ των δημοφιλέστερων παιχνιδιών του χώρου των esports- του Starcraft 2.
Σύμφωνα με την εταιρεία, το Starcraft 2 αποτελούσε μεγαλύτερη πρόκληση για την τεχνητή νοημοσύνη σε σχέση με το σκάκι και άλλα επιτραπέζια παιχνίδια, εν μέρει επειδή ο παίκτης συχνά δεν βλέπει τα κομμάτια/ μονάδες του αντιπάλου του.
Όπως αναφέρει το BBC, η σχετική δημοσίευση στο Nature επιτρέπει στην εταιρεία να διεκδικήσει ένα νέο ορόσημο στο αντικείμενο, με την DeepMind, που υπάγεται στην Alphabet, μητρική της Google, να υποστηρίζει πως η ανάπτυξη του AlphaStar θα τη βοηθήσει να αναπτύξει άλλα εργαλεία τεχνητής νοημοσύνης προς όφελος της ανθρωπότητας. «Ένα από αυτά που μας συναρπάζουν περισσότερο είναι πως το Starcraft αντιπροσωπεύει πολλές προκλήσεις που βλέπεις σε προβλήματα στον πραγματικό κόσμο» είπε ο Ντέιβ Σίλβερ, επικεφαλής της ερευνητικής ομάδας του εργαστηρίου στον τομέα του reinforcement learning. «Βλέπουμε το Starcraft ως ένα σημείο αναφοράς για την κατανόηση της επιστήμης της Α.Ι. και την πρόοδό μας στη δημιουργία καλύτερων συστημάτων τεχνητής νοημοσύνης».
Στο παιχνίδι οι παίκτες επιλέγουν μια από τρεις φυλές- Terran, Protoss και Zerg- οι οποίες έχουν εντελώς διαφορετικές μονάδες και δυνατότητες, και πρέπει να συλλέξουν πόρους για να φτιάξουν κτίρια, στρατό και να αναπτύξουν νέες τεχνολογίες, βρίσκοντας παράλληλα τη βάση και τον στρατό του αντιπάλου και επιδιώκοντας να τον νικήσουν. Το παιχνίδι λαμβάνει χώρα σε πραγματικό χρόνο και αποτελεί μεγάλη πρόκληση για την τεχνητή νοημοσύνη, καθώς ο παίκτης πρέπει να χειρίζεται αποτελεσματικά πολλές μονάδες και κτίρια, και να κάνει επιλογές που θα αποφέρουν αποτελέσματα πολλές φορές όχι άμεσα, αλλά λεπτά αργότερα.
Η DeepMind, όπως αναφέρει το BBC, εκπαίδευσε τρία νευρωνικά δίκτυα- ένα για κάθε φυλή του παιχνιδιού- χρησιμοποιώντας μια τεράστια βάση δεδομένων με παλιές παρτίδες που παρείχε η εταιρεία που έφτιαξε το παιχνίδι, Blizzard. Με αυτόν τον τρόπο τα συστήματά της εκπαιδεύτηκαν έτσι ώστε να μιμούνται τις κινήσεις των ισχυρότερων παικτών. Στη συνέχεια, τα έβαλε να παίζουν μεταξύ τους για να βελτιώσουν τις επιδόσεις τους, σε μια τεχνική που είναι γνωστή ως reinforcement learning, και δημιούργησε επίσης «exploiter agents», η δουλειά των οποίων είναι να εντοπίζουν αδυναμίες σε στρατηγικές.
Όλη η διαδικασία έλαβε χώρα 44 ημέρες, ωστόσο επειδή έγινε στην ανώτατη δυνατή ταχύτητα, αντιπροσωπεύει παιχνίδια συνολικής χρονικής διάρκειας που αντιστοιχεί σε 200 έτη. Όταν τα τρία αυτά συστήματα ήρθαν αντιμέτωπα με ανθρώπους στο Battle.net, την πλατφόρμα online παιχνιδιών της Blizzard (χωρίς να αποκαλύπτεται τι ήταν, μέχρι το τέλος του παιχνιδιού), ήταν σε θέση να φτάσουν σε επίπεδο Grandmaster- το επίπεδο που δίνεται στους κορυφαίους παίκτες κάθε περιοχής του κόσμου. Ωστόσο, η εταιρεία αναγνωρίζει πως υπάρχουν περίπου 50-100 άνθρωποι παίκτες που μπορούν να νικήσουν το AlphaStar στο Battle.net.