Μία νέα εποχή στον κόσμο των σκακιστικών μηχανών φαίνεται να εγκαινιάζει το AlphaZero της DeepMind (Google) - ένας deep learning αλγόριθμος που υπόσχεται επανάσταση σε έναν κλάδο που αποτελεί κλασικό πεδίο αντιπαράθεσης μεταξύ ανθρώπου και μηχανής.
Μία νέα εποχή στον κόσμο των σκακιστικών μηχανών φαίνεται να εγκαινιάζει το AlphaZero της DeepMind (Google) - ένας deep learning αλγόριθμος που υπόσχεται επανάσταση σε έναν κλάδο που αποτελεί κλασικό πεδίο αντιπαράθεσης μεταξύ ανθρώπου και μηχανής.
Όπως αναφέρουν οι New York Times, στις αρχές του Δεκεμβρίου παρουσιάστηκαν σε επιστημονικό άρθρο στο Science εκτενώς οι λεπτομέρειες του αλγορίθμου, ο οποίος είχε ανακοινωθεί έναν χρόνο πριν, στις 5 Δεκεμβρίου 2017. Το AlphaZero δεν έπαιζε μόνο σκάκι, αλλά και σόγκι (ιαπωνικό σκάκι) και γκο (το γνωστό κινεζικό παιχνίδι στρατηγικής). Ο αλγόριθμος άρχισε χωρίς γνώση του παιχνιδιού πέρα από τους βασικούς κανόνες, και στη συνέχεια έπαιξε εναντίον του εαυτού του εκατομμύρια φορές, μαθαίνοντας από τα λάθη του. Μέσα σε μερικές ώρες, ο αλγόριθμος έγινε ο καλύτερος παίκτης του κόσμου- για την ακρίβεια, των κόσμων τόσο των ανθρώπων όσο και των υπολογιστών.
Όπως σημειώνει στο σχετικό δημοσίευμα στους NY Times ο Στίβεν Στρόγκατς, καθηγητής μαθηματικών στο Cornell και συγγραφέας του «Infinite Powers: How Calculus Reveals the Secrets of the Universe», στο νέο paper απαντάται σειρά ερωτημάτων γύρω από το AlphaZero, το οποίο, όπως υπογραμμίζεται, δεν έχει γίνει ισχυρότερο μέσα στους τελευταίους μήνες, ωστόσο οι αποδείξεις της υπεροχής του έχουν ενισχυθεί: «Ξεκάθαρα επιδεικνύει ένα είδος νοημοσύνης που οι άνθρωποι δεν έχουν δει στο παρελθόν» σημειώνει ο Στρόγκατς.
Οι σκακιστικές μηχανές του παρελθόντος, ακόμα και ο διάσημος Deep Blue που νίκησε τον Γκάρι Κασπάροφ το 1997, αλλά και τα σύγχρονα Stockfish και Κomodo, έπαιζαν και παίζουν «μηχανικά»: Δεν κατανοούν στην πραγματικότητα το παιχνίδι, και πρέπει να εκπαιδευτούν στις βασικές αρχές του σκακιού. Αυτό έχει αλλάξει με το machine learning: Παίζοντας με τον εαυτό του και αναβαθμίζοντας το νευρωνικό δίκτυό του, το AlphaZero ανακάλυψε μόνο του τις αρχές του σκακιού και έγινε γρήγορα ο καλύτερος παίκτης που υπήρξε ποτέ: Συνέτριψε το Stockfish, με 28 νίκες και 72 ισοπαλίες σε 100 παιχνίδια, επιδεικνύοντας στυλ παιχνιδιού που δεν έχει δείξει ποτέ υπολογιστής- παίζοντας «ενστικτωδώς», παίρνοντας ρίσκα και παραπλανώντας σαν άνθρωπος. «Το AlphaZero είχε τη φινέτσα ενός βιρτουόζου και τη δύναμη μιας μηχανής. Ήταν η πρώτη ματιά της ανθρωπότητας σε ένα απίστευτο νέο είδος νοημοσύνης» γράφει ο Στρόγκατς.
Κατά την πρώτη αναμέτρηση του AlphaZero με το Stockfish, αρκετοί είπαν πως το δεύτερο είχε υποστεί «λοβοτομή», καθώς δεν είχε πρόσβαση στο βιβλίο με τα ανοίγματά του. Ωστόσο, όταν αυτό άλλαξε, ηττήθηκε πάλι, με το AlphaZero να νικά επειδή έπαιξε πιο έξυπνα, όχι πιο γρήγορα- εξετάζοντας μόλις 60.000 θέσεις το δευτερόλεπτο, τη στιγμή που ο αντίπαλος εξέταζε 60 εκατ. το δευτερόλεπτο. Όπως έγραψε σε σχόλιό του ο ίδιος ο Γκάρι Κασπάροφ, το AlphaZero ήταν πιο «σοφό», γνωρίζοντας τι να σκέφτεται και τι να αγνοεί, αναπτύσσοντας ένα στυλ παιχνιδιού που «αντικατοπτρίζει την αλήθεια» για το παιχνίδι, αντί για τις προτεραιότητες και τις προκαταλήψεις των προγραμματιστών.
Το ερώτημα πλέον, όπως τονίζει ο Στρόγκατς, είναι κατά πόσον το machine learning μπορεί να βοηθήσει τους ανθρώπους να ανακαλύψουν παρόμοιες αλήθειες για τομείς που πραγματικά έχουν σημασία, όπως την επιστήμη και την ιατρική. Μέχρι τώρα τα δείγματα είναι ενθαρρυντικά, με επιτυχείς δοκιμές της τεχνολογίας αυτής στον τομέα των διαγνώσεων ή της ερμηνείας εξετάσεων όπως οι αξονικές τομογραφίες.
«Οραματιστείτε μια ημέρα, ίσως στο όχι και τόσο μακρινό μέλλον, όπου το AlphaZero θα έχει εξελιχθεί σε έναν αλγόριθμο επίλυσης πιο γενικών προβλημάτων, ας το πούμε AlphaInfinity. Όπως ο πρόγονός του, θα είχε ανώτερη οξυδέρκεια, θα μπορούσε να βρίσκει όμορφες αποδείξεις, κομψές σαν τις παρτίδες σκάκι που το AlphaZero έπαιζε με το Stockfish. Και κάθε απόδειξη θα έδειχνε γιατί ισχύει ένα θεώρημα...αυτό θα εγκαινίαζε μια νέα εποχή γνώσης για τους ανθρώπους μαθηματικούς και επιστήμονες...θα καθόμασταν στα πόδια του και θα ακούγαμε με ένταση. Δεν θα καταλαβαίναμε γιατί ο μάντης έχει πάντα δίκιο, μα θα ελέγχαμε τους υπολογισμούς του και τις προβλέψεις του, και θα επιβεβαιώναμε τα ευρήματά του. Στην επιστήμη...ο ρόλος μας θα μειωνόταν σε αυτόν του θεατή...ίσως αυτό στο τέλος να μη μας ενοχλούσε. Άλλωστε, στο τέλος το AlphaInfinity θα θεράπευε όλες μας τις ασθένειες, και θα έλυνε όλα μας τα επιστημονικά προβλήματα» σημειώνει ο αρθρογράφος.