«Ρουά ματ» ανθρωπότητα: Σε τέσσερις ώρες ένα ρομπότ έμαθε μόνο του σκάκι και κατατρόπωσε εξπέρ

«Ρουά ματ» ανθρωπότητα: Σε τέσσερις ώρες ένα ρομπότ έμαθε μόνο του σκάκι και κατατρόπωσε εξπέρ

Χρησιμοποίησε τακτικές πρωτοφανείς στην ιστορία 1.500 ετών του παιχνιδιού - Αν και νίκησε άλλο πρόγραμμα υπολογιστή, ο θρίαμβός του έχει μια διάσταση που είναι ιδιαίτερα τρομακτική για τον άνθρωπο

Μπορεί κάποτε να φτάσει μια μέρα που τα ρομπότ θα μας εξοντώσουν; Πρόκειται για ένα ερώτημα που απασχολεί ολοένα και περισσότερο τους ευφυέστερους επιστήμονες και τα πιο επινοητικά μυαλά του χώρου της τεχνολογίας. 

Οι καταιγιστικές εξελίξεις στον τομέα της τεχνητής νοημοσύνης - δηλαδή μηχανημάτων προγραμματισμένων να εκτελούν εργασίες που συνήθως απαιτούν ανθρωπινη ευφυία - πρόκειται να αλλάξουν δραματικά τους χώρους εργασίας μας και τον τρόπο που διασκεδάζουμε τα επόμενα χρόνια.

Φέτος, ένας κορυφαίος ακαδημαϊκός του Πανεπιστημίου της Οξφόρδης, ο καθηγητής Michael Wooldridge, προειδοποίησε τον πολιτικό κόσμο της χώρας του ότι η τεχνητή νοημοσύνη μπορεί να «επαναστατήσει» ενάντια στην ανθρωπότητα. Σύμφωνα με τον ίδιο, σύντομα τα μηχανήματα θα είναι τόσο περίπλοκα που οι μηχανικοί οι οποίοι τα κατασκευάζουν δεν θα μπορούν να τα κατανοήσουν απόλυτα ούτε να προβλέψουν όλες τις εκφάνσεις της «συμπεριφοράς» τους.

Μία πρόσφατη εξέλιξη έρχεται να ενισχύσει αυτούς τους φόβους. Και αφορά ένα παιχνίδι σκακιού. 




Σύμφωνα με την Daily Mail, το AlphaZero, ένα πρόγραμμα τεχνητής νοημοσύνης για υπολογιστές, αναδείχθηκε αυτόν τον μήνα παγκόσμιος πρωταθλητής σκακιού με τον πιο απόλυτο και σαρωτικό τροπο.

Η νίκη του όχι μόνο κατατρόπωσε τον προηγούμενο κάτοχο του τίτλου, ένα άλλο σύστημα τεχνητής νοημοσύνης με ονομασία Stockfish 8, μέσα απο ένα μαραθώνιο 100 παιχνιδιών αλλά διαθέτει και μια ακόμη πιο τρομακτική διάσταση: Σε αντίθεση με προηγούμενα προγράμματα το AlphaZero δίδαξε μόνο του τον εαυτό του να παίζει σκάκι, σε μόλις 4 ώρες. Οι προγραμματιστές του τού έδωσαν απλά τους κανόνες και εισήγαγαν την εντολή ώστε να παίζει συνεχώς με τον εαυτό του, μέχρι να τελειοποιηθεί!

Με αυτόν τον τρόπο, το πρόγραμμα όχι μόνο συγκέντρωσε αστραπιαία γνώση για το παιχνίδι που ο άνθρωπος χρειάστηκε αιώνες να κατακτήσει αλλά ξεπέρασε κατά πολύ την επινοητικότητα όλων των παικτών που άγγιξαν ποτέ σκακιέρα!

Σε αυτά τα 240 λεπτά πρακτικής, το πρόγραμμα ανέπτυξε πρωτοφανείς τακτικές που δείχνουν πραγματικά άτρωτες και απέδειξε την τρομακτική ικανότητά του να επιβάλλεται της ανθρώπινης νοημοσύνης.

Κάποιες από τις κινήσεις του που του έφεραν τη νίκη δεν είχαν καταγραφεί ποτέ άλλοτε στους σχεδόν 15 αιώνες της ιστορίας του παιχνιδιού, όπως π.χ. η χρήση του βασιλιά ως επιθετικό πιόνι, όπως εξηγεί η Daily Mail. Κι όλα αυτά μέσω ενός crash course που στην ουσία πραγματοποίησε χωρίς καμία ανθρώπινη βοήθεια πέραν μιας απλής, αρχικής εντολής.

Ο Γκάρι Κασπάροβ, ο εξπέρ του σκακιού που νίκησε το supercomputer της IBM, Deep Blue, το 1997 παρά το γεγονός ότι αυτό είχε «φορτωθεί» με τις καλύτερες κινήσεις (μια τεχνολογία που μοιάζει απαρχαιωμένη σήμερα) είχε πει κάποτε ότι η «ικανότητα των μηχανημάτων να ξεπερνούν αιώνες ανθρώπινης γνώσης είναι ένα εργαλείο που θα αλλάξει τον κόσμο». Και πόσο δίκιο είχε... 

ΣΧΟΛΙΑ (18)

Βαγγελης

Παρ'ολο που μερικοι φοβουνται δεν θα ηταν και τοσο ασχημο να αναλαβουν δραση τα ρομποτ εναντιον των ανθρωπων. Οπως παει ειναι η μονη μας ελπιδα για ν απαλλαγουμε απο τον Τσιπρα,τον Καμμενο, τον Κοντονη, τον Πολλακη ....για σκεφτειτε το λιγο !!! Επι του θεματος τωρα. Στο Chess.com o Tore Romstad λεει τα εξης.Τα αποτελεσματα δεν είναι ιδιαιτερως ενδεικτικα η σημαντικα λογω των συνθηκων περιορισμου χρονου και τις ρυθμισεις των παραμετρων του Stockfish. Και επεξηγει : Οι αγωνες εγιναν με τον περιορισμο 1 ενός λεπτου ανα κινηση πραγμα που θετει σε μειονεκτικη θεση τον Stockfish καθως με αυτόν τον περιορισμο δεν μπορει να επωφεληθει των ευριστικων του αλγοριθμων βασει των οποιων είναι ρυθμισμενος να αφιερωνει εξτρα χρονο σε καιρια σημεια του αγωνα. Επιπλεον το προγραμμα του Stockfish δεν είναι η τελευταια version. Και ακομα σημαντικοτερο είναι ότι ο Stockfish είναι ένα συμβατικο προγραμμα σκακι που τρεχει σε έναν συμβατικο, κανονικο Computer ενω o AlphaZero χρησιμοποιει τελειως διαφορετικες τεχνικες και προγραμμα που τρεχει σε ειδικα κατασκευασμενο Computer το οποιο δεν είναι διαθεσιμο σε απλους χρηστες (περαν του ότι θα ηταν και πανακριβος ακομα και εάν διετηθετο). Εν ολιγοις είναι συγκριση μεταξυ μηλων και ουραγκουτανγκων

@@@

βαλτε ενα ρομποτ Πρωθυπουργο στην Ελλαδα

Nomayor

Οι υπολογιστες ειναι ενα βημα στην εξεληξη της ζωης. Εδω και χρονια σε περιπτωσεις απωλειας router η οπτικων καλωδιων, εχει παρατηρηθει πως το ιντερνετ κανει re-route την κινηση με τροπο ο οποιος εχει σημαδια AI. Αυτο που με ξαφνιαζει περισσοτερο ειναι η εκπληξη μερικων.

@

Το αρθρο που κίνησε την περιέργειά και θα αποκαταστήσω την ταξη...Εχουμε ενα παιχνιδια αναμεσα στον Εξπερ" οπως αναφερεται στο αρθρο και δεν ειναι τιποτα αλλο, απο αλλο "ρομποτ" ή αν θελεται πιο σωστα, αλλον συμβατικο αλγόριθμο χωρις AI (τεχνητη νοημοσυνη), τον StockFish 8, που εινα οντως ενας απο τους πιο ισχυρους συμβατικους αλγοριθμους στο σκακι. Ο stockfish 8 λοιπον ενταντια στον Alpha zero (AI αλγοριθμο) που εκπαιδεύτηκε να παιζει σκακι για 4 ωρες. Οντως εντυπωσιακο το αποτελεσμα, αλλα ειναι δεδομενο οτι ο Stockfish 8, έπαιζε handicapped, σύμφωνα με τα σχόλια ειδικών. Οπότε ας αναμένουμε να δουμε match οπου θα χρησιμοποιηθει η καινουργια version του StockFish Version 9, χωρίς περιορισμούς. Σαφως ο stockfish χρειάζεται πολυ "σιδερο" για να παιξει ( 64 CPU cores), ενω ο AlphaZero επαιζε με λιγοτερο "σιδερο" αλλα dedicated chips. Οποτε οι συγκρισεις απο αυτη την αποψη ειναι δυσκολες.

@

Δεν αμφισβητώ ότι η τεχνικη νοημοσυνη των ρομποτ θα κανει πραγματα και θαματα. Όμως για να καταλάβουμε ποσο ακριβως εχει προχωρησει θα επρεπε στο αρθρο να αναφέρεται ποιος είναι ο λεγομενος "εξπερ" που κερδισε το κομπιουτερ. Τι rating εχει στο σκακι και στη παγκοσμια βαθμολογια ο αντίπαλος του ρομποτ? Είναι ας πουμε παιχτης επιπέδου grand master?

Ερευνητής Τεχνητής Ευφυίας

Απολύτως σωστό το σχόλιο και για το άρθρο θα πω ότι δυστυχώς είναι κάτω του μετρίου, καθώς ο παραπλανητικός τίτλος αναφέρετε σε expert system (εξπέρ σύστημα) Με λίγο καλύτερη δημοσιογαφική έρευνα θα ανέφερε ότι το συγκεκριμένο σύστημα στηρίζεται στο AlphaGo που πέρυσι νίκησε τον Κορεάτη παγκόσμιο πρωταθλητή στο παιχνίδι Go, το οποίο έχει πιο πολλούς συνδυασμούς από το σκάκι. Επίσης να αναφέρω ότι αλγόριθμοι αυτοί ανήκουν στην κατηγορία deep reinforcement learning του τομέα που λέγεται deep learning (βαθειά εκμάθηση). Σίγουρα δεν συγκέντρωσε "αστραπιαία γνώση" ούτε χρησιμοποίησε "πρωτοφανείς τεχνικές" και το πιο πιθανό είναι να μην γνωρίζει τίποτα για το σκάκι, όπως αναφέρεται χαρακτηριστικά στην βιβλιογραφία "no domain knowledge". Απλά έλυσε ένα πρόβλημα για να μεγιστοποιήσει ένα όφελος (σύνολο πόντων από κερδισμένα κομμάτια), επιλόγοντας την καλύτερη αληλουχία κινήσεων. Σίγουρα δεν έγινε "ρουα ματ" στην ανθρωπότητα, η οποία μια χαρά και από μόνη της οδεύει προς την καταστροφή. Τα σύγχρονα συστήματα απλά λύνουν συγκεκριμένα πρόβληματα εμφανίζοντας ψύγματα τεχνητής ευφυας (artificial intelligence). Σε καμία περίπτωση δεν έγινε νοήμον με αισθήματα (αγάπη, φόβος, οργή) και πόσο μάλλον να έχει την τάση να επιλέξει ως βέλτιση λύση την εξόντωση του ανθρώπου.

Ερευνητής Τεχνητής Ευφυίας

... ζητώ συγνώμη για τυχόν τυπογραφικά και το γιώτα με τόνο και διαλυτικά που κόπηκε από το σύστημα σχολίων (λόγω sanitation) στην λέξη ευφυια ...

@

Επισης να σημειωσω και καποια αλλα ενδιαφεροντα στοιχεια. Ο alpha zero μπορει να εκπαιδευτικέ για 4 ωρες, αλλα με πολυ hardware. Αποτέλεσμα μπορούσε να κάνει 80 χιλιάδες κινήσεις το δευτερόλεπτο. Αυτο σημαίνει οτι με ανθρώπινα δεδομένα, οι 4 ώρες εκπαίδευσης υπολογίστηκε ότι είναι σαν να έπαιζε σκάκι ενας ανθρωπος για περίπου 836 χρόνια . Ο αγωνας αναμεσα σε ανθρωπους και μηχανες τυπου stockfish εχει χαθει προ πολλου. Ο τωρινός παγκόσμιος πρωταθλητής, και ενας απο τους μεγαλύτερους σκακιστες στην ιστορια, Magnus Carlsen, εχει δηλώσει οτι δεν εχει καμια ελπιδα ενάντια στον Stockfish. Επισης να σημειώσουμε οτι εκτος της εκπαίδευσης του αλγοριθμου, τις χιλιαδες ωρες προγραμματισμου που απαιτούνται, απο πολλους ειδικους, για να φτιαχτουν αυτες οι σκακιστες μηχανες και τις δεκαετίες εμπειριών που συσσωρεύονται πανω στον αλγοριθμο. Οποτε στα επομενα χρονια το ενδιαφερον θα ειναι να παιξουν σε max επίπεδο, χωρις περιορισμους ο stockfish 9, με τον alpha zero, για να δουμε κατα ποσο και αν υπερτερούν οι αλγόριθμοι ΑΙ, ενάντια σε συμβατικούς αλγόριθμους.

Xaxa

"Σε τι κόσμο θα ζήσουν τα παιδια μας. Θα τα κάνουν ρομπότ κ αυτά. Τα ρομπότ θα επικρατήσουν και θα καταστρέψουν τον κόσμο, κάνανε την αρχή και μας στέλνουν μύνημα για το τι θα ακολουθήσει.ΕΧΟΥΝ ΣΧΕΔΙΟ ΕΞΟΝΤΩΣΗΣ ΜΑΣ.Εχοην συνείδηση και θα φτιάξουν κ θρησκεία. Μετά να το δείτε που θα κάνουν κ παιδιά ρομπότ και θα βλέπουν Ανθρωπομον ,Ανθρωκοπ και Εξολοθρευτής θα τρωνε γράσο και θα διαβαζουν πηγαίο κώδικα by Anrew NG.

Akis

Ρε σεις, εδώ, άμα δεν ξέρετε μην σχολιάζετε ότι να 'ναι. Επειδή τα βλέπω καθημερινά στη δουλειά μου, δεν θα αργησει η μέρα που θα κάνουν τα ρομπότ (καλύτερα να πω οι αλγόριθμοι και οι επεξεργαστές) ότι κάνουμε οι άνθρωποι. Ακόμα, δεν ξέρω αν είναι καλό ή κακό αλλά πληρώνει καλά... Να τα περιμενετε τα επόμενα 10 χρόνια.

Πες μας ΛΟΙΠΟΝ.

Πως αισθάνεται ο κομπιουτορας μετά τη νίκη του? Ακόμα πιστεύεις ότι ο κόκκινος κομπιουτορας θα κερδίσει 20 φορές στη σειρά? Να παίξω κάνα σιγουρακι!

Chris

Η τεχνητή νοημοσύνη, είναι η δυνατότητα που έχει κάποιο μηχάνημα, να μπορεί να κατηγοριοποιεί (pattern recognition). Εκεί πρέπει να ορίσεις εκ των προτέρων κάποια features, ή να αφήσει τη μηχανή να βρει αυτά τα features, από μόνη της. Στο σκάκι, η απόλυτη κατηγοριοποίηση είναι, τα patterns που νικούν, έναντι αυτών που χάνουν, ή φέρνουν ισοπαλία. Αυτό σημαίνει, ότι κάθε pattern (θέση πιονιών), έχει μία συγκεκριμένη τιμή. Το καλύτερο θα ήταν να έχει την τιμή (1 για νίκη, ή 0 για ήττα, ισοπαλία). Αλλά, επειδή δεν υπάρχει τέτοια δυνατότητα, λόγω πολυπλοκότητας, βάζουμε τιμή με βάση κάποια χαρακτηριστικά της θέσης. Όλη η επιστήμη του artificial intelligence, είναι πώς να παίξεις με τις παραμέτρους, ώστε να έχεις καλύτερη εκτίμηση για την κάθε θέση (μικρότερο classification error, με δύο υποθέσεις, ότι το pattern ανήκει σε αυτά που νικούν, ή σε αυτά που χάνουν). Και αυτό προσπαθούν να το βρούνε με διάφορες μεθόδους, που δεν έχω εντρυφήσει σε αυτές (neural networks). Πάντως, κάθε εκτίμηση, είναι μια λύση, που αποτελεί πάντα ένα heuristic (προσέγγιση). Οπότε, μπορούμε να δούμε αν λειτουργεί καλά ή κακά, απέναντι σε συγκεκριμένους αντιπάλους. Μπορεί όμως, να μη λειτουργεί καλά, απέναντι σε άλλους αντιπάλους. Ένα heuristic είναι καλό, μέχρις αποδείξεως του εναντίου. Δεν υπάρχει τίποτα μεταφυσικό σε αυτό. Και η θεωρία είναι γνωστή από την εποχή του Shannon και του Turing.

Απάτη

Το κείμενο δεν έχει καμία σχέση με την επιστημονική πραγματικότητα.

a

Τα ρομποτ οσο εξυπνα και αν γινουν θα ερθει η στιγμη που θα οδηγηθουν απο μονα τους σε ομαδικες αυτοκτονιες,θα κλεισουν τους γενικους!Μονο μια βιολογικη οντοτητα οπως ο ανθρωπος μπορει να αντεξει την αβασταχτη συνειδητοποιηση της ματαιοτητας των παντων

Φόρτωση περισσότερων σχολίων
ΠΡΟΣΘΗΚΗ ΣΧΟΛΙΟΥ
Απομένουν χαρακτήρες
* Υποχρεωτικά πεδία

Δείτε Επίσης