Jump to content
This Topic
SuperCaddy

Intelligence artificielle : la machine domine l'homme au jeu de go

Recommended Posts

C'est vraiment énorme.
C'est que le premier match d'une série plus longue mais déjà, c'est un séisme gigantesque.

Beaucoup de gens étaient prêts à accepter que l'IA allait dépasser l'humain au go dans un avenir pas trop lointain. Mais on y est peut-être déjà tout de suite.

J'ai absolument pas le niveau pour juger de ça moi-même, mais visiblement, Lee Sedol a joué un peu inorthodoxe pour tester la machine mais n'a pas l'air d'avoir fait d'erreur majeure d'après les premiers rapports que je lis. En ce sens, c'est potentiellement beaucoup plus gros que la première victoire de Deep Blue contre Kasparov, ou Kasparov semblait encore un cran au-dessus de la machine mais s'était level comme un fou après un bug de Deep Blue.

Share this post


Link to post
Share on other sites

Le stream est regardable pour un type qui connait à peine les règles ?

Les règles sont simples : chaque joueur pose à son tour une pierre afin de faire des territoires, délimités par les quatre directions haut bas gauche droite. Toute pierre ou tout groupe de pierres qui est encerclé sans territoire intérieur "meurt" et est capturé, un prisonnier compte un point, autant qu'une unité de territoire. Souvent, les deux joueurs ont des groupes de pierres qui ne pourront pas être capturés, ils essaient alors d'augmenter la taille du groupe sur le plateau par des connexions haut bas gauche droite. Au début de la partie, les Noirs jouent en premier et l'avantage du trait leur confère un avantage évalué à 6,5 points. Le demi-point fait que, une fois les prisonniers et les points de territoire comptés, et le handicap de 6,5 points déduit, l'un des deux joueurs remporte la partie.

J'ai regardé quelques minutes du stream live, le commentateur explique bien les idées des coups possibles par zone de territoire, c'est vivant et dynamique.

Edit : l'avantage du trait initial est compensé par un handicap de 6,5 points.

Edit2 : Sur la seconde partie, Lee Sedol a un désavantage constant à la pendule d'environ 25 minutes. Contrairement aux jeu d'échecs, où ne plus avoir de temps peut signifier la perte de la partie, ne plus avoir de temps au go vous oblige à jouer chaque coup dans un temps imparti, en tenant le rythme bien sûr. Après vérification, chaque coup joué par Lee Sedol en crise de temps remet sa pendule à 1 minute.

Edited by taamer

Share this post


Link to post
Share on other sites

Le commentateur est bon, il prévoit bien ce qu'il va se passer dans la partie.

Share this post


Link to post
Share on other sites

2-0 en faveur d'AlphaGo. AlphaGo a construit un avantage d'environ 10 points sur le plateau, ce qui est supérieur au handicap du Komi (6,5 points), lui conférant ainsi la victoire. L'encerclement des pierres blanches en plein centre du plateau a été une manoeuvre décisive (amha) dans la réalisation de l'avantage du trait de cette partie.

Share this post


Link to post
Share on other sites

Un peu de suspens ne serait pas trop mal quand même. Déjà 2/0; c'est en combien de manches gagnantes?

Share this post


Link to post
Share on other sites

En quoi est-ce un progrès? Ça restera un algorithme basé essentiellement sur la force brute, ce qui fait la diff.

C'est complètement faux. C'est beaucoup beaucoup plus subtil que de la force brute.

L'élément principal est un algo de Monte Carlo Tree Search qui justement a pour propriété d'élaguer de manière très intelligente l'arbre gigantesque des séquences possibles. C'est ce qui était utilisé depuis maintenant près de 10 ans par les IA les plus performantes et qui a crée la première révolution qui a permis de passer d'un niveau 10ème kyu à 1er dan amateur il y a longtemps.

Sur cette instance, avec AlphaGo, la pincipale avancée (au-delà du raffinement des méthodes existantes et de la puissance de calcul supérieure déployée), est l'utilisation de réseaux de neurones profonds pour APPRENDRE la fonction d'évaluation, c'est à dire la fonction qui évalue si un coup est bon ou non. Le choix de cette fonction est hautement non trivial, et visiblement, le choix de l'apprendre de cette manière s'avère très payant.

 

Bref, il ne s'agit absolument pas de force brute et dans tous les cas, il est inconcevable que le Go puisse être résolu par la force brute avant des décennies. C'est beaucoup beaucoup trop complexe.

 

Est-ce-que la machine a "avalé" des parties de Lee Sedol ?

Oui, pour la phase d'apprentissage, AlphaGo a utilisé des parties de pro, incluant des parties de Lee Sedol, mais il n'y a pas eu un biais spécifique pour Lee Sedol.

D'ailleurs les parties de pros humains ayant servi pour l'apprentissage ne sont qu'une partie infime de ce qu'a "mangé" AlphaGo. L'immense majorité consiste en des parties faites entre AlphaGo et lui-même. Il y a eu des milliards de parties simulées et qui renforcent, petit à petit, "l'ensemble d'apprentissage".

C'est d'ailleurs la principale différence entre humain et IA. L'humain est BEAUCOUP BEAUCOUP plus efficace que la machine pour apprendre à partir de peu de données. Mais la machine peut apprendre de milliards (littéralement) de parties, là, où nous, nous ne sommes capables que d'en jouer (et d'apprendre de) quelques centaines ou milliers.

Share this post


Link to post
Share on other sites

D'ailleurs les parties de pros humains ayant servi pour l'apprentissage ne sont qu'une partie infime de ce qu'a "mangé" AlphaGo. L'immense majorité consiste en des parties faites entre AlphaGo et lui-même. Il y a eu des milliards de parties simulées et qui renforcent, petit à petit, "l'ensemble d'apprentissage".

Genre comme dans Wargame ? 

Share this post


Link to post
Share on other sites

Merci pour ta réponse Piconzaz qui est à la fois pertinente et intéressante.

 

Tu as balayé mon scepticisme primaire ! Je pensais en premier lieu que, sans user de biais spécifique pour autant, AlphaGo soit apte à s'adapter au jeu de Sedol via les datas qu'il avait engrangé et qu'au contraire, Sedol soit dans le flou (ce qui est probablement le cas pour autant, mais cela doit être moins important que je ne le pensais). Mais bon, du coup l'edge humain est, comme tu l'as dit, dans l'efficacité de traitement données quand la machine l'est dans la rapidité de traitement de données.

 

Il serait amusant d'essayer de limiter les données et de voir à quel stade l'homme dépasse la machine. Mais bon, il faudrait aussi programmer un bot pour remplacer l'humain, vu que ce dernier est en perpetuelle évolution de par ses expériences.

 

Par contre, cela me fait quand même flipper un peu cette capacité d'évaluation du robot ... Cela me rappelle certains concepts que j'avais lu en SF (pas de nom précis, pas ma tasse de thé). Du coup, in b4 la machine se rende compte que l'humain est le plus gros danger pour lui-même aha.

 

 

Share this post


Link to post
Share on other sites

Sans avoir jamais joué au go, je suis de près ce match car le domaine de l'intelligence artificielle m'intéresse beaucoup. Pour ceux qui ne l'ont pas vu, je recommande le film "Her" que j'ai vu récemment et que j'ai beaucoup aimé. Il n'y a pas du tout de "technique", ce n'est pas un film de geek avec des concepts avancés en IA par contre c'est une superbe illustration de ce à quoi pourrait ressembler une IA dans le futur.

 

Et bien une IA pourrait en fait s'humaniser dans un certain sens. On pourrait parler avec des IA et avoir des discussions passionnantes tout comme on parlerait avec des humains. Qu-est-ce qui fait la particularité humaine finalement ? L'une des particularité est simplement que notre cerveau est bien plus évolué et efficace dans de nombreuses tâches telles que l'apprentissage, le raisonnement etc... Mais toutes ces capacités comment ça fonctionne ? À la base ce sont simplement des milliards de neurones très basiques qui ensemble arrivent à produire des capacités très complexes. Dans le futur, on peut imaginer que des IA seront capables de faire exactement la même chose, ce jour là, les IA seront alors plus "humaines" que jamais.

 

Vous vous demandez peut-être le rapport avec AlphaGo ? Je parlais de la capacité d'apprentissage phénoménale des cerveaux humains (combien de centaines de milliers de mots vous connaissez ? de visages ?), les IA en réseaux de neurones comme AlphaGo sont justement conçus pour apprendre un peu à la manière des humains. Ce n'est pas de la "force brute" comme j'ai pu lire dans le topic, au contraire cet AlphaGo a appris le go un peu comme un humain, en regardant des millions de parties et en en jouant lui-même des millions.

Edited by Pad

Share this post


Link to post
Share on other sites

Create an account or sign in to comment

You need to be a member in order to leave a comment

Create an account

Sign up for a new account in our community. It's easy!

Register a new account

Sign in

Already have an account? Sign in here.

Sign In Now


  • Recently Browsing   0 members

    No registered users viewing this page.

English
Retour en haut de page
×
Casino de Marrakech : WSOP Circuit
Casino de Marrakech : WSOP Circuit