Jump to content
This Topic
SuperCaddy

Brains vs AI : Libratus défie quatre champions de poker en heads up

Recommended Posts

J'étais complètement passé à côté de cet autre match Bot vs Humans qui a eu lieu et qui est décrit dans ce papier : https://arxiv.org/pdf/1701.01724v1.pdf

Les auteurs annoncent être les premiers à battre les humains avec leur bot, ça doit pas mal mettre en rogne l'équipe de Carnegie Mellon !

 

J'ai lu en diagonal le papier sur mon téléphone mais en gros premières impressions :

- le bot en lui meme a l'air d'avoir une architecture super intéressante. Plutôt que de tout calculer comme un bourrin avec une machine qui coûte 10M comme Libratus, ils combinent des techniques de résolution d'équilibre de Nash (algorithme CFR) avec du deep learning ce qui permet de considérablement réduire l'arbre de décision. 

- Le challenge en lui meme par contre m'a l'air d'être une énorme blague. J'attendais le moment fatidique où j'allais voir le nom des challengers... Et là je vois Phil Laak dans la liste. ROFL ! 

 

La liste des joueurs est donnée page 19 du papier. Vous connaissez les autres joueurs ? Est-ce qu'il y a au moins un seul top reg de HU ?

Edited by Pad

Share this post


Link to post
Share on other sites

@Padje reconnais personne, l'impression que la liste contient principalement les cousins des scientifiques qui sont pro de home game en nickels 

 

Vu les samples anyway, y'a pas match avec Libratus. Mais à propos de match, organisons un match entre les deux bots !

Share this post


Link to post
Share on other sites

"We evaluated DeepStack by playing it against a pool of professional poker players recruited by the International Federation of Poker (34)."

Ça sent le field full regs mtt. Ce qui est fun c'est que les chercheurs ont mis en ligne ce papier avant qu'il soit reviewé et officiellement accepté (il y a tout un processus pour qu'un papier dans ce genre puisse paraître dans la presse scientifique). On est à 2 jours de la fin du match de Libratus, donc les mecs ont clairement voulu leur couper l'herbe sous le pieds en disant non c'est nous qui sommes les premiers à battre l'humain au NLHE. Alors qu'au final leur challenge est completement pourri avec 30 random players de mtt qui obv se sont fait défoncer en jouant du CG HU 200bb deep ^^

Share this post


Link to post
Share on other sites

Un match entre Libratus et Deepstack tournerait assurément à l'avantage de Libratus qui calcule des équilibres de Nash beaucoup plus élaborés et précis. Mais ce serait un peu comme comparer un énorme tank à un vélo. 

J'ai entendu Jason Les dire que Libratus coûtait environ 10M$ en terme d'infrastructure. Et lu dans un article que le supercomputer qui permet à Libratus de prendre des décisions turn et River serait l'équivalent de 10.000 machines tournant en parallèle.

Alors qu'à priori l'infrastructure de Deepstack est plutôt épurée, et contrairement à Libratus il ne tank pas toute sa vie sur chaque décision comme le montre ce tableau ci dessous. IMG_3302.PNGÀ noter que les humains multitablaient ce qui augmente leurs temps de réaction.

 

Edited by Pad

Share this post


Link to post
Share on other sites

J'ai reconnu 3 noms en dehors de Phil Laak.

Juan Manuel Pastor, je sais pas d'ou je le connais, mais ça doit pas être un génie.

Fintan Gavin qui est un organisateur de tournoi maintenant en Irlande 9_9

Dara O'Kearney qui est un assez bon joueur MTT online/live malgré son age avancé. Mais qui doit être assez nul en HU obv.

Share this post


Link to post
Share on other sites

Ah ah assez savoureuse la liste des joueurs affrontant Deepstack!

J'ai pris, au hasard et un peu car il est allemand, Jurgen Bachmann, je l'ai hendon mob : 6 iTM en 2016 sur des buyins allant de 50$ à 160$ max... 12K$ de gains lifetime en MTT de 2008 à aujourd'hui et vu la photo il est proche de la cinquantaine.

Sur quels critères la sélection, tirage au sort ou casting sauvage dans les bars affiliés Red Cactus?

Share this post


Link to post
Share on other sites

Hypothetiquement si vous deviez faire une liste de 4 joueurs pour faire la belle contre CMU, vous prendriez qui? 

Perso je miserai sur Polk, Luneau, Cates (Jungleman) et Sulsky (Sauce123). On peut aussi reprendre Dong Kim. Et la on verrait ce que Libratus 2 a vraiment dans le ventre. 

Je ferai aussi un format ou ils ont 30 jours pour faire les 120k mains de chez eux quand ils veulent, en distribuant les mains miroir de maniere desordonnée sur tout l'échantillon, en utilisant une interface  tres similaire a PS/Full Tilt. 

Share this post


Link to post
Share on other sites

Je peux me tromper mais je pense que si on fait le match dans les conditions que je décris et qu'on enleve le stack reset a 200bb, ca redonne quelques années á l'humanité.

 

Share this post


Link to post
Share on other sites
1 minute ago, N!co said:

Tiens @manuben fait, j'ai lu le thread en diagonal peut être pourrais tu répondre :

pourquoi 200bb stack reset ? 100bb trop easy ?

C'est deja a 200bb, mais les stacks sont remis a 200bb a chaque main. Dans des conditrions de vrai HU avec le stack effectif qui évolue, je pense que l'IA perd un edge assez conséquent. 

 

 

Share this post


Link to post
Share on other sites

@manub

 

Je ne pense sincèrement pas. Bon, dans les conditions que tu décris, il y a un énorme biais. Le mirrored randomizé est absurde, beaucoup de spots de cooler seront trop facile à communiquer aux autres joueurs.

 

Même dans le cas d'un match où les humains sont garantis de jouer leur A game, je pense que le bot les battra assez facilement. Ici, on parle d'un edge de 10bb/100, c'est conséquent. Je ne pense pas que Luneau soit si fort en HU no limit, il a surtout l'expérience des mixed games.

Le stack reset n'y fera rien, en dessous de 200bb le bot sera encore plus close du GTO, et au dessus, je pense que le gap entre le bot et les humains augmentera.

 

@N!co le 200bb stack reset vient des règles de compétitions interbot. 100bb deep est en effet considéré trop simple par les équipes qui bossent sur ce type d'IA.

Edited by Dilir

Share this post


Link to post
Share on other sites
Quote

Le stack reset n'y fera rien, en dessous de 200bb le bot sera encore plus close du GTO, et au dessus, je pense que le gap entre le bot et les humains augmentera.

Je propose pas de jouer avec moins de 200bb mais de laisser les stacks effectifs évoluer sur une session (donc ils peuvent monter a 300bb, 400bb...). IMO ca change beaucoup de choses. 

Share this post


Link to post
Share on other sites

C'est plié, 200 400 600 BB, ce ne sera qu'une question de semaine (mois); les bots progresseront inéluctablement. 

Il reste les variantes mais ça ne mettra pas longtemps (je parie sur 2 ans pour l'omaha). 

On peut varier les conditions à l'infini mais il faut se rendre à la réalité, on va dès aujourd'hui (et encore plus demain)

devoir considérer le jeu des bots comme une référence, une source de connaissance. 

 

Edited by letacot

Share this post


Link to post
Share on other sites

Pour ma dreamteam, Polk, Jungleman, Sauce et Redbaron ça me paraît sympa.

Et je pense aussi que dans des conditions plus écologiques, l'humain est encore assez significativement au dessus. Le problème de la machine c'est sa rigidité. Elle a appris à jouer dans certaines conditions et ne sait faire que ça, et ça serait très couteux pour elle d'apprendre autre chose ou de s'adapter à un petit changement. Rien que si les stacks ne sont plus de 200bb deep à chaque fois ça lui poserait beaucoup de problèmes. 

Là où le cerveau humain est largement supérieur c'est dans sa capacité d'adaptation face à des situations nouvelles. Tu prends le NLHE, tu rajoutes une règle : "gagner une main avec 72o rapporte 10bb", l'humain va très rapidement savoir comment adapter ses ranges et sa stratégie en intégrant cette nouvelle composante. Alors que le bot serait tout perdu et il faudrait 3 mois à l'équipe de CMU pour refaire des calculs à plusieurs dizaines de milliers de $.

Share this post


Link to post
Share on other sites
il y a 13 minutes, Pad a écrit :

Pour ma dreamteam, Polk, Jungleman, Sauce et Redbaron ça me paraît sympa.

Et je pense aussi que dans des conditions plus écologiques, l'humain est encore assez significativement au dessus. Le problème de la machine c'est sa rigidité. Elle a appris à jouer dans certaines conditions et ne sait faire que ça, et ça serait très couteux pour elle d'apprendre autre chose ou de s'adapter à un petit changement. Rien que si les stacks ne sont plus de 200bb deep à chaque fois ça lui poserait beaucoup de problèmes. 

Là où le cerveau humain est largement supérieur c'est dans sa capacité d'adaptation face à des situations nouvelles. Tu prends le NLHE, tu rajoutes une règle : "gagner une main avec 72o rapporte 10bb", l'humain va très rapidement savoir comment adapter ses ranges et sa stratégie en intégrant cette nouvelle composante. Alors que le bot serait tout perdu et il faudrait 3 mois à l'équipe de CMU pour refaire des calculs à plusieurs dizaines de milliers de $.

j'ai peut être tord mais je pense totalement le contraire. Le jeu du 72 la machine va juste rajouter 16 combos de bluffs dans son algorithme et en retirer 16 autres, beaucoup plus facile à gérer par une machine que par un humain imo.

Sinon line up: Polk, Jungle, Rabishow, Otb 

Share this post


Link to post
Share on other sites

Create an account or sign in to comment

You need to be a member in order to leave a comment

Create an account

Sign up for a new account in our community. It's easy!

Register a new account

Sign in

Already have an account? Sign in here.

Sign In Now


  • Recently Browsing   0 members

    No registered users viewing this page.

English
Retour en haut de page
×