lundi 15 juillet 2019 à 9:46

Libratus était aussi fascinant qu'inquiétant. Pluribus, sa progéniture, l'est autant si ce n'est plus. Cette intelligence artificielle développée par Tuomas Sandholm et Noam Brown vient en effet de dominer plusieurs joueurs de poker aguerris dans une configuration à six. Un véritable bond en avant par rapport aux performances constatées en heads up ces deux dernières années.

Tuomas Sandholm
Tuomas Sandholm, le papa de Pluribus

Comme Libratus avant lui, Pluribus obtient depuis quelques jours les honneurs de la presse généraliste. L'intelligence artificielle de Facebook écrase plusieurs champions de poker, s'enthousiasme 20minutes. Au poker, l'intelligence artificielle se révèle moins prévisible que les champions, renchérit BFMTV. Même son de cloche outre-Atlantique avec, par exemple, cet article de Nature intitulé No Limit : AI poker bot is first to beat professionals at multiplayer game.

 

Pour prendre la pleine mesure de cette annonce, rien ne vaut toutefois le compte-rendu de l'expérience rédigé par Noam Brown pour Facebook. Ou mieux, son bilan encore plus complet cosigné avec Tuomas Sandholm dans Science. Les deux scientifiques y détaillent par le menu leur méthodologie, leurs résultats, leurs constats et leurs surprises. Une lecture absolument passionnante, même lorsque tous les concepts qui y sont développés ne vous sont pas forcément familiers.

 

En 2017, Libratus faisait une démonstration de force en heads up face à quatre grands champions. Quelques nouveaux algorithmes et lignes de code plus tard, Pluribus pointe le bout de son nez avec des atouts et des ambitions d'une toute autre envergure. Ses créateurs l'assurent : son fonctionnement à plein régime ne requiert par des millions de dollars. Là où AlphaGo, le champion de Google, utilisait 1 920 processeurs dont 280 en temps réels, Pluribus n'en nécessite que deux et moins de 128 Gb de mémoire.

 

La Carnegie Mellon University qui l'a vu naître a donc souhaité le mettre à l'épreuve. Pour ce faire, elle a sollicité la collaboration de joueurs de poker expérimentés : Chris Ferguson, Greg Merson, Darren Elias, Jimmy Chou, Seth Davies, Michael Gagliano, Anthony Gregg, Linus Loeliger, Daniel McAulay, Nick Petrangelo, Sean Ruane, Trevor Savage et Jake Toole, mais aussi Dong Kim et Jason Les qui avaient déjà croisé le fer avec Libratus.

 

Les parties se sont déroulées sur la base de deux formats : des tables de cinq joueurs humains et une intelligence artificielle, et des tables de cinq intelligences artificielles avec un seul humain. À chaque fois, les tapis étaient de 10 000 jetons (soit 100 blindes) au début de chaque coup. Avec en prime un mécanisme de pondération destiné à intégrer la variance dans les calculs et à "atteindre des résultats significatifs en dix fois moins de mains".

 

Au bout du compte, c'est bien Pluribus qui est ressorti gagnant de l'expérience avec une moyenne positive de 5bb/100. "Ce résultat", affirme le compte-rendu, "dépasse l'espérance de gain moyenne de joueurs professionnels à une table composée de pros et d'amateurs". S'agissant par exemple de la configuration mettant en scène un humain face à cinq intelligences artificielles, les 5 000 mains disputées par chaque joueur ont abouti aux déficits suivants : 4bb/100 pour Darren Elias, 2,5bb/100 pour Chris Ferguson et 0,5bb/100 pour Linus Loeliger. Des nuances significatives qui attestent de l'importance des choix de casting pour obtenir des résultats probants.

 

L'étude regorge aussi de détails sur l'attitude de Pluribus, dont les temps de réflexion oscillent par exemple entre une et 33 secondes en fonction de la situation. Sur le forum, fredydruger retient surtout cette courbe de progression éloquente qu'il résume en une phrase : "Il lui faut 7 heures pour dominer un joueur humain et 20 heures pour battre n'importe qui, mais trois jours pour éliminer le limp de sa stratégie". Darren Elias, quant à lui, met en avant la faculté d'adaptation de son adversaire : "Sa principale force est sa capacité à recourir à différentes stratégies. Les humains essaient de faire pareil mais, pour les humains, l'exécution laisse à désirer. La plupart des gens n'arrivent pas vraiment à le faire de façon parfaitement aléatoire et avec constance".

 

Si le monde du poker est légitimement en émoi face à de telles avancées, il convient de rappeler qu'il ne s'agit là que d'une étape pour Pluribus. Ses créateurs voient plus loin et évoquent ses applications potentielles dans le monde réel, en particulier lorsque des informations sont cachées comme en matière de prévention de la fraude et de cybersécurité. Une forme de paradoxe à l'heure où les joueurs se soucient eux davantage de la sécurité des parties en ligne auxquelles ils prennent part.

Vos commentaires sur cette news dans le forum :
Pluribus : le fiston de Libratus confirme les progrès majeurs de l'IA en Six-Handed
Cette news a suscité 32 commentaires, et seuls les 15 derniers sont affichés.
News

Libratus était aussi fascinant qu'inquiétant. Pluribus, sa progéniture, l'est autant si ce n'est plus. Cette intelligence artificielle développée par Tuomas Sandholm et Noam Brown vient en effet de dominer plusieurs joueurs de poker aguerris dans une configuration à six. Un véritable bond en avant par rapport aux performances constatées en heads up ces deux dernières années.

[...] Lire la suite…




Tuomas Sandholm, le papa de Pluribus

Share this post


Link to post
Share on other sites

Oui apparemment pluribus est down de 7bb/100 sur les 10k mains mais up de 5bb/100 après avoir appliqué la fameuse "technique de réduction de variance" (AIVAT). Mais ils n'expliquent pas comment celle-ci est calculée.

Il est aussi expliqué dans l'article de Science que cette l'AIVAT est impossible à appliquer aux joueurs humains. Donc pour le coup leurs winrates respectifs sont complètement bidons.

 

Share this post


Link to post
Share on other sites
Posted (edited)

Bah justement c'est bien ça le problème., cet algorithme de réduction de variance n'est pas détaillé dans les articles. Il y bien un papier scientifique dessus (mais bon, pas que ça à foutre de le lire 8^).

Mais en gros, d'après l'article de facebook, ils appliquent une "baseline value" à chaque "situation" (pas très clair si par "situation" ils entendent  simplement les hole cards ou si c'est plus compliqué que ça...). Et on soustrait cette baseline value du montant gagné sur un pot.
Donc si le bot remporte un gros coup parce qu'il avait de bonnes cartes, le montant final du gain (pris en compte dans l'AIVAT) sera plus petit.

Edited by VeridisQuo

Share this post


Link to post
Share on other sites
Posted (edited)

@SuperCaddy

Salut, 

Dans l'article de science, je ne vois indiqué que deux joueurs : "The human participants in the 1H+5AI experiment were Chris “Jesus” Ferguson and Darren Elias. Each of the two humans separately played 5,000 hands of poker against five copies of Pluribus. "

Je ne trouve pas trace de Linus Loeliger.

Peux-tu, stp, m'indiquer la source où tu as trouvé llinuslove à -0.5bb/100 dans l'expérience 1H+5AI.

D'avance merci.

Edited by grosrobert

Share this post


Link to post
Share on other sites
il y a 6 minutes, grosrobert a écrit :

Peux-tu, stp, m'indiquer la source où tu as trouvé llinuslove à -0.5bb/100 dans l'expérience 1H+5AI.

Salut grosrobert (j'adore ton pseudo). J'ai trouvé ça dans l'article de Noam Brown sur Facebook. Le paragraphe en question précise que la participation de Loeliger est intervenue après la rédaction de l'article de Science :

5 AIs + 1 human
This experiment was conducted with Ferguson, Elias, and Linus Loeliger. (The experiment involving Loeliger was completed after the final version of the Science paper was submitted.) Loeliger is considered by many to be the best player in the world at six-player no-limit Hold’em cash games. Each human played 5,000 hands of poker with five copies of Pluribus at the table. Pluribus does not adapt its strategy to its opponents, so intentional collusion among the bots was not an issue. In aggregate, the humans lost by 2.3 bb/100. Elias was down 4.0 bb/100 (standard error of 2.2 bb/100), Ferguson was down 2.5 bb/100 (standard error of 2.0 bb/100), and Loeliger was down 0.5 bb/100 (standard error of 1.0 bb/100).

Share this post


Link to post
Share on other sites

https://www.macg.co/ailleurs/2019/07/avec-neuralink-elon-musk-veut-aussi-soigner-les-maladies-cerebrales-107175

 

Interessant ça, imaginez un instant que ceci soit mis en relation avec les fameux logiciel GTO, aide à la décision etc. Ça ferait des ravage à la fois online et en live. 

Share this post


Link to post
Share on other sites

Si j'ai bien compris, l'IA a perdu, mais ils considèrent qu'elle a gagné en faisant un redressement des données.

Vue la forme de la courbe, j'aurais bien aimé un peu plus de mains jouées :

BB_Won_over_Hands_Played_for__PokerStars

Share this post


Link to post
Share on other sites
Posted (edited)

Le thread 2+2 a quand même pas mal de mains qui laissent songeur:

https://forumserver.twoplustwo.com/29/news-views-gossip/first-ai-beat-multiplayer-poker-game-vs-top-pros-like-chris-furgeson-darren-elias-1747396/

 

Particulièrement celle-ci, même si pour le coup il y a pas de HH:

"there is a hand SBvsBB where pluribus peels A4ss pre, flop JT7r, flop goes check check, turn Ad which puts a diamond draw, sb bets 3/4ish pot, pluribus calls, river Ac, sb bets 8bb into about 10bb, pluribus raises to 60bb, sb jams and pluribus calls, it’s a fairly signicant mistake"

 

edit: "Just so you guys know, the bot wasn't just running bad. It was -EV. No idea what kind of equity adjustments calculator the researchers used, but some guy converted all the hand histories into something PT4 could use and plugged it in."

Edited by Jack Kincaid

Share this post


Link to post
Share on other sites
Lire les 32 commentaires sur le forum
Les news à la Une
jeudi 22 août 2019 à 7:50
Télex

Le Winamax Poker Open prépare son retour au CityWest de Dublin du 23 au 29 septembre. Vous en connaissiez déjà le programme, les animations ou encore la mécanique qualificative. Les équipes de la room répondent à vos dernières questions dans leur traditionnelle FAQ, avec à la clé bon nombre d'astuces et de bons plans pour profiter au maximum de votre escapade irlandaise.

mercredi 21 août 2019 à 15:12
Télex

Parmi tous les clubs parisiens qui s'affairent en prévision de leur ouverture, c'est le Club Montmartre qui dégaine le premier ! Frédérique Ruggieri, la patronne de l'établissement, confirme l'information sur Facebook : rendez-vous vendredi à 19h pour découvrir le nouveau visage de cette adresse historiquement appréciée des joueurs de poker.

mardi 20 août 2019 à 14:53
Unibet DSO Gujan-Mestras : la rentrée des coverages Club Poker

Comme chaque année depuis six ans, le casino de Gujan-Mestras accueillera à compter de jeudi une étape du circuit Unibet DSO. En grande habituée du bassin d'Arcachon, FloFlo M. profitera de l'événement pour remettre de l'animation dans la section du forum dédiée aux coverages. Enfin une raison de se satisfaire de la fin des vacances !

lundi 19 août 2019 à 10:24
EPT Barcelone du 20 août au 1er septembre : la rentrée live de PokerStars

En attendant les Galactic Series pour la rentrée online, PokerStars lance à Barcelone une nouvelle saison de l'European Poker Tour. Une kyrielle de beaux tournois sont programmés en Catalogne, dont un Main Event à 5 300 € qui sera à suivre sur Twitch et YouTube à partir du 27 août... et évidemment sur Club Poker en compagnie de veunstyle !

lundi 19 août 2019 à 8:39
partypoker Millions Europe : Lukas Zaskodny vainqueur, Romain Lewis troisième

Romain Lewis n'a pas patienté jusqu'à l'EPT Barcelone pour organiser sa rentrée sur le circuit live : bien lui en a pris ! Le joueur du Team Winamax se hisse à Rozvadov à la troisième place du partypoker Millions Europe, avec à la clé un chèque de 428 000 €. Le Tchèque Lukas Zaskodny s'impose à domicile devant Josef Snejberg.

vendredi 16 août 2019 à 10:38
Aussie Millions : on ne change pas une formule qui gagne

En début d'année, l'Aussie Millions a atteint des sommets de fréquentation qui lui étaient jusqu'alors inconnus. Le festival australien a notamment retrouvé son attractivité d'antan auprès des acteurs de la scène high roller. Sans surprise, le Crown Casino misera donc sur la même formule en janvier 2020. À noter tout de même le retour au programme d'un alléchant 25 000 $ Pot Limit Omaha.

mardi 13 août 2019 à 14:27
The Stars Group : le poker relégué derrière les paris sportifs et les jeux de casino dans les revenus de l'entreprise

L'acquisition de Sky Betting & Gaming l'an dernier a renforcé une tendance déjà très marquée : le poker représente une part de plus en plus réduite des résultats financiers de The Stars Group, la maison-mère de PokerStars. Au second trimestre, les paris sportifs et les jeux de casino ont généré des revenus plus importants.

lundi 12 août 2019 à 9:03
Seminole Hard Rock Poker Open : Jason Mercier renoue avec la victoire

Moins présent sur le circuit live depuis la naissance de son fils il y a deux ans, Jason Mercier goûte à nouveau aux joies de la victoire. L'Américain s'impose au terme du 50 000 $ Super High Roller du Seminole Hard Rock Poker Open, avec à la clé un joli gain de 715 000 $. Le Belge Thomas Boivin se classe troisième de l'épreuve.

vendredi 9 août 2019 à 13:30
Télex

Vous reprendrez bien un peu de Vegas ? Pour tous les passionnés qui se lancent chaque été dans un pélerinage vers le Nevada, salette fait figure de guide à travers son calendrier des tournois ainsi que ses précieux conseils dans la section Destination Poker. L'heure est venue pour lui de dresser le bilan de son Vegas 2019... et déjà de se tourner vers son prochain voyage !

vendredi 9 août 2019 à 9:59
Triton Series London : le Main Event Short Deck pour Justin Bonomo

Détrôné par Bryn Kenney au sommet de la All Time Money List, Justin Bonomo ne ralentit pas pour autant sa collecte de millions. L'Américain vient de remporter, à Londres, le 100 000 £ Short Deck (108 entrées) des Triton Series pour un gain de 2,6 millions de livres. Son dauphin n'est nul autre que Wai Kin Yong, déjà à l'honneur en début de semaine.

Tournois gratuits et prix ajoutés

Le Club Poker organise des freerolls avec bonus et des tournois spéciaux avec ajouts de prix.
Pour en bénéficier gratuitement, inscrivez-vous sur nos sites de poker partenaires :

Tournois Club Poker
6-MAX
$2.20
Big Poker League
jeudi 29 août 2019 à 19:04
$125 ajoutés
Le chat joue au poker en ligne. Sisi.
Nouveau au poker ? Voici toutes les infos et réponses pratiques pour bien débuter et comprendre le poker en ligne.

Des tests complets et les bonus des poker rooms pour mieux choisir votre préférée.

Nos tournois, pour jouer entre nous, avec des prix et des cadeaux ajoutés chaque semaine.

Trouvez des infos pratiques et discutez sur le poker en ligne.

Pour les joueurs confirmés, apprenez à analyser vos mains au poker.