jeudi 16 février 2017 à 15:49

Dans un entretien auprès de Card Player, l'un des développeurs de Libratus estime que la machine "pourrait être capable de battre les humains à une table de six joueurs d'ici deux ans". Le championnat annuel de poker entre ordinateurs va d'ailleurs ajouter cette catégorie à ses compétitions.

Intelligence artificielle

Difficile de passer à côté du retentissement médiatique important de la victoire de Libratus ces deux dernières semaines ! La démonstration de force de l'intelligence artificielle à une table de poker a été examinée sous toutes les coutures, ou presque.

 

La presse spécialisée, d'abord, a souvent pris soin de minimiser l'impact que cette avancée scientifique est susceptible d'avoir sur nos parties de poker en ligne quotidiennes. Poker News Daily, par exemple, souligne à raison que les performances de Libratus n'auraient pas été possibles sans le concours d'un super-ordinateur aux coûts de fonctionnement exorbitants. Et d'ajouter que l'événement organisé à Pittsburgh, qui ne concernait que le format bien particulier du heads up, se distinguait en de nombreux points d'une partie lambda (compteurs remis à zéro après chaque main, délais de réflexion très longs accordés à la machine, arrêt systématique du coup dès l'engagement d'un tapis...).

 

La presse généraliste, elle, ne se soucie guère de ces considérations et s'efforce de voir plus loin. Le journaliste de The Guardian, par exemple, s'inquiète d'éventuelles dérives et appelle à un encadrement du développement de l'intelligence artificielle. D'autres titres se montrent plus optimistes et entrevoient des avancées médicales dans les progrès mis en exergue lors du match Brains vs AI. C'est le cas d'ExtremeTech qui, en relayant un article du Professeur Sandholm, évoque la possibilité de voir un jour les descendants de Libratus accompagner le corps humain dans sa lutte contre certains virus.

 

Le même Tuomas Sandholm est également à l'honneur d'un passionnant papier de Quartz, lequel dissèque Libratus et se penche sur les trois modules qui gouvernent sa prise de décision :

Le premier apprend la théorie et recherche des stratégies adaptées à toutes les situations. Le second est celui qui prend toutes les décisions durant une main. Et le troisième est mis à jour en permanence à travers l'enregistrement et l'analyse de chaque information nouvelle.

Alors que le rôle du premier module est simplement de savoir ce qui se passe à une table de poker, le second est en charge du caractère incertain qui découle de la main de l'adversaire. Le module 1 ressemble à toutes les autres intelligences artificielles : il apprend péniblement à travers la répétition des situations. Le module 2, lui, permet à Libratus d'appréhender l'inconnu.

Noam Brown et Tuomas Sandholm
Noam Brown et Tuomas Sandholm

Le lecteur apprend ainsi que le module 2 a la lourde tâche d'intégrer les décisions de l'adversaire à sa réflexion, d'affiner les ranges adversaires et in fine de prendre les décisions à la turn et à la river. Quant au module 3, présenté comme celui de l'apprentissage, il peut parfois lui aussi jouer un rôle crucial. Les développeurs lui attribuent par exemple la correction extrêmement rapide d'un leak identifié par les humains face à certains montants de mises bien précis.

 

Mais l'article le plus intéressant de la semaine, c'est peut-être cette interview de Noam Brown réalisée par Brian Pempus pour Card Player. L'autre moitié du duo Sandholm-Brown a joué un rôle important dans la transition de Claudico vers Libratus en passant par BabyTartanian8, champion ultra dominateur en janvier 2016 de la Computer Poker Competition annuelle. Dans cet entretien, l'homme revient sur le match du mois dernier et donne son sentiment sur les pistes de travail des mois à venir. Morceaux choisis :

Nous avons été surpris des résultats. Avant le match, nous avions testé Libratus contre les bots précédents. Il avait dominé Claudico avec une moyenne de gain de 10 à 12 blindes toutes les 100 mains. C'était un peu plus que les résultats obtenus par les humains en 2015. Nous pensions donc avoir un petit avantage, mais sans forcément nous attendre à une telle démonstration.

En réalité, nous n'avions pas pris la mesure de l'importance de certains détails qui avaient permis aux joueurs humains de l'emporter. Ils avaient identifié des faiblesses chez Claudico et les avaient exploitées. Par exemple, la stratégie de relance des limps de Claudico donnait d'excellents résultats et représentait une proportion significative de leurs gains. Ce qui fait que Libratus a dominé les joueurs, c'est que lui n'offrait aucune prise, aucune faiblesse exploitable par les humains.

Personne ne sait à quel point l'intelligence artificielle est aujourd'hui proche ou non de la stratégie GTO. Il y a bien des méthodes susceptibles de le mesurer, mais elles sont extrêmement coûteuses. Ces études n'ont pas encore été réalisées. C'est quelque chose que nous pourrions prévoir lors des mois à venir. Mais si je devais donner une estimation à la louche, je dirais qu'un bot maîtrisant à la perfection la stratégie GTO battrait Libratus à raison d'une moyenne de 15 blindes toutes les 100 mains. Tout cela reste toutefois très approximatif. La vérité se situe entre 5 et 50 blindes.

Il est difficile d'estimer à quel point Libratus est encore susceptible de s'améliorer. L'un des principaux défauts des précédents bots, c'est qu'ils n'intégraient pas les "blockers" dans leur réflexion à la turn et la river. C'est quelque chose qui est essentiel au plus haut niveau. Libratus ne connaît pas ce problème, ce qui représente un grand pas en avant. Il est aujourd'hui impossible de l'améliorer sur ce plan, mais d'autres chantiers existent. C'est par exemple le cas de sa stratégie de sizing.

Les overbets de Libratus nous ont vraiment surpris durant la compétition. Le logiciel n'avait jamais étudié une main disputée par un joueur humain. Il s'est donc présenté lors du premier jour avec une stratégie unique : celle dont il estimait qu'elle était la meilleure. Les gros overbets, mais aussi les donk bets, faisaient partie intégrante de cette stratégie. C'était à la fois impressionnant et enthousiasmant de le voir faire quelque chose de très différent des humains. Claudico montrait déjà les mêmes signes d'agressivité [mais] sa stratégie n'était pas équilibrée. Libratus a développé une stratégie agressive équilibrée, ce qui a été déterminant dans sa domination.

La recherche a déjà commencé pour les parties à trois joueurs. D'une manière générale, les techniques employées par Libratus fonctionnent aussi avec plus de deux joueurs. Le problème réside davantage dans la mesure de la performance. Avec plus de deux joueurs, vous pouvez jouer parfaitement d'un point de vue GTO mais perdre quand même à cause des interactions entre les autres joueurs. C'est pourquoi il est très difficile de déterminer si l'intelligence artificielle est supérieure à l'homme en organisant une partie entre un logiciel et cinq humains. [Par ailleurs] je pense que le format 6-max reste encore un poil au-dessus des aptitudes de Libratus et des autres bots.

Ceci étant dit, la compétition annuelle de poker entre ordinateurs va ajouter les parties à six joueurs à ses catégories, donc la recherche va s'accélérer et les bots vont s'améliorer. J'ai la conviction qu'avec quelques retouches sur Libratus, il serait capable de battre les humains en 6-max d'ici deux ans. Quand vous jouez à une table de six joueurs, il n'est pas acquis que vous ayez intérêt à jouer GTO. Il peut être plus intéressant de se focaliser sur l'exploitation des faiblesses de ses adversaires. C'est un débat qui existe dans notre communauté et la réponse reste en suspens. Aujourd'hui, les humains sont encore bien meilleurs que la machine pour exploiter les faiblesses des joueurs et en tirer profit.

Vos commentaires sur cette news dans le forum :
Intelligence artificielle : Libratus va travailler son jeu en 6-max
Cette news a suscité 322 commentaires, et seuls les 15 derniers sont affichés.

Posté (modifié)

 

Citation

La nécessité elle vient de maximiser son EV d'humain à humain, si je joue parfaitement une stratégie à un seul sizing je vais faire beaucoup plus de profit qu'essayer de copier Pio et ses 3 sizings (pour faire n'importe quoi au final).

This et c'est pareil pour la machine. Son interet c'est pas de jouer le meilleur coup dans telle situation, mais de remporter le plus possible d'argent à partir de l'ensemble de toutes ses mains. Si villain est un crétin total qui joue pour perdre. Libratus ira marger avec ses 72 aussi.

na0sh

je ne sais pas la fermer c'est un truc incroyable.

Modifié (le) par jou0eur

Partager ce message


Lien à poster
Partager sur d’autres sites

Posté (modifié)

J'arrive un peu après la bataille (une de mes grandes spécialités) et ai suivi toute cette histoire de loin.

 

Mon humble avis -  lequel n'a pas changé malgré ce résultat récent - est que les meilleurs joueurs feront encore pas mal de résistance face aux meilleurs programmes et autres bots en NL Holdem. Pour une raison essentielle : avant d'être un jeu de stratégie et un jeu mathématique, le NLHE est avant tout, surtout, d'abord et essentiellement un jeu mental et un jeu d'adaptation.

En d'autre terme, c'est un jeu où le QE (quotient émotionnel) est plus important encore que le QI, la puissance de calcul et autres capacités analytiques. C'est d'ailleurs, probablement, l'une des raisons pour lesquelles aucun des meilleurs joueurs d'échecs au monde n'a cartonné durablement au poker.

 

Ce qui fait la différence dans ce jeu de m.., pardon dans ce jeu si passionnant et populaire, c'est moins nos capacités stratégiques (lesquelles ne sont pas négligeables pour autant) que nos capacités d'adaptation et de résistance mentale. 

Pour schématiser, au poker, il vaut mieux être un stratège moyen avec un très bon mental qu'un très bon stratège avec un mental moyen. Sur le long terme, c'est le premier qui fera a différence. L'idéal étant évidemment d'être le meilleur possible dans les deux domaines...

Entre les meilleurs joueurs, ce qui fera la différence en terme de winrate, c'est tout ce qui a trait au metagame. Mais c'est aussi la résilience, la capacité à encaisser les coups durs, à jouer durablement son A game, à ne pas tilter.

 

Face à l'intelligence artificielle, l'homme n'a strictement aucune chance pour tout ce qui a trait à la puissance de calcul, l'aspect mathématique et stratégique du jeu. Idem en ce qui concerne la résilience et la capacité à jouer son A game en permanence.

L'IA est un monstre froid qui ne connaît pas le tilt, ne ressent pas la frustration, l'impatience, l'injustice et qui ne sera jamais agacé par sa copine parce qu'elle lui a demandé de descendre acheter une baguette juste après avoir pris dans la face un énorme bad beat. Bref, l'ordi lui, joue toujours à son meilleur niveau possible et ne commet a priori pas d'erreurs de calculs.

 

Manque de bol pour nos amis les microprocesseurs (et heureusement pour nous), il y a un domaine où l'humain conserve encore un assez net avantage. Cerise sur le gâteau, c'est sans doute, avec la résilience, la qualité la plus importante au poker. On appelle cela L'EMPATHIE. Dans ce domaine,  tous les meilleurs superordinateurs de la planète ont encore pas mal de progrès à faire.

Le jour où une IA pourra faire preuve de la même capacité d'adaptation, de la même créativité, de la même capacité à se mettre à la place d'autrui ou à optimiser le metagame, ce sera fini du genre humain. Ce n'est pas encore le cas. Car ce qui fait la force de l'ordi au poker est aussi sa faiblesse : l'ordi n'a pas de sentiments, il ne ressent rien.

Pour le dire autrement, le jour où une Intelligence Artificielle aura un sens de l'humour supérieur aux homo sapiens les plus drôles (Anne Roumanoff par exemple), les joueurs de poker pros onlines pourront illico changer de boulot ou bifurquer vers les cercles et autres casinos...

 

S'agissant plus précisément de ce duel Libratus-humains, il me semble quand même très discutable.  Pour au moins trois raisons :

 

1/ D'après ce que j'ai pu comprendre, Libratus met trois plombes à jouer. Apparemment, il lui arrivait de réfléchir plusieurs minutes avant de prendre sa décision. C'est juste grotesque et je me demande bien comment on a pu accepter cela ! Cela ne correspond absolument pas au rythme de jeu tel qu'il existe online où qu'un type normalement constitué peut encaisser sans que ça n'entame sa concentration et donc son A-Game.

Perso, si j'affronte un fish qui tank une minute preflop, puis une minute au flop, à la turn et à la river, je vais sit out au bout de trois mains. Ou alors, il faut vraiment que ce soit la quiche du siècle et qu'il y ait pas mal de pepettes en jeu !

 

Vous en connaissez beaucoup vous des joueurs normalement constitués capables d'accepter un rythme de jeu aussi lent sans allumer leur télé pour foutre Columbo sur TV Breizh, sans lire l'Equipe et leurs mails en même temps, tout en ouvrant Pornhub dans une petit fenêtre, histoire d'installer une petite ambiance tamisée dans la pièce ??!! Bref, sans perdre le fil du jeu et se concentrer sur autre chose...

Pour moi, même le supplice de Tantale ou un concert live de la Castafiore ressemble à une aimable plaisanterie comparés aux conditions de jeu qu'on dû se coltiner nos quatre cobayes.

 

2/ Y a un autres gros problème dans cette histoire. C'est que notre Libratus se faisait visiblement aider tous les soirs par des joueurs de poker en chair et  en os pour l'aider à résoudre ses faiblesses et à mieux s'adapter. Ce qui du coup fausse complètement le duel. Ce n'est plus un duel entre l'homme et la machine mais plutôt entre l'homme et la machine aidée par l'homme. Ce n'est plus du tout pareil !

 

3/ J'ai tout de même un gros doute sur le fait que les quatre joueurs sélectionnés fassent parties de la crème de la crème en HU. Le poker a ceci de singulier par rapport aux autres sports ou jeux : un débutant peut battre le meilleur joueur du monde (sur le court terme). Et les meilleurs joueurs ne sont pas forcément les plus célèbres ou les plus médiatisés...

 

Enfin, pour nuancer encore un peu plus le résultat final : un humain donnera plus facilement le meilleur de lui-même et jouera plus aisément son A-game en risquant son propre argent plutôt qu'en play money... Jouer au poker en play money, c'est un peu comme jouer au golf sans trou ou au tennis sans filet. On enlève un élément fondamental du jeu... et pas mal d'intérêt du coup.

 

Pour conclure ce pavé indigeste, il me semble que 5 conditions devraient a minima être réunies pour que ce type de duel soit crédible et représentatif :

1/ L'ordi doit adopter un rythme de jeu équivalent à ce qui se pratique habituellement online. Quelques secondes par coup, avec possibilité d'utiliser ponctuellement le timer.

2/ Aucune aide humaine extérieure pour l'IA.

3/ Idéalement, un duel sur 500 000 mains (comme le détaille ALex Luneau dans un récent et excellent article, la variance peu être énorme, même sur 100 000 mains...

https://www.winamax.fr/blog_team_blog-pour-une-saine-approche-de-la-variance-30072?param=blog-pour-une-saine-approche-de-la-variance-30072). Le tout face à 10 joueurs pour avoir un sample plus significatif. Et des temps de jeu raisonnables pour que ce soit supportable pour un humain.

4/ On joue 100 BB deep au départ, la profondeur de base online. Si le jeu devient trop deep (par ex 500 BB), on ouvre une nouvelle table. Les meilleurs humains ont une connaissance stratégique bien plus limitée du jeu ultra deep car ils le pratiquent rarement.

5/ On choisit les meilleurs winrates onlines en NL2000 ou NL1000 pour sélectionner les meilleurs joueurs humains. Ce qui était plus aisé du temps où feu PokerTableRatings  sévissait encore. Mais bon, peut-être que les rooms ont ça en magasin...

 

Bon, je vous laisse, de toute façon tout le monde s'en fout et Columbo va commencer.

 

PS : pour Anne Roumanoff, c'était censé être de l'humour...

 

 

 

 

 

Modifié (le) par mizar2001

Partager ce message


Lien à poster
Partager sur d’autres sites

Posté (modifié)

Il y a 2 heures, mizar2001 a écrit :

Mon humble avis -  lequel n'a pas changé malgré ce résultat récent - est que les meilleurs joueurs feront encore pas mal de résistance face aux meilleurs programmes et autres bots en NL Holdem. Pour une raison essentielle : avant d'être un jeu de stratégie et un jeu mathématique, le NLHE est avant tout, surtout, d'abord et essentiellement un jeu mental et un jeu d'adaptation.

En d'autre terme, c'est un jeu où le QE (quotient émotionnel) est plus important encore que le QI, la puissance de calcul et autres capacités analytiques. C'est d'ailleurs, probablement, l'une des raisons pour lesquelles aucun des meilleurs joueurs d'échecs au monde n'a cartonné durablement au poker.

Pas du tout d'accord. En fait je crois que les humains sont tellement loin d'être techniquement parfait au poker, que pendant longtemps c'est le mental qui a primé. Les top players en CG HU étaient ceux qui géraient le mieux la metagame, le tilt etc... Et petit à petit la tendance s'est inversée et maintenant la majorité des joueurs considérés comme top players ont une approche très GTO dans laquelle le but n'est pas de s'adapter mais juste d'être techniquement le meilleur possible.

Et justement si un bot sans émotions peut crush des top players c'est bien qu'en réalité ça n'a pas d'importance quand on est techniquement proche de la perfection.

 

Il y a 2 heures, mizar2001 a écrit :

2/ Y a un autres gros problème dans cette histoire. C'est que notre Libratus se faisait visiblement aider tous les soirs par des joueurs de poker en chair et  en os pour l'aider à résoudre ses faiblesses et à mieux s'adapter. Ce qui du coup fausse complètement le duel. Ce n'est plus un duel entre l'homme et la machine mais plutôt entre l'homme et la machine aidée par l'homme. Ce n'est plus du tout pareil !

Non, il ne se faisait pas aider par des joueurs de poker. C'est Noam Brown le créateur du bot qui travaillait dessus le soir. C'est un doctorant en théorie des jeux, même pas sûr qu'il batte la NL2 online.

Je trouve ça aussi un peu spécial que le bot puisse être changé en cours de partie. Ca me paraitrait plus éthique qu'il reste le même du début à la fin, quitte à la implémenter des capacités d'auto-modification. Mais je crois pas non plus que ce soit scandaleux... Les humains eux-aussi ont eu de l'aide extérieure (sessions avec d'autres top players etc...).

 

Il y a 2 heures, mizar2001 a écrit :

3/ J'ai tout de même un gros doute sur le fait que les quatre joueurs sélectionnés fassent parties de la crème de la crème en HU. Le poker a ceci de singulier par rapport aux autres sports ou jeux : un débutant peut battre le meilleur joueur du monde (sur le court terme). Et les meilleurs joueurs ne sont pas forcément les plus célèbres ou les plus médiatisés...

Ces 4 là ne sont pas du tout les plus célèbres ou les plus médiatisés... Justement ils ont le profil inverse. Et quand des mecs qui font autorité comme Galfond ou Doug Polk viennent également confirmer que ce sont 4 top players HU, je pense que c'est largement suffisant pour qu'il n'y ait plus vraiment débat.

 

 

Conclusion : J'étais à fond pour les humains lors de ce match, et moi aussi je trouve que les conditions de jeu étaient vraiment pas idéales. Mais faut pas oublier que les mecs qui ont organisé ça à la base ce sont pas des joueurs de poker... ce sont des universitaires, chercheurs en théorie des jeux qui connaissent pas tout ce monde. Et franchement je trouve que dans l'ensemble leurs 2 challenges (Claudico et Libratus) étaient bien faits. Ils ont choisis 4 vrais top players (pas comme les chercheurs de l'université d'Alberta), ils ont proposé du streaming... Et à la fin le résultat est sans appel. Du 15bb/100 sur 120.000 mains avec du duplicate poker (ce qui réduit énormément la variance), il y a juste pas photo.

 

Dans tous les jeux, échecs, backgammon, go, poker, il y a une période où l'humain est clairement meilleur, puis une transition et l'IA devient plus compétente. Aujourd'hui c'est clair et net que l'IA est devenue plus compétente que l'humain en CG HU NLHE. Félicitations à l'équipe de Carnegie Mellon :)

Modifié (le) par Pad

Partager ce message


Lien à poster
Partager sur d’autres sites

Posté (modifié)

Il est normal que les humains que nous sommes soient dans un premier temps excités puis aigris. Puis on fini par assumer que ces machines sont encore bien bêtes. Ce qui mène peu après à se rendre compte qu'elles pourraient réellement améliorer nos vies.

Modifié (le) par jou0eur

Partager ce message


Lien à poster
Partager sur d’autres sites
à l’instant, Pad a écrit :
Il y a 2 heures, mizar2001 a écrit :

2/ Y a un autres gros problème dans cette histoire. C'est que notre Libratus se faisait visiblement aider tous les soirs par des joueurs de poker en chair et  en os pour l'aider à résoudre ses faiblesses et à mieux s'adapter. Ce qui du coup fausse complètement le duel. Ce n'est plus un duel entre l'homme et la machine mais plutôt entre l'homme et la machine aidée par l'homme. Ce n'est plus du tout pareil !

Non, il ne se faisait pas aider par des joueurs de poker. C'est Noam Brown le créateur du bot qui travaillait dessus le soir. C'est un doctorant en théorie des jeux, même pas sûr qu'il batte la NL2 online.

Je trouve ça aussi un peu spécial que le bot puisse être changé en cours de partie. Ca me paraitrait plus éthique qu'il reste le même du début à la fin, quitte à la implémenter des capacités d'auto-modification. Mais je crois pas non plus que ce soit scandaleux... Les humains eux-aussi ont eu de l'aide extérieure (sessions avec d'autres top players etc...).

De ce que j'ai compris personne n'a touche au bot entre les sessions, c'est le bot lui-meme qui analysait la partie et adjustais sa strategie. Le bot a la base a juste appris les regles du jeu, il a simule XXXXXXX parties et appris par experience et apres chaque session il a analyse comment jouer son/ses adversaires pour adjuster

Partager ce message


Lien à poster
Partager sur d’autres sites

Une des applications possibles de l'algo á la based de Libratus: prévenir une épidémie de grippe en designant des smart drugs 

https://www.extremetech.com/extreme/244057-how-a-poker-playing-ai-could-help-prevent-your-next-bout-of-the-flu

Quote

What does this have to do with health care and the flu? Think of disease as a game between strategic entities. Picture a virus as one player, a player with a certain set of attack and defense strategies. When the virus encounters your body, a game ensues, in which your body defends with its own strategies and hopefully prevails. This game has been going on a long time, with humans having only a marginal ability to control the outcome. Our body’s natural defenses have been developed in evolutionary time, and thus have a limited ability to make on the fly adaptations.

But what if we could recruit computers to be our allies in this game against viruses? And what if the same reasoning ability that allowed Libratus to prevail over the best poker minds in the world could tackle how to defeat a virus or a bacterial infection? This is in fact the subject of a compelling research paper by Toumas Sandholm, the designer of the Libratus algorithm. In it, he explains at length how an AI algorithm could be used for drug design and disease prevention

 

Partager ce message


Lien à poster
Partager sur d’autres sites

Posté (modifié)

Le 06/02/2017 à 16:45, HugoBoss a écrit :

Pourquoi est-ce que ce board "nécessite" plusieurs sizings si l'application correcte de la stratégie théorique optimale est impossible pour un humain ?

Même si le GTO demande 3 sizings dans plein de situations, c'est pas pour autant qu'on doit s'efforcer de suivre ses préceptes si ça implique qu'on joue encore moins bien qu'avec un sizing au final.

La nécessité elle vient de maximiser son EV d'humain à humain, si je joue parfaitement une stratégie à un seul sizing je vais faire beaucoup plus de profit qu'essayer de copier Pio et ses 3 sizings (pour faire n'importe quoi au final).

A cause du pavé insipide et totalement ininterressant de mizar vous êtes passé à coté de cette intervention qui est tout à fait juste 

Modifié (le) par Prout

Partager ce message


Lien à poster
Partager sur d’autres sites

Libratus met 15 BB/1000 au top des joueurs HU, ce n'est qu'un début, on peut imaginer 20-30-40... , 

Plus on monte de niveau et moins les humains on d'edge sur leurs contemporains, est-ce du à une espèce de mimétisme qui fait qu'on se cale sur ce qui se fait et tout le monde finit par jouer peu ou prou de la même façon  et personne ne cherche à sortir du cadre ou est on proche des limites humaines? 

Si mon propos n'est pas clair, à une époque tout le monde sautait sur le ventre et en sautant sur le dos on a gagné dix bons cm , bref est qu'un joueur de poker qui sauterait sur le dos gagnerait 15 bb/100 en

high stake?

Partager ce message


Lien à poster
Partager sur d’autres sites

Le problème c'est que l'intelligence artificielle évolue plus vite que nous, pourquoi travailler d'arrache-pied pour s'améliorer si des bots crush déjà tout : autant avoir une dream machine à notre disposition pour nous donner la solution de chaque coup.

Et quand on sera à ce stade là, on sera proche de la fin du online.

Partager ce message


Lien à poster
Partager sur d’autres sites
7 hours ago, letacot said:

Libratus met 15 BB/1000 au top des joueurs HU, ce n'est qu'un début, on peut imaginer 20-30-40... , 

Plus on monte de niveau et moins les humains on d'edge sur leurs contemporains, est-ce du à une espèce de mimétisme qui fait qu'on se cale sur ce qui se fait et tout le monde finit par jouer peu ou prou de la même façon  et personne ne cherche à sortir du cadre ou est on proche des limites humaines? 

Si mon propos n'est pas clair, à une époque tout le monde sautait sur le ventre et en sautant sur le dos on a gagné dix bons cm , bref est qu'un joueur de poker qui sauterait sur le dos gagnerait 15 bb/100 en

high stake?

Durant et après le challenge, les brains ont pointé que dans la stratégie de Libratus, il y avait, pour chaque action beaucoup de sizings différents, là où la plupart n'en ont qu'un ou deux (genre over-bet river et un sizing standard pour le reste). Ca a l'air de faire une assez grosse différence (faudrait voir l'edge qu'aurait une IA avec juste un ou deux sizing possibles), mais c'est aussi visiblement extrèmement difficile voire impossible à implanter pour un humain (sans dream machine obv).

C'est déjà pas si évident pour un humain de gérer des trucs pratiques simples genre "dans ce spot je dois fold 30% du temps et call 70% du temps". Si à chaque bet, tu as 10 sizings possibles avec chacun une certaine probabilité, bon courage. Et encore, je dis 10 sizings, mais j'imagine que si un jour on arrive à résoudre le GTO sans approximation, on aurait un continuum de sizings et pas un ensemble discret de sizings possibles...

Donc je pense qu'on est vraiment proche des limites humaines. T'as quand même sans doute raison avec le mimétisme. Pendant des années, y'a eu des choses qui n'étaient jamais envisagées parce qu'elles étaient supposées mauvaises jusqu'à ce que quelqu'un regarde de plus près et se rende compte qu'il y avait de très bonnes raisons de le faire (genre les overbets, peut-être ?). Mais j'ai confiance qu'il y a toujours de bons gros geeks prêts à bosser suffisamment travailler leur jeu et sortir des sentiers battus pour battre ça.

Partager ce message


Lien à poster
Partager sur d’autres sites

Bonjour,

Je bataille avec google depuis 1heure pour voir les fameux HU...

Quelqu'un a un lien pour regardé ça ? Ça m’intéresse vraiment. C'est dingue que les vidéos ne soit pas disponible T_T...

Partager ce message


Lien à poster
Partager sur d’autres sites
Lire les 322 commentaires sur le forum
Les news à la Une
vendredi 26 mai 2017 à 9:48
HOT !
Las Vegas : le dossier indispensable pour préparer votre séjour

Alors que le premier Shuffle Up and Deal de la 48e édition des World Series Of Poker est annoncé pour ce mercredi 31 mai, des dizaines de CPistes fourbissent leurs armes. À l'attention de tous ces hommes qui s'apprêtent à traverser l'Atlantique pour conquérir le Graal du joueur de poker, salette a constitué un dossier très complet. Le couteau suisse ultime du chasseur de bracelets !

mardi 23 mai 2017 à 5:25
Télex

693 inscrits à 10 300 $, un premier prix de 1,35 million de dollars : les chiffres du Main Event des SCOOP de PokerStars.com donnent le tournis. La nuit prochaine, neuf joueurs tenteront de s'adjuger ce qui reste l'un des tournois les plus convoités de l'année. Parmi eux, des serial perfeurs comme le Finlandais Samuel "€urop€an" Vousden et le Norvégien Ola "Odd Oddsen" Amundsgaard.

vendredi 19 mai 2017 à 10:52
Télex

Comanche et ShiShi vous donnent rendez-vous ce vendredi et ce samedi, aux alentours de 20h (heure française), pour l'enregistrement de deux émissions qui devraient voir se succéder au micro les grandes figures du Sismix 2017. À savourer en direct ou dès le lendemain en podcast !

jeudi 18 mai 2017 à 17:00
Futur programme de fidélité de PokerStars : des coffres et des récompenses aléatoires

Depuis plus d'un an, Clash Royale décline avec succès le principe du gacha japonais. PokerStars s'apprête à emprunter la même voie puisque son futur programme de fidélité offrira des coffres contenant des récompenses aléatoires. Lancement prévu au Danemark dès la semaine prochaine, avant un déploiement dans les autres marchés plus tard cet été.

mardi 16 mai 2017 à 12:58
Télex

Vous êtes en partance pour le Sismix ? Voici votre compagnon de voyage idéal ! La nouvelle appli mobile de la room au W, Winamax Live, est disponible sur App Store et Google Play. Programmation poker des événements live, agenda des animations et même bientôt news et coverages : vous vous demanderez bientôt comment vous avez pu vivre sans.

Tournois gratuits et prix ajoutés

Le Club Poker organise des freerolls avec bonus et des tournois spéciaux avec ajouts de prix.
Pour en bénéficier gratuitement, inscrivez-vous sur nos sites de poker partenaires :

Tournois Club Poker
6-MAX
$2.20
mercredi 31 mai 2017 à 19:04
$125 ajoutés
6-MAX
$2.20
mercredi 7 juin 2017 à 19:04
$125 ajoutés
6-MAX
$2.20
mercredi 14 juin 2017 à 19:04
$125 ajoutés
6-MAX
$2.20
mercredi 21 juin 2017 à 19:04
$125 ajoutés
6-MAX
$2.20
mercredi 28 juin 2017 à 19:04
$125 ajoutés
Le chat joue au poker en ligne. Sisi.
Nouveau au poker ? Voici toutes les infos et réponses pratiques pour bien débuter et comprendre le poker en ligne.

Des tests complets et les bonus des poker rooms pour mieux choisir votre préférée.

Nos tournois, pour jouer entre nous, avec des prix et des cadeaux ajoutés chaque semaine.

Trouvez des infos pratiques et discutez sur le poker en ligne.

Pour les joueurs confirmés, apprenez à analyser vos mains au poker.