jeudi 16 février 2017 à 15:49

Dans un entretien auprès de Card Player, l'un des développeurs de Libratus estime que la machine "pourrait être capable de battre les humains à une table de six joueurs d'ici deux ans". Le championnat annuel de poker entre ordinateurs va d'ailleurs ajouter cette catégorie à ses compétitions.

Intelligence artificielle

Difficile de passer à côté du retentissement médiatique important de la victoire de Libratus ces deux dernières semaines ! La démonstration de force de l'intelligence artificielle à une table de poker a été examinée sous toutes les coutures, ou presque.

 

La presse spécialisée, d'abord, a souvent pris soin de minimiser l'impact que cette avancée scientifique est susceptible d'avoir sur nos parties de poker en ligne quotidiennes. Poker News Daily, par exemple, souligne à raison que les performances de Libratus n'auraient pas été possibles sans le concours d'un super-ordinateur aux coûts de fonctionnement exorbitants. Et d'ajouter que l'événement organisé à Pittsburgh, qui ne concernait que le format bien particulier du heads up, se distinguait en de nombreux points d'une partie lambda (compteurs remis à zéro après chaque main, délais de réflexion très longs accordés à la machine, arrêt systématique du coup dès l'engagement d'un tapis...).

 

La presse généraliste, elle, ne se soucie guère de ces considérations et s'efforce de voir plus loin. Le journaliste de The Guardian, par exemple, s'inquiète d'éventuelles dérives et appelle à un encadrement du développement de l'intelligence artificielle. D'autres titres se montrent plus optimistes et entrevoient des avancées médicales dans les progrès mis en exergue lors du match Brains vs AI. C'est le cas d'ExtremeTech qui, en relayant un article du Professeur Sandholm, évoque la possibilité de voir un jour les descendants de Libratus accompagner le corps humain dans sa lutte contre certains virus.

 

Le même Tuomas Sandholm est également à l'honneur d'un passionnant papier de Quartz, lequel dissèque Libratus et se penche sur les trois modules qui gouvernent sa prise de décision :

Le premier apprend la théorie et recherche des stratégies adaptées à toutes les situations. Le second est celui qui prend toutes les décisions durant une main. Et le troisième est mis à jour en permanence à travers l'enregistrement et l'analyse de chaque information nouvelle.

Alors que le rôle du premier module est simplement de savoir ce qui se passe à une table de poker, le second est en charge du caractère incertain qui découle de la main de l'adversaire. Le module 1 ressemble à toutes les autres intelligences artificielles : il apprend péniblement à travers la répétition des situations. Le module 2, lui, permet à Libratus d'appréhender l'inconnu.

Noam Brown et Tuomas Sandholm
Noam Brown et Tuomas Sandholm

Le lecteur apprend ainsi que le module 2 a la lourde tâche d'intégrer les décisions de l'adversaire à sa réflexion, d'affiner les ranges adversaires et in fine de prendre les décisions à la turn et à la river. Quant au module 3, présenté comme celui de l'apprentissage, il peut parfois lui aussi jouer un rôle crucial. Les développeurs lui attribuent par exemple la correction extrêmement rapide d'un leak identifié par les humains face à certains montants de mises bien précis.

 

Mais l'article le plus intéressant de la semaine, c'est peut-être cette interview de Noam Brown réalisée par Brian Pempus pour Card Player. L'autre moitié du duo Sandholm-Brown a joué un rôle important dans la transition de Claudico vers Libratus en passant par BabyTartanian8, champion ultra dominateur en janvier 2016 de la Computer Poker Competition annuelle. Dans cet entretien, l'homme revient sur le match du mois dernier et donne son sentiment sur les pistes de travail des mois à venir. Morceaux choisis :

Nous avons été surpris des résultats. Avant le match, nous avions testé Libratus contre les bots précédents. Il avait dominé Claudico avec une moyenne de gain de 10 à 12 blindes toutes les 100 mains. C'était un peu plus que les résultats obtenus par les humains en 2015. Nous pensions donc avoir un petit avantage, mais sans forcément nous attendre à une telle démonstration.

En réalité, nous n'avions pas pris la mesure de l'importance de certains détails qui avaient permis aux joueurs humains de l'emporter. Ils avaient identifié des faiblesses chez Claudico et les avaient exploitées. Par exemple, la stratégie de relance des limps de Claudico donnait d'excellents résultats et représentait une proportion significative de leurs gains. Ce qui fait que Libratus a dominé les joueurs, c'est que lui n'offrait aucune prise, aucune faiblesse exploitable par les humains.

Personne ne sait à quel point l'intelligence artificielle est aujourd'hui proche ou non de la stratégie GTO. Il y a bien des méthodes susceptibles de le mesurer, mais elles sont extrêmement coûteuses. Ces études n'ont pas encore été réalisées. C'est quelque chose que nous pourrions prévoir lors des mois à venir. Mais si je devais donner une estimation à la louche, je dirais qu'un bot maîtrisant à la perfection la stratégie GTO battrait Libratus à raison d'une moyenne de 15 blindes toutes les 100 mains. Tout cela reste toutefois très approximatif. La vérité se situe entre 5 et 50 blindes.

Il est difficile d'estimer à quel point Libratus est encore susceptible de s'améliorer. L'un des principaux défauts des précédents bots, c'est qu'ils n'intégraient pas les "blockers" dans leur réflexion à la turn et la river. C'est quelque chose qui est essentiel au plus haut niveau. Libratus ne connaît pas ce problème, ce qui représente un grand pas en avant. Il est aujourd'hui impossible de l'améliorer sur ce plan, mais d'autres chantiers existent. C'est par exemple le cas de sa stratégie de sizing.

Les overbets de Libratus nous ont vraiment surpris durant la compétition. Le logiciel n'avait jamais étudié une main disputée par un joueur humain. Il s'est donc présenté lors du premier jour avec une stratégie unique : celle dont il estimait qu'elle était la meilleure. Les gros overbets, mais aussi les donk bets, faisaient partie intégrante de cette stratégie. C'était à la fois impressionnant et enthousiasmant de le voir faire quelque chose de très différent des humains. Claudico montrait déjà les mêmes signes d'agressivité [mais] sa stratégie n'était pas équilibrée. Libratus a développé une stratégie agressive équilibrée, ce qui a été déterminant dans sa domination.

La recherche a déjà commencé pour les parties à trois joueurs. D'une manière générale, les techniques employées par Libratus fonctionnent aussi avec plus de deux joueurs. Le problème réside davantage dans la mesure de la performance. Avec plus de deux joueurs, vous pouvez jouer parfaitement d'un point de vue GTO mais perdre quand même à cause des interactions entre les autres joueurs. C'est pourquoi il est très difficile de déterminer si l'intelligence artificielle est supérieure à l'homme en organisant une partie entre un logiciel et cinq humains. [Par ailleurs] je pense que le format 6-max reste encore un poil au-dessus des aptitudes de Libratus et des autres bots.

Ceci étant dit, la compétition annuelle de poker entre ordinateurs va ajouter les parties à six joueurs à ses catégories, donc la recherche va s'accélérer et les bots vont s'améliorer. J'ai la conviction qu'avec quelques retouches sur Libratus, il serait capable de battre les humains en 6-max d'ici deux ans. Quand vous jouez à une table de six joueurs, il n'est pas acquis que vous ayez intérêt à jouer GTO. Il peut être plus intéressant de se focaliser sur l'exploitation des faiblesses de ses adversaires. C'est un débat qui existe dans notre communauté et la réponse reste en suspens. Aujourd'hui, les humains sont encore bien meilleurs que la machine pour exploiter les faiblesses des joueurs et en tirer profit.

Vos commentaires sur cette news dans le forum :
Intelligence artificielle : Libratus va travailler son jeu en 6-max
Cette news a suscité 323 commentaires, et seuls les 15 derniers sont affichés.
Posté (modifié)

J'arrive un peu après la bataille (une de mes grandes spécialités) et ai suivi toute cette histoire de loin.

 

Mon humble avis -  lequel n'a pas changé malgré ce résultat récent - est que les meilleurs joueurs feront encore pas mal de résistance face aux meilleurs programmes et autres bots en NL Holdem. Pour une raison essentielle : avant d'être un jeu de stratégie et un jeu mathématique, le NLHE est avant tout, surtout, d'abord et essentiellement un jeu mental et un jeu d'adaptation.

En d'autre terme, c'est un jeu où le QE (quotient émotionnel) est plus important encore que le QI, la puissance de calcul et autres capacités analytiques. C'est d'ailleurs, probablement, l'une des raisons pour lesquelles aucun des meilleurs joueurs d'échecs au monde n'a cartonné durablement au poker.

 

Ce qui fait la différence dans ce jeu de m.., pardon dans ce jeu si passionnant et populaire, c'est moins nos capacités stratégiques (lesquelles ne sont pas négligeables pour autant) que nos capacités d'adaptation et de résistance mentale. 

Pour schématiser, au poker, il vaut mieux être un stratège moyen avec un très bon mental qu'un très bon stratège avec un mental moyen. Sur le long terme, c'est le premier qui fera a différence. L'idéal étant évidemment d'être le meilleur possible dans les deux domaines...

Entre les meilleurs joueurs, ce qui fera la différence en terme de winrate, c'est tout ce qui a trait au metagame. Mais c'est aussi la résilience, la capacité à encaisser les coups durs, à jouer durablement son A game, à ne pas tilter.

 

Face à l'intelligence artificielle, l'homme n'a strictement aucune chance pour tout ce qui a trait à la puissance de calcul, l'aspect mathématique et stratégique du jeu. Idem en ce qui concerne la résilience et la capacité à jouer son A game en permanence.

L'IA est un monstre froid qui ne connaît pas le tilt, ne ressent pas la frustration, l'impatience, l'injustice et qui ne sera jamais agacé par sa copine parce qu'elle lui a demandé de descendre acheter une baguette juste après avoir pris dans la face un énorme bad beat. Bref, l'ordi lui, joue toujours à son meilleur niveau possible et ne commet a priori pas d'erreurs de calculs.

 

Manque de bol pour nos amis les microprocesseurs (et heureusement pour nous), il y a un domaine où l'humain conserve encore un assez net avantage. Cerise sur le gâteau, c'est sans doute, avec la résilience, la qualité la plus importante au poker. On appelle cela L'EMPATHIE. Dans ce domaine,  tous les meilleurs superordinateurs de la planète ont encore pas mal de progrès à faire.

Le jour où une IA pourra faire preuve de la même capacité d'adaptation, de la même créativité, de la même capacité à se mettre à la place d'autrui ou à optimiser le metagame, ce sera fini du genre humain. Ce n'est pas encore le cas. Car ce qui fait la force de l'ordi au poker est aussi sa faiblesse : l'ordi n'a pas de sentiments, il ne ressent rien.

Pour le dire autrement, le jour où une Intelligence Artificielle aura un sens de l'humour supérieur aux homo sapiens les plus drôles (Anne Roumanoff par exemple), les joueurs de poker pros onlines pourront illico changer de boulot ou bifurquer vers les cercles et autres casinos...

 

S'agissant plus précisément de ce duel Libratus-humains, il me semble quand même très discutable.  Pour au moins trois raisons :

 

1/ D'après ce que j'ai pu comprendre, Libratus met trois plombes à jouer. Apparemment, il lui arrivait de réfléchir plusieurs minutes avant de prendre sa décision. C'est juste grotesque et je me demande bien comment on a pu accepter cela ! Cela ne correspond absolument pas au rythme de jeu tel qu'il existe online où qu'un type normalement constitué peut encaisser sans que ça n'entame sa concentration et donc son A-Game.

Perso, si j'affronte un fish qui tank une minute preflop, puis une minute au flop, à la turn et à la river, je vais sit out au bout de trois mains. Ou alors, il faut vraiment que ce soit la quiche du siècle et qu'il y ait pas mal de pepettes en jeu !

 

Vous en connaissez beaucoup vous des joueurs normalement constitués capables d'accepter un rythme de jeu aussi lent sans allumer leur télé pour foutre Columbo sur TV Breizh, sans lire l'Equipe et leurs mails en même temps, tout en ouvrant Pornhub dans une petit fenêtre, histoire d'installer une petite ambiance tamisée dans la pièce ??!! Bref, sans perdre le fil du jeu et se concentrer sur autre chose...

Pour moi, même le supplice de Tantale ou un concert live de la Castafiore ressemble à une aimable plaisanterie comparés aux conditions de jeu qu'on dû se coltiner nos quatre cobayes.

 

2/ Y a un autres gros problème dans cette histoire. C'est que notre Libratus se faisait visiblement aider tous les soirs par des joueurs de poker en chair et  en os pour l'aider à résoudre ses faiblesses et à mieux s'adapter. Ce qui du coup fausse complètement le duel. Ce n'est plus un duel entre l'homme et la machine mais plutôt entre l'homme et la machine aidée par l'homme. Ce n'est plus du tout pareil !

 

3/ J'ai tout de même un gros doute sur le fait que les quatre joueurs sélectionnés fassent parties de la crème de la crème en HU. Le poker a ceci de singulier par rapport aux autres sports ou jeux : un débutant peut battre le meilleur joueur du monde (sur le court terme). Et les meilleurs joueurs ne sont pas forcément les plus célèbres ou les plus médiatisés...

 

Enfin, pour nuancer encore un peu plus le résultat final : un humain donnera plus facilement le meilleur de lui-même et jouera plus aisément son A-game en risquant son propre argent plutôt qu'en play money... Jouer au poker en play money, c'est un peu comme jouer au golf sans trou ou au tennis sans filet. On enlève un élément fondamental du jeu... et pas mal d'intérêt du coup.

 

Pour conclure ce pavé indigeste, il me semble que 5 conditions devraient a minima être réunies pour que ce type de duel soit crédible et représentatif :

1/ L'ordi doit adopter un rythme de jeu équivalent à ce qui se pratique habituellement online. Quelques secondes par coup, avec possibilité d'utiliser ponctuellement le timer.

2/ Aucune aide humaine extérieure pour l'IA.

3/ Idéalement, un duel sur 500 000 mains (comme le détaille ALex Luneau dans un récent et excellent article, la variance peu être énorme, même sur 100 000 mains...

https://www.winamax.fr/blog_team_blog-pour-une-saine-approche-de-la-variance-30072?param=blog-pour-une-saine-approche-de-la-variance-30072). Le tout face à 10 joueurs pour avoir un sample plus significatif. Et des temps de jeu raisonnables pour que ce soit supportable pour un humain.

4/ On joue 100 BB deep au départ, la profondeur de base online. Si le jeu devient trop deep (par ex 500 BB), on ouvre une nouvelle table. Les meilleurs humains ont une connaissance stratégique bien plus limitée du jeu ultra deep car ils le pratiquent rarement.

5/ On choisit les meilleurs winrates onlines en NL2000 ou NL1000 pour sélectionner les meilleurs joueurs humains. Ce qui était plus aisé du temps où feu PokerTableRatings  sévissait encore. Mais bon, peut-être que les rooms ont ça en magasin...

 

Bon, je vous laisse, de toute façon tout le monde s'en fout et Columbo va commencer.

 

PS : pour Anne Roumanoff, c'était censé être de l'humour...

 

 

 

 

 

Modifié par mizar2001

Partager ce message


Lien à poster
Partager sur d’autres sites
Posté (modifié)
Il y a 2 heures, mizar2001 a écrit :

Mon humble avis -  lequel n'a pas changé malgré ce résultat récent - est que les meilleurs joueurs feront encore pas mal de résistance face aux meilleurs programmes et autres bots en NL Holdem. Pour une raison essentielle : avant d'être un jeu de stratégie et un jeu mathématique, le NLHE est avant tout, surtout, d'abord et essentiellement un jeu mental et un jeu d'adaptation.

En d'autre terme, c'est un jeu où le QE (quotient émotionnel) est plus important encore que le QI, la puissance de calcul et autres capacités analytiques. C'est d'ailleurs, probablement, l'une des raisons pour lesquelles aucun des meilleurs joueurs d'échecs au monde n'a cartonné durablement au poker.

Pas du tout d'accord. En fait je crois que les humains sont tellement loin d'être techniquement parfait au poker, que pendant longtemps c'est le mental qui a primé. Les top players en CG HU étaient ceux qui géraient le mieux la metagame, le tilt etc... Et petit à petit la tendance s'est inversée et maintenant la majorité des joueurs considérés comme top players ont une approche très GTO dans laquelle le but n'est pas de s'adapter mais juste d'être techniquement le meilleur possible.

Et justement si un bot sans émotions peut crush des top players c'est bien qu'en réalité ça n'a pas d'importance quand on est techniquement proche de la perfection.

 

Il y a 2 heures, mizar2001 a écrit :

2/ Y a un autres gros problème dans cette histoire. C'est que notre Libratus se faisait visiblement aider tous les soirs par des joueurs de poker en chair et  en os pour l'aider à résoudre ses faiblesses et à mieux s'adapter. Ce qui du coup fausse complètement le duel. Ce n'est plus un duel entre l'homme et la machine mais plutôt entre l'homme et la machine aidée par l'homme. Ce n'est plus du tout pareil !

Non, il ne se faisait pas aider par des joueurs de poker. C'est Noam Brown le créateur du bot qui travaillait dessus le soir. C'est un doctorant en théorie des jeux, même pas sûr qu'il batte la NL2 online.

Je trouve ça aussi un peu spécial que le bot puisse être changé en cours de partie. Ca me paraitrait plus éthique qu'il reste le même du début à la fin, quitte à la implémenter des capacités d'auto-modification. Mais je crois pas non plus que ce soit scandaleux... Les humains eux-aussi ont eu de l'aide extérieure (sessions avec d'autres top players etc...).

 

Il y a 2 heures, mizar2001 a écrit :

3/ J'ai tout de même un gros doute sur le fait que les quatre joueurs sélectionnés fassent parties de la crème de la crème en HU. Le poker a ceci de singulier par rapport aux autres sports ou jeux : un débutant peut battre le meilleur joueur du monde (sur le court terme). Et les meilleurs joueurs ne sont pas forcément les plus célèbres ou les plus médiatisés...

Ces 4 là ne sont pas du tout les plus célèbres ou les plus médiatisés... Justement ils ont le profil inverse. Et quand des mecs qui font autorité comme Galfond ou Doug Polk viennent également confirmer que ce sont 4 top players HU, je pense que c'est largement suffisant pour qu'il n'y ait plus vraiment débat.

 

 

Conclusion : J'étais à fond pour les humains lors de ce match, et moi aussi je trouve que les conditions de jeu étaient vraiment pas idéales. Mais faut pas oublier que les mecs qui ont organisé ça à la base ce sont pas des joueurs de poker... ce sont des universitaires, chercheurs en théorie des jeux qui connaissent pas tout ce monde. Et franchement je trouve que dans l'ensemble leurs 2 challenges (Claudico et Libratus) étaient bien faits. Ils ont choisis 4 vrais top players (pas comme les chercheurs de l'université d'Alberta), ils ont proposé du streaming... Et à la fin le résultat est sans appel. Du 15bb/100 sur 120.000 mains avec du duplicate poker (ce qui réduit énormément la variance), il y a juste pas photo.

 

Dans tous les jeux, échecs, backgammon, go, poker, il y a une période où l'humain est clairement meilleur, puis une transition et l'IA devient plus compétente. Aujourd'hui c'est clair et net que l'IA est devenue plus compétente que l'humain en CG HU NLHE. Félicitations à l'équipe de Carnegie Mellon :)

Modifié par Pad

Partager ce message


Lien à poster
Partager sur d’autres sites
Posté (modifié)

Il est normal que les humains que nous sommes soient dans un premier temps excités puis aigris. Puis on fini par assumer que ces machines sont encore bien bêtes. Ce qui mène peu après à se rendre compte qu'elles pourraient réellement améliorer nos vies.

Modifié par jou0eur

Partager ce message


Lien à poster
Partager sur d’autres sites
à l’instant, Pad a écrit :
Il y a 2 heures, mizar2001 a écrit :

2/ Y a un autres gros problème dans cette histoire. C'est que notre Libratus se faisait visiblement aider tous les soirs par des joueurs de poker en chair et  en os pour l'aider à résoudre ses faiblesses et à mieux s'adapter. Ce qui du coup fausse complètement le duel. Ce n'est plus un duel entre l'homme et la machine mais plutôt entre l'homme et la machine aidée par l'homme. Ce n'est plus du tout pareil !

Non, il ne se faisait pas aider par des joueurs de poker. C'est Noam Brown le créateur du bot qui travaillait dessus le soir. C'est un doctorant en théorie des jeux, même pas sûr qu'il batte la NL2 online.

Je trouve ça aussi un peu spécial que le bot puisse être changé en cours de partie. Ca me paraitrait plus éthique qu'il reste le même du début à la fin, quitte à la implémenter des capacités d'auto-modification. Mais je crois pas non plus que ce soit scandaleux... Les humains eux-aussi ont eu de l'aide extérieure (sessions avec d'autres top players etc...).

De ce que j'ai compris personne n'a touche au bot entre les sessions, c'est le bot lui-meme qui analysait la partie et adjustais sa strategie. Le bot a la base a juste appris les regles du jeu, il a simule XXXXXXX parties et appris par experience et apres chaque session il a analyse comment jouer son/ses adversaires pour adjuster

Partager ce message


Lien à poster
Partager sur d’autres sites

Une des applications possibles de l'algo á la based de Libratus: prévenir une épidémie de grippe en designant des smart drugs 

https://www.extremetech.com/extreme/244057-how-a-poker-playing-ai-could-help-prevent-your-next-bout-of-the-flu

Quote

What does this have to do with health care and the flu? Think of disease as a game between strategic entities. Picture a virus as one player, a player with a certain set of attack and defense strategies. When the virus encounters your body, a game ensues, in which your body defends with its own strategies and hopefully prevails. This game has been going on a long time, with humans having only a marginal ability to control the outcome. Our body’s natural defenses have been developed in evolutionary time, and thus have a limited ability to make on the fly adaptations.

But what if we could recruit computers to be our allies in this game against viruses? And what if the same reasoning ability that allowed Libratus to prevail over the best poker minds in the world could tackle how to defeat a virus or a bacterial infection? This is in fact the subject of a compelling research paper by Toumas Sandholm, the designer of the Libratus algorithm. In it, he explains at length how an AI algorithm could be used for drug design and disease prevention

 

Partager ce message


Lien à poster
Partager sur d’autres sites
News

Dans un entretien auprès de Card Player, l'un des développeurs de Libratus estime que la machine "pourrait être capable de battre les humains à une table de six joueurs d'ici deux ans". Le championnat annuel de poker entre ordinateurs va d'ailleurs ajouter cette catégorie à ses compétitions.

[...] Lire la suite…



Partager ce message


Lien à poster
Partager sur d’autres sites
Posté (modifié)
Le 06/02/2017 à 16:45, HugoBoss a écrit :

Pourquoi est-ce que ce board "nécessite" plusieurs sizings si l'application correcte de la stratégie théorique optimale est impossible pour un humain ?

Même si le GTO demande 3 sizings dans plein de situations, c'est pas pour autant qu'on doit s'efforcer de suivre ses préceptes si ça implique qu'on joue encore moins bien qu'avec un sizing au final.

La nécessité elle vient de maximiser son EV d'humain à humain, si je joue parfaitement une stratégie à un seul sizing je vais faire beaucoup plus de profit qu'essayer de copier Pio et ses 3 sizings (pour faire n'importe quoi au final).

A cause du pavé insipide et totalement ininterressant de mizar vous êtes passé à coté de cette intervention qui est tout à fait juste 

Modifié par Prout

Partager ce message


Lien à poster
Partager sur d’autres sites

Libratus met 15 BB/1000 au top des joueurs HU, ce n'est qu'un début, on peut imaginer 20-30-40... , 

Plus on monte de niveau et moins les humains on d'edge sur leurs contemporains, est-ce du à une espèce de mimétisme qui fait qu'on se cale sur ce qui se fait et tout le monde finit par jouer peu ou prou de la même façon  et personne ne cherche à sortir du cadre ou est on proche des limites humaines? 

Si mon propos n'est pas clair, à une époque tout le monde sautait sur le ventre et en sautant sur le dos on a gagné dix bons cm , bref est qu'un joueur de poker qui sauterait sur le dos gagnerait 15 bb/100 en

high stake?

Partager ce message


Lien à poster
Partager sur d’autres sites

Le problème c'est que l'intelligence artificielle évolue plus vite que nous, pourquoi travailler d'arrache-pied pour s'améliorer si des bots crush déjà tout : autant avoir une dream machine à notre disposition pour nous donner la solution de chaque coup.

Et quand on sera à ce stade là, on sera proche de la fin du online.

Partager ce message


Lien à poster
Partager sur d’autres sites
7 hours ago, letacot said:

Libratus met 15 BB/1000 au top des joueurs HU, ce n'est qu'un début, on peut imaginer 20-30-40... , 

Plus on monte de niveau et moins les humains on d'edge sur leurs contemporains, est-ce du à une espèce de mimétisme qui fait qu'on se cale sur ce qui se fait et tout le monde finit par jouer peu ou prou de la même façon  et personne ne cherche à sortir du cadre ou est on proche des limites humaines? 

Si mon propos n'est pas clair, à une époque tout le monde sautait sur le ventre et en sautant sur le dos on a gagné dix bons cm , bref est qu'un joueur de poker qui sauterait sur le dos gagnerait 15 bb/100 en

high stake?

Durant et après le challenge, les brains ont pointé que dans la stratégie de Libratus, il y avait, pour chaque action beaucoup de sizings différents, là où la plupart n'en ont qu'un ou deux (genre over-bet river et un sizing standard pour le reste). Ca a l'air de faire une assez grosse différence (faudrait voir l'edge qu'aurait une IA avec juste un ou deux sizing possibles), mais c'est aussi visiblement extrèmement difficile voire impossible à implanter pour un humain (sans dream machine obv).

C'est déjà pas si évident pour un humain de gérer des trucs pratiques simples genre "dans ce spot je dois fold 30% du temps et call 70% du temps". Si à chaque bet, tu as 10 sizings possibles avec chacun une certaine probabilité, bon courage. Et encore, je dis 10 sizings, mais j'imagine que si un jour on arrive à résoudre le GTO sans approximation, on aurait un continuum de sizings et pas un ensemble discret de sizings possibles...

Donc je pense qu'on est vraiment proche des limites humaines. T'as quand même sans doute raison avec le mimétisme. Pendant des années, y'a eu des choses qui n'étaient jamais envisagées parce qu'elles étaient supposées mauvaises jusqu'à ce que quelqu'un regarde de plus près et se rende compte qu'il y avait de très bonnes raisons de le faire (genre les overbets, peut-être ?). Mais j'ai confiance qu'il y a toujours de bons gros geeks prêts à bosser suffisamment travailler leur jeu et sortir des sentiers battus pour battre ça.

Partager ce message


Lien à poster
Partager sur d’autres sites

Bonjour,

Je bataille avec google depuis 1heure pour voir les fameux HU...

Quelqu'un a un lien pour regardé ça ? Ça m’intéresse vraiment. C'est dingue que les vidéos ne soit pas disponible T_T...

Partager ce message


Lien à poster
Partager sur d’autres sites
Lire les 323 commentaires sur le forum
Les news à la Une
vendredi 17 novembre 2017 à 16:12
HOT !
Club Poker Radio S11E12 avec Guillaume Diaz, Alexis Fleur et Jennifer Shahade

L'équipe de Club Poker Radio recevait ce jeudi deux fines lames de la jeune garde tricolore : Guillaume Diaz, le volatile du Team Winamax, et Alexis Fleur, que les membres du forum connaissent sous le pseudonyme de Dunke. Durant la deuxième partie de l'émission, l'ambassadrice PokerStars Jennifer Shahade s'est quant à elle prêtée au jeu de l'interview via Skype.

vendredi 17 novembre 2017 à 9:42
Breaking News
Club Poker Radio au Badaboum : venez fêter les dix ans avec nous !

Putain, dix ans ! À l'occasion de son dixième anniversaire et de sa 400e émission, Club Poker Radio vous convie au Badaboum le vendredi 8 décembre. Cette soirée de débauche (voire plus si affinités) vous permettra de faire mieux connaissance avec l'équipe du podcast et du site, mais aussi avec la crème du forum. À ne manquer sous aucun prétexte !

jeudi 16 novembre 2017 à 13:36
Télex

Le Main Event du Winamax Circus tient son champion ! Victorieux d'un field de 9 446 unités (soit un prize pool de 425 000 € alors que la garantie plafonnait à 250 000 €), TITAZ4WINA met la main sur un magot flirtant avec les 70 000 €. En attendant d'interviewer le héros du jour, PonceP vous propose de découvrir les circonstances de son sacre à travers un replay de la table finale.

jeudi 16 novembre 2017 à 12:58
Télex

Molly's Game, qui en France sortira le 3 janvier sous le titre Le Grand Jeu, s'offre une nouvelle bande-annonce rythmée. Le film d'Aaron Sorkin mettra pour rappel en scène Jessica Chastain, Idris Elba ou encore Kevin Costner. Et si le poker ne constituera pas son sujet central, le récit sur grand écran du parcours de Molly Bloom s'annonce passionnant.

mercredi 15 novembre 2017 à 14:06
Télex

Vous vous morfondez en PLS en attendant les derniers récits du road trip d' Introl sur la cote Ouest américaine ? Bonne nouvelle : le célèbre road tripot de dominique75, qui a d'ailleurs inspiré notre exilé canadien préféré, a repris la route il y a quelques jours. Embarquez dans sa superbe Camaro jaune et direction Los Angeles, Vegas, Sedona, Phoenix et San Diego !

mardi 14 novembre 2017 à 11:20
Régulation du poker en ligne en Pennsylvanie : PokerStars affiche ses ambitions

Deux semaines après l'annonce de la légalisation des jeux en ligne en Pennsylvanie, les dirigeants de PokerStars confirment leur intention de "faire partie des premiers opérateurs à ouvrir leurs tables" aux joueurs de l'État. D'une manière plus générale, cette régulation pourrait contribuer à rebattre les cartes de l'autre côté de l'Atlantique.

lundi 13 novembre 2017 à 14:32
ARJEL (T3 2017) : le marché français du poker en ligne s'offre un petit sursaut

C'est une première depuis 2011 : les trois secteurs du marché français des jeux en ligne ont enregistré une progression au troisième trimestre, tant en termes de nombre de joueurs que de montant des mises. S'agissant du poker, cette embellie intervient comme le note l'Autorité de Régulation des Jeux En Ligne (ARJEL) après "quasiment six ans de baisse continue".

lundi 13 novembre 2017 à 10:30
HOT !
WPT Deepstacks Bruxelles : et de cinq pour Laurent Polito !

Pour la cinquième fois en l'espace de trois ans, Laurent Polito s'impose sur une épreuve du circuit annexe du World Poker Tour : le WPT Deepstacks Bruxelles. Cette régularité impressionnante permet au serial perfeur d'empocher 90 000 €, tandis que Jérôme Sgorrano et Michel Abécassis se classent respectivement 4e et 12e du tournoi.

Tournois gratuits et prix ajoutés

Le Club Poker organise des freerolls avec bonus et des tournois spéciaux avec ajouts de prix.
Pour en bénéficier gratuitement, inscrivez-vous sur nos sites de poker partenaires :

Tournois Club Poker
6-MAX
$2.20
Big Poker League
mercredi 22 novembre 2017 à 20:04
$125 ajoutés
6-MAX
$2.20
Big Poker League
mercredi 29 novembre 2017 à 20:04
$125 ajoutés
6-MAX
$2.20
Big Poker League
mercredi 6 décembre 2017 à 20:04
$125 ajoutés
6-MAX
$2.20
Big Poker League
mercredi 13 décembre 2017 à 20:04
$125 ajoutés
6-MAX
$2.20
Big Poker League
mercredi 20 décembre 2017 à 20:04
$125 ajoutés
Le chat joue au poker en ligne. Sisi.
Nouveau au poker ? Voici toutes les infos et réponses pratiques pour bien débuter et comprendre le poker en ligne.

Des tests complets et les bonus des poker rooms pour mieux choisir votre préférée.

Nos tournois, pour jouer entre nous, avec des prix et des cadeaux ajoutés chaque semaine.

Trouvez des infos pratiques et discutez sur le poker en ligne.

Pour les joueurs confirmés, apprenez à analyser vos mains au poker.