Jump to content
This Topic
SuperCaddy

Brains vs AI : Libratus défie quatre champions de poker en heads up

Recommended Posts

2 minutes ago, LrAZer said:

merci pr ces infos très claires,  une dernière question : serait- il facile/possible d y intégrer un tracker et d'avoir une forme d' Intégration Automatique des données de l adversaire ? ou en est-on très loin ??

 

Les intégrer de quelle manière ? La statégie est la même quelle que soit la stratégie adverse. Il n'y a aucune adaptation.
La stratégie GTO est pas celle qui gagne le plus face à une stratégie donnée, mais elle n'est perdante contre AUCUNE stratégie donc pas besoin de s'adapter.
La stratégie qui gagne le plus face à une stratégie donnée s'appelle la stratégie maximalement exploitante. C'est bien, mais le problème, c'est qu'en pratique tu ne connais jamais la stratégie adverse et l'estimer est un problème très difficile car tu as très peu d'infos. Et en plus, quand bien même tu arriverais à l'estimer parfaitement, l'adversaire pourrait alors à son tour s'adapter à ta stratégie et te faire perdre beaucoup.
Avec le GTO, pas de tout ça. Tu es toujours gagnant quoi que l'adversaire fasse. Au pire tu break even si l'autre joue aussi GTO.

Share this post


Link to post
Share on other sites
il y a 25 minutes, LrAZer a écrit :

merci pr ces infos très claires,  une dernière question : serait- il facile/possible d y intégrer un tracker et d'avoir une forme d' Intégration Automatique des données de l adversaire ? ou en est-on très loin ??

 

Pour toi ou pour le bot ?

Pour faire fonctionner un tracker il faut que tu puisses enregistrer tes HH (hand history), soit générées par le soft soit en screen scraping (captures d'écran avec reconnaissance des caractères et des cartes).

A ma connaissance, les softs qui permettent de jouer face à un bot ne donnent pas ces infos et aucun tracker connu ne permet cela.

 

Si c'était le sens de ta question.

 

Share this post


Link to post
Share on other sites
il y a 32 minutes, Piconzaz a écrit :

Les intégrer de quelle manière ? La statégie est la même quelle que soit la stratégie adverse. Il n'y a aucune adaptation.
La stratégie GTO est pas celle qui gagne le plus face à une stratégie donnée, mais elle n'est perdante contre AUCUNE stratégie donc pas besoin de s'adapter.
La stratégie qui gagne le plus face à une stratégie donnée s'appelle la stratégie maximalement exploitante. C'est bien, mais le problème, c'est qu'en pratique tu ne connais jamais la stratégie adverse et l'estimer est un problème très difficile car tu as très peu d'infos. Et en plus, quand bien même tu arriverais à l'estimer parfaitement, l'adversaire pourrait alors à son tour s'adapter à ta stratégie et te faire perdre beaucoup.
Avec le GTO, pas de tout ça. Tu es toujours gagnant quoi que l'adversaire fasse. Au pire tu break even si l'autre joue aussi GTO.

quid du GTO ... merci pr ce rappel, seulement vu qu' aux petites/moyennes/... limites, sans parler des mtt , jouer GTO n est pas pas forcément ce qu'il y a de plus rentable ( d'où l usage des trackers) du coup je ne suis pas sur que ce bot soit le plus dangereux pour la fin du poker - de ma carriere...;)- en ligne !

D où ma question à quand des bots qui exploitent le jeu des adversaires quand jouer GTO n'est pas le plus EV+ ?

 

Edited by LrAZer

Share this post


Link to post
Share on other sites

Je comprends mieux, tu voulais savoir si un bot comme celui-ci pouvait avoir un hud et les HH en jouant sur une room, c'est à dire prendre la place d'un joueur à la table.

Malheureusement la réponse est oui et il existe déjà des bots qui jouent pour des personnes qui les ont installé sur leur compte poker (même si moins performant que ce genre de bot)

 

C'est pour cela qu'il faut absolument que les rooms étudient de très près le problème, qu'elles suivent la façon de jouer de ces bots et récupèrent les codes source afin justement déjà de les reconnaitre et de pouvoir les contrer plus facilement.

Les bots pour les rooms de poker et pour les joueurs dans leur ensemble est un des plus grands dangers pour les années à venir pour le poker online.

Plus ils seront performants, plus grand sera le danger si rien n'est fait.

 

Edited by Holalahola

Share this post


Link to post
Share on other sites
16 minutes ago, LrAZer said:

quid du GTO ... merci pr ce rappel, seulement vu qu' aux petites/moyennes/... limites, sans parler des mtt , jouer GTO n est pas pas forcément ce qu'il y a de plus rentable ( d'où l usage des trackers) du coup je ne suis pas sur que ce bot soit le plus dangereux pour la fin du poker - de ma carriere...;)- en ligne !

D où ma question à quand des bots qui exploitent le jeu des adversaires quand jouer GTO n'est pas le plus EV+ ?

 

Ben en fait, la raison pour laquelle les humains jouent exploitant plutôt que GTO, c'est plus parce qu'on a qu'une idée assez vague de ce qu'est le GTO, pas tellement parce qu'on peut gagner encore plus en jouant maximalement exploitant face à une stratégie donnée.
Mais on s'en raproche de plus en plus. Les pro de CG high stakes ne travaillent quasiment qu'à "jouer équilibré", se rapprocher du GTO. Si tu joues maximalement exploitant, tu auras une stratégie qui aura plein de leaks relativement évident (potentiellement encore plus évidents que les leaks que tu exploites toi-même). Donc c'est un jeu dangeureux.

Quant aux bots qui joueraient exploitant, il n'y en a pas à ma connaissance. Et il y a assez peu de recherche récente sur le sujet.
Si tu connais la stratégie adverse, calculer la stratégie maximalement exploitante est à peu près trivial (ça peut coûter un peu cher en calcul, mais c'est mathématiquement assez simple dans le principe). Le vrai problème est d'être capable d'estimer la stratégie adverse.
Si tu veux résoudre le problème exactement, une stratégie se décrit avec des milliards de milliards de paramètres. Rien que la decription complète prend largement plus de place que ce que ton disque dur peut contenir. Et d'un point de vue statistique, tu essaies donc d'estimer un nombre gigantesque de paramètres avec très très peu de données (quelques mains, quelques milliers tout au plus). C'est donc un problème dit "mal posé" en maths. En l'occurrence, la question est alors de trouver une bonne abstraction pour décrire de manière approchée une stratégie au poker, qui soit suffisamment précise, avec assez peu de paramètres et faciles à estimer. Les humains utilisent les stats que tu trouves sur les trackers et c'est certainement une assez bonne idée. Mais malgré ça, l'estimation reste très peu fiable et tu peux facilement être complètement à côté de la plaque. C'est trop instable. La solution est de faire ce qu'on appelle de la "régularisation" en maths, mais très peu de gens ont bossé sur la question pour le poker, d'après mes recherches.

Voilà, je me suis bien pignolé à introduire des trucs de maths un peu plus fins, parce que c'est un sujet qui m'intéresse vachement, mais pour avoir un réfléchi au sujet et en avoir discuté avec des spécialistes (genre le mec qui a résolu le LHE pendant sa thèse à UAlberta), c'est vachement intéressant du point de vue des maths, mais en pratique, je doute que ça donne quoi que ce soit de vraiment pertinent. C'est beaucoup plus compliqué que d'approximer le GTO et de le jouer, et les garanties que tu arrives à exploiter plus que tu ne te rends exploitable sont minces voire nulles. Bref, je pense pas que ça verra le jour, mais j'espère me tromper. (Et si c'est le cas, j'aimerais bien bosser dessus...)

Share this post


Link to post
Share on other sites
12 minutes ago, Holalahola said:

Malheureusement la réponse est oui et il existe déjà des bots qui jouent pour des personnes qui les ont installé sur leur compte poker (même si moins performant que ce genre de bot)

 

Bon, évidemment, j'imagine qu'on trouve pas facilement publiquement de la doc sur ce genre de bots... Mais si t'as plus d'infos, ou des liens, je suis preneur.
Je suis pas convaincu que les bots actuels qui sévissent sur les rooms soient tellement adaptatifs.

Share this post


Link to post
Share on other sites
Citation

Je suis pas convaincu que les bots actuels qui sévissent sur les rooms soient tellement adaptatifs.

 

Moi non plus, ils n'ont absolument pas le niveau de ceux dont on parle ici.

Je répondais juste à la question générale "un bot est-il possible sur une room de poker" -> oui, et même un tel bot comme celui-ci ou ceux passés peuvent-ils prendre la place d'un joueur autour d'une table, là encore théoriquement rien ne l'empêche.

Pour ceux qui tournent actuellement, ils n'ont pas le niveau d'adaptation ou GTO de ces bots là, et ils sont encore surement très loin des bots d'études comme ceux là.

Mais il faut faire très attention pour l'avenir.

 

Et heureusement, la qualité de jeu d'un bot n'est pas le seul indice qui permet sa détection, même si les bots s'adaptent dans les timings et vont même jusqu'à faire des missclics pour les plus performants, à un moment ou à un autre ils finissent pour le moment par se faire découvrir, mais avec l'évolution et la capacité autant du développement que de leur niveau de jeu et avec la puissance de calcul, il faut absolument que les rooms suivent tout ça de près.

 

Edited by Holalahola

Share this post


Link to post
Share on other sites
il y a 11 minutes, Piconzaz a écrit :

Ben en fait, la raison pour laquelle les humains jouent exploitant plutôt que GTO, c'est plus parce qu'on a qu'une idée assez vague de ce qu'est le GTO, pas tellement parce qu'on peut gagner encore plus en jouant maximalement exploitant face à une stratégie donnée.
Mais on s'en raproche de plus en plus. Les pro de CG high stakes ne travaillent quasiment qu'à "jouer équilibré", se rapprocher du GTO. Si tu joues maximalement exploitant, tu auras une stratégie qui aura plein de leaks relativement évident (potentiellement encore plus évidents que les leaks que tu exploites toi-même). Donc c'est un jeu dangeureux.

Quant aux bots qui joueraient exploitant, il n'y en a pas à ma connaissance. Et il y a assez peu de recherche récente sur le sujet.
Si tu connais la stratégie adverse, calculer la stratégie maximalement exploitante est à peu près trivial (ça peut coûter un peu cher en calcul, mais c'est mathématiquement assez simple dans le principe). Le vrai problème est d'être capable d'estimer la stratégie adverse.
Si tu veux résoudre le problème exactement, une stratégie se décrit avec des milliards de milliards de paramètres. Rien que la decription complète prend largement plus de place que ce que ton disque dur peut contenir. Et d'un point de vue statistique, tu essaies donc d'estimer un nombre gigantesque de paramètres avec très très peu de données (quelques mains, quelques milliers tout au plus). C'est donc un problème dit "mal posé" en maths. En l'occurrence, la question est alors de trouver une bonne abstraction pour décrire de manière approchée une stratégie au poker, qui soit suffisamment précise, avec assez peu de paramètres et faciles à estimer. Les humains utilisent les stats que tu trouves sur les trackers et c'est certainement une assez bonne idée. Mais malgré ça, l'estimation reste très peu fiable et tu peux facilement être complètement à côté de la plaque. C'est trop instable. La solution est de faire ce qu'on appelle de la "régularisation" en maths, mais très peu de gens ont bossé sur la question pour le poker, d'après mes recherches.

Voilà, je me suis bien pignolé à introduire des trucs de maths un peu plus fins, parce que c'est un sujet qui m'intéresse vachement, mais pour avoir un réfléchi au sujet et en avoir discuté avec des spécialistes (genre le mec qui a résolu le LHE pendant sa thèse à UAlberta), c'est vachement intéressant du point de vue des maths, mais en pratique, je doute que ça donne quoi que ce soit de vraiment pertinent. C'est beaucoup plus compliqué que d'approximer le GTO et de le jouer, et les garanties que tu arrives à exploiter plus que tu ne te rends exploitable sont minces voire nulles. Bref, je pense pas que ça verra le jour, mais j'espère me tromper. (Et si c'est le cas, j'aimerais bien bosser dessus...)

très intéressant tout ça...  en fait au-delà du problème que pose le fait de prendre en compte tous les paramètres  nécessaires pour définir une stratégie donnée, il me semble -imao- qu ' un seul paramètre ( le mec fait tapis quand il a nuts par exple) peut avoir une importance plus significative que le fait "d ' équilibrer parfaitement ses ranges"... et surtout en mtt a petit buy-in . Donc même s' il y a une "infinité " de paramètres qui definissent une stratégie précise,  ils sont à pondérer et certaines infos valent largement le fait d'être plus leak par ailleurs.

Share this post


Link to post
Share on other sites
9 minutes ago, LrAZer said:

très intéressant tout ça...  en fait au-delà du problème que pose le fait de prendre en compte tous les paramètres  nécessaires pour définir une stratégie donnée, il me semble -imao- qu ' un seul paramètre ( le mec fait tapis quand il a nuts par exple) peut avoir une importance plus significative que le fait "d ' équilibrer parfaitement ses ranges"... et surtout en mtt a petit buy-in . Donc même s' il y a une "infinité " de paramètres qui definissent une stratégie précise,  ils sont à pondérer et certaines infos valent largement le fait d'être plus leak par ailleurs.

En fait, implicitement, un humain va avoir une espèce de "stratégie moyenne", de laquelle il va dévier un peu pour s'adapter et exploiter.
Du coup, on transforme le problème d'estimer la stratégie adverse en "estimer ce que serait l'adaptation optimale", et là, ça peut effectivement réduire de beaucoup la complexité du problème, d'un point de vue mathématique / statistique.
Et en l'occurrence, avec une telle approche, prendre la stratégie GTO comme "statégie moyenne" dont on dévierait marginalement pour s'adapter est certainement la meilleure idée possible. Donc finalement, si on veut bien faire les choses, commencer par connaître la stratégie GTO (ce qui est résolu pour le LHE et visiblement en grand progrès pour le NLHE) est la base !

Share this post


Link to post
Share on other sites

 

Jason: :8c:8s

Bot raise 250, Jason call 250

Flop: :5h:4s:6s (500 pot)

Jason check, Bot bet 375, Jason call 375

Turn: :8h (1250 pot)

Jason check, Bot bet 2500, Jason call 2500

River: :9s (6250 pot)

Jason check, Bot bet 6250, Jason Fold

 

Maintenant la mirror hand avec Dong:

 

Dong: :7s:9h

Dong raise 274, Bot call 274

Flop: :5h:4s:6s (548 pot)

Bot donkbet 274, Dong call 274

Turn: :8h (1096 pot)

Bot bet 274, Dong raise 3151, Bot call 3151

River: :9s (7398 pot)

Bot DONKOVERBET X2pot pour 14796, Dong tank 5 minutes, pleure et fini par CALL 14796...

 

Quelqu'un a une explication logique à donk overbet x2 la river avec set ?? il fait quoi le bot il bluff, il value ??? 

Je pige pas.

Edited by Paulson

Share this post


Link to post
Share on other sites

Il bluff et ça me paraît pas si illogique si on se pose 2sec pour réfléchir aux ranges.

Si il avait eu A2ss est-ce que ça t'aurait choqué ce donkbet river ? A partir du moment où il a une range pour le faire en value, il y a aussi des bluffs dans sa range. Et si tu tu réfléchis river il a des 7x, des flush et des brelans (et des dp éventuellement)... Les brelans sont le bas de sa range, ceux avec un pique semblent être les meilleurs candidats pour tourner en bluff.

 

Edited by Pad

Share this post


Link to post
Share on other sites
Quote

Les intégrer de quelle manière ? La statégie est la même quelle que soit la stratégie adverse. Il n'y a aucune adaptation.

Quote

Quant aux bots qui joueraient exploitant, il n'y en a pas à ma connaissance. Et il y a assez peu de recherche récente sur le sujet.

C'est pas completement vrai (potentiellement) puisque le chercheur en question (Sandholm) explique dans une conférence post-Claudico qu'ils ont aussi un module d'exploitabilité et qu'ils peuvent ou pas choisir de s'en servir. Dans le cas de Claudico, ils ne l'avaient pas utilisé, mais ca pourrait etre le cas ici. 

A voir ici: 

 

 

 

Edited by manub

Share this post


Link to post
Share on other sites
il y a 12 minutes, Pad a écrit :

Il bluff et ça me paraît pas si illogique si on se pose 2sec pour réfléchir aux ranges.

Si il avait eu A2ss est-ce que ça t'aurait choqué ce donkbet river ? A partir du moment où il a une range pour le faire en value, il y a aussi des bluffs dans sa range. Et si tu tu réfléchis river il a des 7x, des flush et des brelans (et des dp éventuellement)... Les brelans sont le bas de sa range, ceux avec un pique semblent être les meilleurs candidats pour tourner en bluff.

 

M'ouais je sais pas... je trouve ça dommage de choisir set de 8 même si tu as le 8 spade, y'a surement d'autre chose a bluffer et si je dois bluff un set je préfère choisir de bluff set de 5 avec le 5 de spade qui block la straight flush :7s:5s.

Share this post


Link to post
Share on other sites
il y a 3 minutes, Paulson a écrit :

M'ouais je sais pas... je trouve ça dommage de choisir set de 8 même si tu as le 8 spade, y'a surement d'autre chose a bluffer et si je dois bluff un set je préfère choisir de bluff set de 5 avec le 5 de spade qui block la straight flush :7s:5s.

ça fait que 2 combos de bluff les 5 avec le 5s. Il faut en trouver d'autres ;)

Share this post


Link to post
Share on other sites

 

il y a 18 minutes, manub a écrit :

ils ont aussi un module d'exploitabilité et qu'ils peuvent ou pas choisir de s'en servir.

 

il y a 18 minutes, manub a écrit :

C'est bien ce qui me semblait ... et  à quand les tournois duplicate online ? :ph34r:

 

 

Share this post


Link to post
Share on other sites
54 minutes ago, manub said:

C'est pas completement vrai (potentiellement) puisque le chercheur en question (Sandholm) explique dans une conférence post-Claudico qu'ils ont aussi un module d'exploitabilité et qu'ils peuvent ou pas choisir de s'en servir. Dans le cas de Claudico, ils ne l'avaient pas utilisé, mais ca pourrait etre le cas ici.

Super intéressant ! J'étais complètement passé à côté.
Et c'est pas mal leur critère "safe" pour déterminer à quel point ils se permettent de dévier du GTO pour exploiter. J'avais pas pensé à ça du tout. :)
Comme d'hab, merci Manu ! :x

Share this post


Link to post
Share on other sites

Phil Galfond qui parle des 4 humains

"Regarding the strength of the team, Phil Galfond had this to say:


“Though some casual poker fans may not know all of them, Les, Kim, McAulay and Chou are among the very best Heads-Up No-Limit Texas Hold’em players in the world,” said Phil Galfond, a pro whose total live tournament winnings exceed $2.3 million and who owns the poker training site Runitonce.com.
Unlike the multi-player poker tournaments popular on television, professional one-on-one No-Limit Texas Hold’em is often played online.
“Your favorite poker player almost surely wouldn't agree to play any of these guys for high stakes, and would lose a lot of money if they did,” Galfond added. “Each of the four would beat me decisively.”

Share this post


Link to post
Share on other sites
Quote

C'est bien ce qui me semblait ... et  à quand les tournois duplicate online ? :ph34r:

Ca a été tenté par le passé (live et online) et c'est nullisime á jouer pour plein de raisons. 

Gros comeback des humains hier sinon

dbf1b5b0a9322437970e5c08c6832f0a.jpg 

Share this post


Link to post
Share on other sites

J'avais fait une petite erreur dans le 1er graph (oublié de diviser par 4 le nombre de mains par joueurs). 

Libratus_Challenge_17jan.png

 

Dong est on fire ! Et Jason prend pas spécialement cher en face. Sur les 20k dernières hands les humains s'en sortent plutôt bien !

Vraiment dommage que ce soit pas plus plaisant à suivre sur twitch. L'interface est tellement à vomir :(

Share this post


Link to post
Share on other sites
Il y a 5 heures, Pad a écrit :

Dong est on fire ! Et Jason prend pas spécialement cher en face. Sur les 20k dernières hands les humains s'en sortent plutôt bien !

Vraiment dommage que ce soit pas plus plaisant à suivre sur twitch. L'interface est tellement à vomir :(

Pour moi l'interface est clairement un handicap pour les humains, c'est ultra relou à suivre mais ça doit être aussi ultra relou à utiliser (toujours devoir cliquer pour entrer le montant, devoir cliquer pour avoir la mains suivante etc....) 

 

Il suffit de jouer un peu contre slumbot pour s'en rendre compte.

Share this post


Link to post
Share on other sites

Create an account or sign in to comment

You need to be a member in order to leave a comment

Create an account

Sign up for a new account in our community. It's easy!

Register a new account

Sign in

Already have an account? Sign in here.

Sign In Now


  • Recently Browsing   0 members

    No registered users viewing this page.

English
Retour en haut de page
×
Unibet : French Poker Cup
Unibet : French Poker Cup