jeudi 16 février 2017 à 15:49

Dans un entretien auprès de Card Player, l'un des développeurs de Libratus estime que la machine "pourrait être capable de battre les humains à une table de six joueurs d'ici deux ans". Le championnat annuel de poker entre ordinateurs va d'ailleurs ajouter cette catégorie à ses compétitions.

Intelligence artificielle

Difficile de passer à côté du retentissement médiatique important de la victoire de Libratus ces deux dernières semaines ! La démonstration de force de l'intelligence artificielle à une table de poker a été examinée sous toutes les coutures, ou presque.

 

La presse spécialisée, d'abord, a souvent pris soin de minimiser l'impact que cette avancée scientifique est susceptible d'avoir sur nos parties de poker en ligne quotidiennes. Poker News Daily, par exemple, souligne à raison que les performances de Libratus n'auraient pas été possibles sans le concours d'un super-ordinateur aux coûts de fonctionnement exorbitants. Et d'ajouter que l'événement organisé à Pittsburgh, qui ne concernait que le format bien particulier du heads up, se distinguait en de nombreux points d'une partie lambda (compteurs remis à zéro après chaque main, délais de réflexion très longs accordés à la machine, arrêt systématique du coup dès l'engagement d'un tapis...).

 

La presse généraliste, elle, ne se soucie guère de ces considérations et s'efforce de voir plus loin. Le journaliste de The Guardian, par exemple, s'inquiète d'éventuelles dérives et appelle à un encadrement du développement de l'intelligence artificielle. D'autres titres se montrent plus optimistes et entrevoient des avancées médicales dans les progrès mis en exergue lors du match Brains vs AI. C'est le cas d'ExtremeTech qui, en relayant un article du Professeur Sandholm, évoque la possibilité de voir un jour les descendants de Libratus accompagner le corps humain dans sa lutte contre certains virus.

 

Le même Tuomas Sandholm est également à l'honneur d'un passionnant papier de Quartz, lequel dissèque Libratus et se penche sur les trois modules qui gouvernent sa prise de décision :

Le premier apprend la théorie et recherche des stratégies adaptées à toutes les situations. Le second est celui qui prend toutes les décisions durant une main. Et le troisième est mis à jour en permanence à travers l'enregistrement et l'analyse de chaque information nouvelle.

Alors que le rôle du premier module est simplement de savoir ce qui se passe à une table de poker, le second est en charge du caractère incertain qui découle de la main de l'adversaire. Le module 1 ressemble à toutes les autres intelligences artificielles : il apprend péniblement à travers la répétition des situations. Le module 2, lui, permet à Libratus d'appréhender l'inconnu.

Noam Brown et Tuomas Sandholm
Noam Brown et Tuomas Sandholm

Le lecteur apprend ainsi que le module 2 a la lourde tâche d'intégrer les décisions de l'adversaire à sa réflexion, d'affiner les ranges adversaires et in fine de prendre les décisions à la turn et à la river. Quant au module 3, présenté comme celui de l'apprentissage, il peut parfois lui aussi jouer un rôle crucial. Les développeurs lui attribuent par exemple la correction extrêmement rapide d'un leak identifié par les humains face à certains montants de mises bien précis.

 

Mais l'article le plus intéressant de la semaine, c'est peut-être cette interview de Noam Brown réalisée par Brian Pempus pour Card Player. L'autre moitié du duo Sandholm-Brown a joué un rôle important dans la transition de Claudico vers Libratus en passant par BabyTartanian8, champion ultra dominateur en janvier 2016 de la Computer Poker Competition annuelle. Dans cet entretien, l'homme revient sur le match du mois dernier et donne son sentiment sur les pistes de travail des mois à venir. Morceaux choisis :

Nous avons été surpris des résultats. Avant le match, nous avions testé Libratus contre les bots précédents. Il avait dominé Claudico avec une moyenne de gain de 10 à 12 blindes toutes les 100 mains. C'était un peu plus que les résultats obtenus par les humains en 2015. Nous pensions donc avoir un petit avantage, mais sans forcément nous attendre à une telle démonstration.

En réalité, nous n'avions pas pris la mesure de l'importance de certains détails qui avaient permis aux joueurs humains de l'emporter. Ils avaient identifié des faiblesses chez Claudico et les avaient exploitées. Par exemple, la stratégie de relance des limps de Claudico donnait d'excellents résultats et représentait une proportion significative de leurs gains. Ce qui fait que Libratus a dominé les joueurs, c'est que lui n'offrait aucune prise, aucune faiblesse exploitable par les humains.

Personne ne sait à quel point l'intelligence artificielle est aujourd'hui proche ou non de la stratégie GTO. Il y a bien des méthodes susceptibles de le mesurer, mais elles sont extrêmement coûteuses. Ces études n'ont pas encore été réalisées. C'est quelque chose que nous pourrions prévoir lors des mois à venir. Mais si je devais donner une estimation à la louche, je dirais qu'un bot maîtrisant à la perfection la stratégie GTO battrait Libratus à raison d'une moyenne de 15 blindes toutes les 100 mains. Tout cela reste toutefois très approximatif. La vérité se situe entre 5 et 50 blindes.

Il est difficile d'estimer à quel point Libratus est encore susceptible de s'améliorer. L'un des principaux défauts des précédents bots, c'est qu'ils n'intégraient pas les "blockers" dans leur réflexion à la turn et la river. C'est quelque chose qui est essentiel au plus haut niveau. Libratus ne connaît pas ce problème, ce qui représente un grand pas en avant. Il est aujourd'hui impossible de l'améliorer sur ce plan, mais d'autres chantiers existent. C'est par exemple le cas de sa stratégie de sizing.

Les overbets de Libratus nous ont vraiment surpris durant la compétition. Le logiciel n'avait jamais étudié une main disputée par un joueur humain. Il s'est donc présenté lors du premier jour avec une stratégie unique : celle dont il estimait qu'elle était la meilleure. Les gros overbets, mais aussi les donk bets, faisaient partie intégrante de cette stratégie. C'était à la fois impressionnant et enthousiasmant de le voir faire quelque chose de très différent des humains. Claudico montrait déjà les mêmes signes d'agressivité [mais] sa stratégie n'était pas équilibrée. Libratus a développé une stratégie agressive équilibrée, ce qui a été déterminant dans sa domination.

La recherche a déjà commencé pour les parties à trois joueurs. D'une manière générale, les techniques employées par Libratus fonctionnent aussi avec plus de deux joueurs. Le problème réside davantage dans la mesure de la performance. Avec plus de deux joueurs, vous pouvez jouer parfaitement d'un point de vue GTO mais perdre quand même à cause des interactions entre les autres joueurs. C'est pourquoi il est très difficile de déterminer si l'intelligence artificielle est supérieure à l'homme en organisant une partie entre un logiciel et cinq humains. [Par ailleurs] je pense que le format 6-max reste encore un poil au-dessus des aptitudes de Libratus et des autres bots.

Ceci étant dit, la compétition annuelle de poker entre ordinateurs va ajouter les parties à six joueurs à ses catégories, donc la recherche va s'accélérer et les bots vont s'améliorer. J'ai la conviction qu'avec quelques retouches sur Libratus, il serait capable de battre les humains en 6-max d'ici deux ans. Quand vous jouez à une table de six joueurs, il n'est pas acquis que vous ayez intérêt à jouer GTO. Il peut être plus intéressant de se focaliser sur l'exploitation des faiblesses de ses adversaires. C'est un débat qui existe dans notre communauté et la réponse reste en suspens. Aujourd'hui, les humains sont encore bien meilleurs que la machine pour exploiter les faiblesses des joueurs et en tirer profit.

Vos commentaires sur cette news dans le forum :
Intelligence artificielle : Libratus va travailler son jeu en 6-max
Cette news a suscité 316 commentaires, et seuls les 15 derniers sont affichés.
il y a une heure, nicorama a écrit :

Libratus a déjà joué des milliards de main contre elle-même justement pour trouver tous les points d'équilibre.

   La revanche du sexe faible! 

 

il y a une heure, jou0eur a écrit :

comment t'expliques que son rendement soit si important ? les joueurs etaient ils si loin de ces points d'équilibre ?

 C'est aussi ce que je me demandais, et si on faisait fausse route dans notre approche d'un optimum? 

Partager ce message


Lien à poster
Partager sur d’autres sites

Oui l'humain est complètement à chi** en général dans les recherches d'équilibre au poker.

 

Notamment parce que plein de sizings sont tout le temps contre-intuitifs en raison de l'inertie présente dans la façon qu'a tout le pool de jouer certains spots.

 

Exemple typique, tous les humains CBet small les boards genre 229 dans quasiment toutes les situations. Pourtant c'est un type de board (parmi d'autres) qui nécessite plusieurs betsizings, et généralement au moins un sizing d'overbet.

Partager ce message


Lien à poster
Partager sur d’autres sites

Pourquoi est-ce que ce board "nécessite" plusieurs sizings si l'application correcte de la stratégie théorique optimale est impossible pour un humain ?

Même si le GTO demande 3 sizings dans plein de situations, c'est pas pour autant qu'on doit s'efforcer de suivre ses préceptes si ça implique qu'on joue encore moins bien qu'avec un sizing au final.

La nécessité elle vient de maximiser son EV d'humain à humain, si je joue parfaitement une stratégie à un seul sizing je vais faire beaucoup plus de profit qu'essayer de copier Pio et ses 3 sizings (pour faire n'importe quoi au final).

Partager ce message


Lien à poster
Partager sur d’autres sites

 

Il y a 13 heures, ArtPlay a écrit :

Notamment parce que plein de sizings sont tout le temps contre-intuitifs en raison de l'inertie présente dans la façon qu'a tout le pool de jouer certains spots.

Pas certains spot, énormément de spots!  Une grande partie des sizing pré et post-flop est conventionnelle ou au moins une part de chaque sizing tient plus de la convention que de la raison. 

Biens sur Libratus n'a aucune raison de suivre des conventions humaines.

Partager ce message


Lien à poster
Partager sur d’autres sites

Posté (modifié)

 

Citation

La nécessité elle vient de maximiser son EV d'humain à humain, si je joue parfaitement une stratégie à un seul sizing je vais faire beaucoup plus de profit qu'essayer de copier Pio et ses 3 sizings (pour faire n'importe quoi au final).

This et c'est pareil pour la machine. Son interet c'est pas de jouer le meilleur coup dans telle situation, mais de remporter le plus possible d'argent à partir de l'ensemble de toutes ses mains. Si villain est un crétin total qui joue pour perdre. Libratus ira marger avec ses 72 aussi.

na0sh

je ne sais pas la fermer c'est un truc incroyable.

Modifié (le) par jou0eur

Partager ce message


Lien à poster
Partager sur d’autres sites

Posté (modifié)

J'arrive un peu après la bataille (une de mes grandes spécialités) et ai suivi toute cette histoire de loin.

 

Mon humble avis -  lequel n'a pas changé malgré ce résultat récent - est que les meilleurs joueurs feront encore pas mal de résistance face aux meilleurs programmes et autres bots en NL Holdem. Pour une raison essentielle : avant d'être un jeu de stratégie et un jeu mathématique, le NLHE est avant tout, surtout, d'abord et essentiellement un jeu mental et un jeu d'adaptation.

En d'autre terme, c'est un jeu où le QE (quotient émotionnel) est plus important encore que le QI, la puissance de calcul et autres capacités analytiques. C'est d'ailleurs, probablement, l'une des raisons pour lesquelles aucun des meilleurs joueurs d'échecs au monde n'a cartonné durablement au poker.

 

Ce qui fait la différence dans ce jeu de m.., pardon dans ce jeu si passionnant et populaire, c'est moins nos capacités stratégiques (lesquelles ne sont pas négligeables pour autant) que nos capacités d'adaptation et de résistance mentale. 

Pour schématiser, au poker, il vaut mieux être un stratège moyen avec un très bon mental qu'un très bon stratège avec un mental moyen. Sur le long terme, c'est le premier qui fera a différence. L'idéal étant évidemment d'être le meilleur possible dans les deux domaines...

Entre les meilleurs joueurs, ce qui fera la différence en terme de winrate, c'est tout ce qui a trait au metagame. Mais c'est aussi la résilience, la capacité à encaisser les coups durs, à jouer durablement son A game, à ne pas tilter.

 

Face à l'intelligence artificielle, l'homme n'a strictement aucune chance pour tout ce qui a trait à la puissance de calcul, l'aspect mathématique et stratégique du jeu. Idem en ce qui concerne la résilience et la capacité à jouer son A game en permanence.

L'IA est un monstre froid qui ne connaît pas le tilt, ne ressent pas la frustration, l'impatience, l'injustice et qui ne sera jamais agacé par sa copine parce qu'elle lui a demandé de descendre acheter une baguette juste après avoir pris dans la face un énorme bad beat. Bref, l'ordi lui, joue toujours à son meilleur niveau possible et ne commet a priori pas d'erreurs de calculs.

 

Manque de bol pour nos amis les microprocesseurs (et heureusement pour nous), il y a un domaine où l'humain conserve encore un assez net avantage. Cerise sur le gâteau, c'est sans doute, avec la résilience, la qualité la plus importante au poker. On appelle cela L'EMPATHIE. Dans ce domaine,  tous les meilleurs superordinateurs de la planète ont encore pas mal de progrès à faire.

Le jour où une IA pourra faire preuve de la même capacité d'adaptation, de la même créativité, de la même capacité à se mettre à la place d'autrui ou à optimiser le metagame, ce sera fini du genre humain. Ce n'est pas encore le cas. Car ce qui fait la force de l'ordi au poker est aussi sa faiblesse : l'ordi n'a pas de sentiments, il ne ressent rien.

Pour le dire autrement, le jour où une Intelligence Artificielle aura un sens de l'humour supérieur aux homo sapiens les plus drôles (Anne Roumanoff par exemple), les joueurs de poker pros onlines pourront illico changer de boulot ou bifurquer vers les cercles et autres casinos...

 

S'agissant plus précisément de ce duel Libratus-humains, il me semble quand même très discutable.  Pour au moins trois raisons :

 

1/ D'après ce que j'ai pu comprendre, Libratus met trois plombes à jouer. Apparemment, il lui arrivait de réfléchir plusieurs minutes avant de prendre sa décision. C'est juste grotesque et je me demande bien comment on a pu accepter cela ! Cela ne correspond absolument pas au rythme de jeu tel qu'il existe online où qu'un type normalement constitué peut encaisser sans que ça n'entame sa concentration et donc son A-Game.

Perso, si j'affronte un fish qui tank une minute preflop, puis une minute au flop, à la turn et à la river, je vais sit out au bout de trois mains. Ou alors, il faut vraiment que ce soit la quiche du siècle et qu'il y ait pas mal de pepettes en jeu !

 

Vous en connaissez beaucoup vous des joueurs normalement constitués capables d'accepter un rythme de jeu aussi lent sans allumer leur télé pour foutre Columbo sur TV Breizh, sans lire l'Equipe et leurs mails en même temps, tout en ouvrant Pornhub dans une petit fenêtre, histoire d'installer une petite ambiance tamisée dans la pièce ??!! Bref, sans perdre le fil du jeu et se concentrer sur autre chose...

Pour moi, même le supplice de Tantale ou un concert live de la Castafiore ressemble à une aimable plaisanterie comparés aux conditions de jeu qu'on dû se coltiner nos quatre cobayes.

 

2/ Y a un autres gros problème dans cette histoire. C'est que notre Libratus se faisait visiblement aider tous les soirs par des joueurs de poker en chair et  en os pour l'aider à résoudre ses faiblesses et à mieux s'adapter. Ce qui du coup fausse complètement le duel. Ce n'est plus un duel entre l'homme et la machine mais plutôt entre l'homme et la machine aidée par l'homme. Ce n'est plus du tout pareil !

 

3/ J'ai tout de même un gros doute sur le fait que les quatre joueurs sélectionnés fassent parties de la crème de la crème en HU. Le poker a ceci de singulier par rapport aux autres sports ou jeux : un débutant peut battre le meilleur joueur du monde (sur le court terme). Et les meilleurs joueurs ne sont pas forcément les plus célèbres ou les plus médiatisés...

 

Enfin, pour nuancer encore un peu plus le résultat final : un humain donnera plus facilement le meilleur de lui-même et jouera plus aisément son A-game en risquant son propre argent plutôt qu'en play money... Jouer au poker en play money, c'est un peu comme jouer au golf sans trou ou au tennis sans filet. On enlève un élément fondamental du jeu... et pas mal d'intérêt du coup.

 

Pour conclure ce pavé indigeste, il me semble que 5 conditions devraient a minima être réunies pour que ce type de duel soit crédible et représentatif :

1/ L'ordi doit adopter un rythme de jeu équivalent à ce qui se pratique habituellement online. Quelques secondes par coup, avec possibilité d'utiliser ponctuellement le timer.

2/ Aucune aide humaine extérieure pour l'IA.

3/ Idéalement, un duel sur 500 000 mains (comme le détaille ALex Luneau dans un récent et excellent article, la variance peu être énorme, même sur 100 000 mains...

https://www.winamax.fr/blog_team_blog-pour-une-saine-approche-de-la-variance-30072?param=blog-pour-une-saine-approche-de-la-variance-30072). Le tout face à 10 joueurs pour avoir un sample plus significatif. Et des temps de jeu raisonnables pour que ce soit supportable pour un humain.

4/ On joue 100 BB deep au départ, la profondeur de base online. Si le jeu devient trop deep (par ex 500 BB), on ouvre une nouvelle table. Les meilleurs humains ont une connaissance stratégique bien plus limitée du jeu ultra deep car ils le pratiquent rarement.

5/ On choisit les meilleurs winrates onlines en NL2000 ou NL1000 pour sélectionner les meilleurs joueurs humains. Ce qui était plus aisé du temps où feu PokerTableRatings  sévissait encore. Mais bon, peut-être que les rooms ont ça en magasin...

 

Bon, je vous laisse, de toute façon tout le monde s'en fout et Columbo va commencer.

 

PS : pour Anne Roumanoff, c'était censé être de l'humour...

 

 

 

 

 

Modifié (le) par mizar2001

Partager ce message


Lien à poster
Partager sur d’autres sites

Posté (modifié)

Il y a 2 heures, mizar2001 a écrit :

Mon humble avis -  lequel n'a pas changé malgré ce résultat récent - est que les meilleurs joueurs feront encore pas mal de résistance face aux meilleurs programmes et autres bots en NL Holdem. Pour une raison essentielle : avant d'être un jeu de stratégie et un jeu mathématique, le NLHE est avant tout, surtout, d'abord et essentiellement un jeu mental et un jeu d'adaptation.

En d'autre terme, c'est un jeu où le QE (quotient émotionnel) est plus important encore que le QI, la puissance de calcul et autres capacités analytiques. C'est d'ailleurs, probablement, l'une des raisons pour lesquelles aucun des meilleurs joueurs d'échecs au monde n'a cartonné durablement au poker.

Pas du tout d'accord. En fait je crois que les humains sont tellement loin d'être techniquement parfait au poker, que pendant longtemps c'est le mental qui a primé. Les top players en CG HU étaient ceux qui géraient le mieux la metagame, le tilt etc... Et petit à petit la tendance s'est inversée et maintenant la majorité des joueurs considérés comme top players ont une approche très GTO dans laquelle le but n'est pas de s'adapter mais juste d'être techniquement le meilleur possible.

Et justement si un bot sans émotions peut crush des top players c'est bien qu'en réalité ça n'a pas d'importance quand on est techniquement proche de la perfection.

 

Il y a 2 heures, mizar2001 a écrit :

2/ Y a un autres gros problème dans cette histoire. C'est que notre Libratus se faisait visiblement aider tous les soirs par des joueurs de poker en chair et  en os pour l'aider à résoudre ses faiblesses et à mieux s'adapter. Ce qui du coup fausse complètement le duel. Ce n'est plus un duel entre l'homme et la machine mais plutôt entre l'homme et la machine aidée par l'homme. Ce n'est plus du tout pareil !

Non, il ne se faisait pas aider par des joueurs de poker. C'est Noam Brown le créateur du bot qui travaillait dessus le soir. C'est un doctorant en théorie des jeux, même pas sûr qu'il batte la NL2 online.

Je trouve ça aussi un peu spécial que le bot puisse être changé en cours de partie. Ca me paraitrait plus éthique qu'il reste le même du début à la fin, quitte à la implémenter des capacités d'auto-modification. Mais je crois pas non plus que ce soit scandaleux... Les humains eux-aussi ont eu de l'aide extérieure (sessions avec d'autres top players etc...).

 

Il y a 2 heures, mizar2001 a écrit :

3/ J'ai tout de même un gros doute sur le fait que les quatre joueurs sélectionnés fassent parties de la crème de la crème en HU. Le poker a ceci de singulier par rapport aux autres sports ou jeux : un débutant peut battre le meilleur joueur du monde (sur le court terme). Et les meilleurs joueurs ne sont pas forcément les plus célèbres ou les plus médiatisés...

Ces 4 là ne sont pas du tout les plus célèbres ou les plus médiatisés... Justement ils ont le profil inverse. Et quand des mecs qui font autorité comme Galfond ou Doug Polk viennent également confirmer que ce sont 4 top players HU, je pense que c'est largement suffisant pour qu'il n'y ait plus vraiment débat.

 

 

Conclusion : J'étais à fond pour les humains lors de ce match, et moi aussi je trouve que les conditions de jeu étaient vraiment pas idéales. Mais faut pas oublier que les mecs qui ont organisé ça à la base ce sont pas des joueurs de poker... ce sont des universitaires, chercheurs en théorie des jeux qui connaissent pas tout ce monde. Et franchement je trouve que dans l'ensemble leurs 2 challenges (Claudico et Libratus) étaient bien faits. Ils ont choisis 4 vrais top players (pas comme les chercheurs de l'université d'Alberta), ils ont proposé du streaming... Et à la fin le résultat est sans appel. Du 15bb/100 sur 120.000 mains avec du duplicate poker (ce qui réduit énormément la variance), il y a juste pas photo.

 

Dans tous les jeux, échecs, backgammon, go, poker, il y a une période où l'humain est clairement meilleur, puis une transition et l'IA devient plus compétente. Aujourd'hui c'est clair et net que l'IA est devenue plus compétente que l'humain en CG HU NLHE. Félicitations à l'équipe de Carnegie Mellon :)

Modifié (le) par Pad

Partager ce message


Lien à poster
Partager sur d’autres sites

Posté (modifié)

Il est normal que les humains que nous sommes soient dans un premier temps excités puis aigris. Puis on fini par assumer que ces machines sont encore bien bêtes. Ce qui mène peu après à se rendre compte qu'elles pourraient réellement améliorer nos vies.

Modifié (le) par jou0eur

Partager ce message


Lien à poster
Partager sur d’autres sites
à l’instant, Pad a écrit :
Il y a 2 heures, mizar2001 a écrit :

2/ Y a un autres gros problème dans cette histoire. C'est que notre Libratus se faisait visiblement aider tous les soirs par des joueurs de poker en chair et  en os pour l'aider à résoudre ses faiblesses et à mieux s'adapter. Ce qui du coup fausse complètement le duel. Ce n'est plus un duel entre l'homme et la machine mais plutôt entre l'homme et la machine aidée par l'homme. Ce n'est plus du tout pareil !

Non, il ne se faisait pas aider par des joueurs de poker. C'est Noam Brown le créateur du bot qui travaillait dessus le soir. C'est un doctorant en théorie des jeux, même pas sûr qu'il batte la NL2 online.

Je trouve ça aussi un peu spécial que le bot puisse être changé en cours de partie. Ca me paraitrait plus éthique qu'il reste le même du début à la fin, quitte à la implémenter des capacités d'auto-modification. Mais je crois pas non plus que ce soit scandaleux... Les humains eux-aussi ont eu de l'aide extérieure (sessions avec d'autres top players etc...).

De ce que j'ai compris personne n'a touche au bot entre les sessions, c'est le bot lui-meme qui analysait la partie et adjustais sa strategie. Le bot a la base a juste appris les regles du jeu, il a simule XXXXXXX parties et appris par experience et apres chaque session il a analyse comment jouer son/ses adversaires pour adjuster

Partager ce message


Lien à poster
Partager sur d’autres sites

Une des applications possibles de l'algo á la based de Libratus: prévenir une épidémie de grippe en designant des smart drugs 

https://www.extremetech.com/extreme/244057-how-a-poker-playing-ai-could-help-prevent-your-next-bout-of-the-flu

Quote

What does this have to do with health care and the flu? Think of disease as a game between strategic entities. Picture a virus as one player, a player with a certain set of attack and defense strategies. When the virus encounters your body, a game ensues, in which your body defends with its own strategies and hopefully prevails. This game has been going on a long time, with humans having only a marginal ability to control the outcome. Our body’s natural defenses have been developed in evolutionary time, and thus have a limited ability to make on the fly adaptations.

But what if we could recruit computers to be our allies in this game against viruses? And what if the same reasoning ability that allowed Libratus to prevail over the best poker minds in the world could tackle how to defeat a virus or a bacterial infection? This is in fact the subject of a compelling research paper by Toumas Sandholm, the designer of the Libratus algorithm. In it, he explains at length how an AI algorithm could be used for drug design and disease prevention

 

Partager ce message


Lien à poster
Partager sur d’autres sites
Le 06/02/2017 à 16:45, HugoBoss a écrit :

Pourquoi est-ce que ce board "nécessite" plusieurs sizings si l'application correcte de la stratégie théorique optimale est impossible pour un humain ?

Même si le GTO demande 3 sizings dans plein de situations, c'est pas pour autant qu'on doit s'efforcer de suivre ses préceptes si ça implique qu'on joue encore moins bien qu'avec un sizing au final.

La nécessité elle vient de maximiser son EV d'humain à humain, si je joue parfaitement une stratégie à un seul sizing je vais faire beaucoup plus de profit qu'essayer de copier Pio et ses 3 sizings (pour faire n'importe quoi au final).

A cause du pavé insipide et totalement ininterressant de mizar vous êtes passé à coté de cette intervention qui est tout à fait juste 

Modifié (le) par Prout

Partager ce message


Lien à poster
Partager sur d’autres sites
Lire les 316 commentaires sur le forum
Les news à la Une
lundi 20 février 2017 à 9:51
Triton Super High Roller Series : Dan Colman au top de sa forme

Le Solaire Resort & Casino de Manille héberge depuis quelques jours une nouvelle édition du Triton Super High Roller Series. Le premier tournoi a souri à Dan Colman, victorieux pour près d'un demi-million de dollars devant Erik Seidel. Il ne s'agissait toutefois que du hors-d'œuvre. La dernière ligne droite du Main Event s'annonce dantesque.

lundi 20 février 2017 à 8:29
Télex

Vous êtes fan de johny depuis son passage mythique dans Zone Interdite ? Vous vous intéressez au sujet de l'investissement immobilier ? Faites d'une pierre deux coups en vous lançant dans le visionnage de cet entretien de 45 minutes réalisé par Tanguy Caradec pour la chaîne Investisseurs français à l'étranger.

jeudi 16 février 2017 à 8:33
Télex

Les joueuses ont beau avoir pris le pouvoir de l'autre côté de l'Atlantique, un petit Frenchie est aussi parvenu à tirer son épingle du jeu à Montréal. Quelques jours après avoir remporté un petit tournoi de Pot Limit Omaha pour 6 100 €, Nicolas Le Floch a récidivé en fin de festival lors d'un Second Chance avec à la clé un gain de 45 000 .

lundi 13 février 2017 à 9:15
Télex

Michel Abécassis semble chaud bouillant, mais Davidi Kitai est lui en petite forme : malade, le Belge du Team Winamax a peu dormi et se présente au jour 3 du WSOP 10 000 $ Short-Handed les traits tirés. Son jeu s'en trouvera-t-il affecté face à la vingtaine d'adversaires qui se dressent encore sur sa route ? Réponse après 32 minutes de visionnage !

vendredi 10 février 2017 à 14:15
Un rapport parlementaire préconise de taxer le PBJ plutôt que les mises

Dans un rapport publié mercredi, les députés Jacques Myard et Régis Juanico formulent plusieurs propositions de réforme du marché français des jeux d'argent. Si les médias généralistes ont surtout retenu la piste du contrôle d'identité des joueurs dans les débits de tabac, d'autres recommandations concernent plus spécifiquement les jeux en ligne.

vendredi 10 février 2017 à 10:43
Télex

Une petite vidéo d'Alexandre Luneau pour refermer la semaine, ça ne se refuse pas ! Durant une trentaine de minutes, Monsieur GTO se la joue incognito pour affronter un habitué des tables 5/10 de Winamax. Avec à la clé le survol de quelques thèmes clés du jeu en heads up, comme les spots de 4bet ou l'utilisation des blockers pour définir une range de call ou de bluff.

Tournois gratuits et prix ajoutés

Le Club Poker organise des freerolls avec bonus et des tournois spéciaux avec ajouts de prix.
Pour en bénéficier gratuitement, inscrivez-vous sur nos sites de poker partenaires :

Tournois Club Poker
aujourd'hui à 20:04
demain à 20:04
jeudi 23 février 2017 à 20:04
6-MAX
$2.20
vendredi 24 février 2017 à 20:04
$125 ajoutés
lundi 27 février 2017 à 20:04
Le chat joue au poker en ligne. Sisi.
Nouveau au poker ? Voici toutes les infos et réponses pratiques pour bien débuter et comprendre le poker en ligne.

Des tests complets et les bonus des poker rooms pour mieux choisir votre préférée.

Nos tournois, pour jouer entre nous, avec des prix et des cadeaux ajoutés chaque semaine.

Trouvez des infos pratiques et discutez sur le poker en ligne.

Pour les joueurs confirmés, apprenez à analyser vos mains au poker.