Jump to content
This Topic
superalaise

IA facebook dominerait des pros en 6 max

Recommended Posts

Posted (edited)

trouvé sur 20 minutes. si c'est confirmé, on se dirige un poker online très très compliqué a court terme.

l'IA de facebook nommée Pluribus aurait pris le dessus sur plusieurs joueurs pros en 6 tabling 

a priori ce serait une évolution de libratus. le papier a été publié dans Science.

le nouvel algorithme serait beaucoup plus léger en ressource car il ne va pas au bout de toutes les possibilités. un cloud léger permet de le faire tourner efficacement. 

les applications semblent énormes (cartographie des gps...) 

 

l'original en anglais (beaucoup plus détails sur la méthodologie ) :

https://ai.facebook.com/blog/pluribus-first-ai-to-beat-pros-in-6-player-poker/

 

Edited by superalaise

Share this post


Link to post
Share on other sites
Posted (edited)

Génial l'article anglais. Hyper interessant. C'est très cool qu'ils aient donné autant de détails sur la façon dont le bot joue/s'entraine. Assez sick le temps de décision moyen :o J'serais curieux d'avoir l'avis de linuslove plutot que celui de ferguson par contre. Très cool qu'ils aient mis un prizepool en plus histoire de motiver les pros a jouer du mieux qu'ils peuvent!! 5bb/100 vs ce pool de dingue et sans que l'ia s'adjust aux erreurs de son adversaire c'est sick. Comme quoi y'a encore de la marge de progression. En tous cas c'est assez fascinant comme article. J'adorerais pouvoir jouer contre ou simplement voir les hh.

Ce qui me fait le plus froid dans le dos c'est les 150$ de cloud computing (seulement) pour self train le truc + le peu de matos requis pour le faire jouer real-tim, plutot que la salle immense remplie de matos hors de prix dont libratus avait besoin. Heureusement que la création de l'ia reste encore hors de portée de pas mal de gens mais bon ca veut quand meme dire que c'est de plus en plus simple. 

J'ai bien aimé ce graph aussi :
67064888_389656325232510_209876196849090

Il lui faut 7h pour crush un humain, 20 pour crush any humain.. par contre c'est seulement au bout de trois jours qu'il découvre que limp est pas optimal. Imagine le bot qui te crush, toi un des top dawgs du poker online, en seulement 20h d'apprentissage et en faisant un peu nimp préflop genre limp any position ou open 6x :D 

Edited by fredydruger

Share this post


Link to post
Share on other sites

oui, les conséquences pour le poker online à court terme sont énormes. 

si un groupe de développeurs a prouvé que c'était possible, d'autres vont y arriver rapidement. 

avec de telles configurations, il n'y aura pas que les expressos qui seront infectés de bots (......)

Share this post


Link to post
Share on other sites

Ouais enfin là ca demande quand meme d'autres compétences que la team sur les expressos. On parle d'un truc genre une équipe des meilleurs chercheurs dans le domaine de l'IA et le deep/machine learning (me souvient jamais de la diff entre les deux), pas de joueurs de poker pros avec un pote programmeur  qui vont seulement utiliser des outils déjà faits genre piosolver. Ils le précisent bien dans l'article, le poker est juste un moyen de benchmark leur IA mais pas le but en soi. Quand on pense aux applications possibles dans le monde de la finance et compagnie, on se doute que des gens qui ont les compétences pour programmer ça sont pas spécialement interessés par sa profitabilité au poker qui est probablement ridiculement faible comparé aux autres domaines d'application possibles.

Je me demande pourquoi ils ont pas poussé le taff jusqu'a l'adaptation vs adversaire non-self. D'ailleurs ca confirme llinusllove en sick endboss du game a -0.5bb/100 quand la moyenne est a -5

Share this post


Link to post
Share on other sites

C'est super stimulant et effrayant en même temps!

Si en plus tu rajoute l adaptation aux joueurs l IA sera monstrueuse!!!!

J aime beaucoup le graphique  mais j aurai bien voulu avoir une idée de combien de main de poker représente 1h d entraînement. Probablement quelques années de grinder online et quelques vies de livetard.

L IA de Google qui s entraînait à starcraft 2 avait fait l equivalent de 200 ans d entraînement en 14 jours.

Sachant qu un humain devant manger dormir et baiser, il lui faut bien 3 ans pour faire une année  d'entraînement.

Share this post


Link to post
Share on other sites

Bizarre le 66. Je comprends pas pourquoi risquer autant avec une main drawing quasi dead vs un call. Je serais curieux de connaitre le reste de sa range et surtout à quelle fréquence il fait ce genre de truc avec ce genre de main.

A propos des implications sur la profitabilité future du poker online les rooms auront largement le temps de tout niquer avec leurs politiques antiregs bien avant une montée en puissance des bots amha.

Share this post


Link to post
Share on other sites

J'ai lu les articles hier soir et de mémoire, le test a été effectué sur 10kh ce qui n'est absolument pas représentatif. Le bot à l'air de s'adapter aux humains en fonction de ce qu'on fait mais quid lorsque l'humain s'adapte aussi ? Enfin bref, curieux de savoir ce qui peut se passer sur un volume lissant la variance !

Share this post


Link to post
Share on other sites
Posted (edited)
il y a une heure, AsKiPik a écrit :

J'ai lu les articles hier soir et de mémoire, le test a été effectué sur 10kh ce qui n'est absolument pas représentatif. Le bot à l'air de s'adapter aux humains en fonction de ce qu'on fait mais quid lorsque l'humain s'adapte aussi ? Enfin bref, curieux de savoir ce qui peut se passer sur un volume lissant la variance !

T'as du lire en diagonale (ou lire l'article de 20m qui est une vraie m**de, évidemment seul l'article en anglais et la parution dans la revue sont écrites serieusement par des gens ayant au moins des notions de base au poker) parce que c'est bien écrit que l'IA ne s'adapte pas à ses adversaires et que sur le sample de 10kh y'a un algorithme "réducteur de variance" qui va par exemple (en gros) donner autant de mains fortes aux uns qu'aux autres pour simuler un échantillon plus grand. Y'avait déjà la même chose sur libratus il me semble. Obv ca peut pas etre parfait mais du coup ca réduit l'écart type possible. Ecart type qui, en plus de ça, est  toujours donné sur les graphs de l'article. L'humain pourra toujours essayer de s'adapter autant qu'il veut/peut, plus il va devier de l'équilibre plus il va perdre. Sa seule solution c'est d'essayer de perdre le moins possible en étant le plus équilibré possible mais a mon avis il peut pas vraiment gagner. Ce genre d'IA dépasse le niveau humainement atteignable avec nos petits cerveaux je crois :super-desole: :D Faut aussi prendre en compte que dans les games 5 humans vs AI, un type comme llinus va surement perdre moins contre le bot que les autres humains mais aussi leur récuperer un peu de ce qu'il a perdu vs le bot. J'ai pas lu l'article dans la revue mais dans l'article facebook ca parle pas de la config de ces games là et si les humains ont des HH entre eux, ce qui changerait pas mal la perception de leurs winrates respectifs sur cette game.

Sur un échantillon plus grand, et surtout si tu donnes a l'IA la capacité de dévier de sa stratégie pour exploiter les failles chez ses villains (surement plus grandes chez ferguson que chez llinusllove) l'IA va gagner de plus en plus, et potentiellement completement crush certains d'entre eux à des winrates incroyables.

Edited by fredydruger

Share this post


Link to post
Share on other sites
Posted (edited)

Je suis sur téléphone donc c’est galère de faire des recherches sur le sujet. 

Vous pouvez me confirmer que les mecs c’était des joueurs de MTT ? J’ai pu lire « champions WSOP ».

Un peu dommage si c’est le cas car ça n’a pas grand intérêt. Ceci dit je doute assez peu du fait que leur IA puisse avoir un winrate positif contre des spécialistes.

Edited by Pad

Share this post


Link to post
Share on other sites

C'est ce qui se disait aussi hier sur 2+2. Certains étaient curieux de savoir quels seraient les résultats vs 5 grinders de cash game plutôt que vs des joueurs de mtt (dont certains plus forcément au goût du jour, comme Ferguson qui serait trop serrure pour ce genre de partie en 6 max). 

 

Share this post


Link to post
Share on other sites
Il y a 3 heures, Pad a écrit :

Vous pouvez me confirmer que les mecs c’était des joueurs de MTT ? J’ai pu lire « champions WSOP ».

oui la majeure partie de la line up est reconnue pour les mtt.

 

On notera tout de même que dans al config 5AI vs 1 humain, Linus s'en sort à un lossrate très honorable de -0,5bb/100 (1bb de mage d'erreur).

Share this post


Link to post
Share on other sites
Il y a 4 heures, Pad a écrit :

Je suis sur téléphone donc c’est galère de faire des recherches sur le sujet. 

Vous pouvez me confirmer que les mecs c’était des joueurs de MTT ? J’ai pu lire « champions WSOP ».

Un peu dommage si c’est le cas car ça n’a pas grand intérêt. Ceci dit je doute assez peu du fait que leur IA puisse avoir un winrate positif contre des spécialistes.

Y'a un peu des deux il me semble. Comme l'ont dit mes prédécesseurs y'a quand meme au moins linus qui sait a peu près ce qu'il fait en CG :D Et y'a aussi Jimmy Chou et Jason Les qui étaient déjà dans la team de pro hu cash qui ont joué contre libratus, et qui sont des potes/study pals de doug polk si je me trompe pas? Et après y'a d'autres joueurs plutot orientés mtt, certains au profil jeune crusher et d'autres plutot vieille légende à chapeau de cowboy

Share this post


Link to post
Share on other sites

Y a que ces trois mains de disponibles en exemple?

 

J'imagine qu'elles ont été choisies par un type du marketing plutôt que par un joueur de poker. Aucune des trois me démontre que cette AI est impressionnante. C'est pas aussi simple parce que y a quand même des trucs qui vont dans le sens de l'AI (ici la présence de Linus), mais genre, pourquoi Ferguson, et pourquoi autant de joueurs de MTT? Est-ce que y a une bonne raison de pas prendre les 5 plus gros crusheurs du moment autre que d'augmenter les chances que l'AI finisse en gain pour pouvoir faire les news?

 

Similaire pour Libratus, où ils les font jouer pendant 10h d'affilée à 200bb deep... et c'était encore pire pour celui de Starcraft qui avait aucun sens. A chaque fois j'ai l'impression que le but c'est que des journaux puissent dire que les AI marchent, plutôt que d'avoir des informations réelles sur ses compétences.

Share this post


Link to post
Share on other sites
News

Libratus était aussi fascinant qu'inquiétant. Pluribus, sa progéniture, l'est autant si ce n'est plus. Cette intelligence artificielle développée par Tuomas Sandholm et Noam Brown vient en effet de dominer plusieurs joueurs de poker aguerris dans une configuration à six. Un véritable bond en avant par rapport aux performances constatées en heads up ces deux dernières années.

[...] Lire la suite…




Tuomas Sandholm, le papa de Pluribus

Share this post


Link to post
Share on other sites

Oui apparemment pluribus est down de 7bb/100 sur les 10k mains mais up de 5bb/100 après avoir appliqué la fameuse "technique de réduction de variance" (AIVAT). Mais ils n'expliquent pas comment celle-ci est calculée.

Il est aussi expliqué dans l'article de Science que cette l'AIVAT est impossible à appliquer aux joueurs humains. Donc pour le coup leurs winrates respectifs sont complètement bidons.

 

Share this post


Link to post
Share on other sites

Bah justement c'est bien ça le problème., cet algorithme de réduction de variance n'est pas détaillé dans les articles. Il y bien un papier scientifique dessus (mais bon, pas que ça à foutre de le lire 8^).

Mais en gros, d'après l'article de facebook, ils appliquent une "baseline value" à chaque "situation" (pas très clair si par "situation" ils entendent  simplement les hole cards ou si c'est plus compliqué que ça...). Et on soustrait cette baseline value du montant gagné sur un pot.
Donc si le bot remporte un gros coup parce qu'il avait de bonnes cartes, le montant final du gain (pris en compte dans l'AIVAT) sera plus petit.

Edited by VeridisQuo

Share this post


Link to post
Share on other sites

Create an account or sign in to comment

You need to be a member in order to leave a comment

Create an account

Sign up for a new account in our community. It's easy!

Register a new account

Sign in

Already have an account? Sign in here.

Sign In Now


  • Recently Browsing   0 members

    No registered users viewing this page.

English
Retour en haut de page
×
Unibet : Unibet Open Malte
Unibet : Unibet Open Malte