Phil Ivey Variance par Dudley

Quel que soit votre niveau au poker, vous subissez les effets de la variance. Qu'est-ce que la variance ? C'est ce qui éloigne votre courbe de gains (ou de pertes) réelle de votre courbe de gains (ou de pertes) théorique. La variance est, par exemple, ce qui fait que vous allez plutôt gagner que perdre un pile ou face. Elle reste impalpable, mais vous en ressentez pourtant les effets, et aucun joueur n'y échappe.

Introduction à la variance

N'importe quel joueur de poker a expérimenté les affres de la variance et leurs conséquences : bad run, tilt, perte de confiance, dégradation du jeu, banqueroute...

Le but de cet article est de vous familiariser avec certains concepts clés à connaître à propos de la variance. Afin de bien la comprendre, dans le but de mieux l'accepter, et de tenter de limiter ses effets néfastes.

Nous verrons tout d'abord si la chance finit par s'équilibrer sur le long terme, ou pas. Ensuite, nous apprendrons à mesurer la variance et serons également amenés à découvrir ce qui se cache derrière la fameuse courbe en cloche, chère aux statisticiens.

Enfin, nous tenterons de répondre aux angoissantes questions que vous vous êtes sans doute tous posées un jour :

  • Suis-je un joueur gagnant ?
  • Quel est mon vrai winrate ?
  • C'est quand le long terme ?
  • Peut-on run bad à vie (sans s'appeler Tilou, ndlr) ?

I. Le poker, un jeu de talent, ou un jeu de chance ?

Le poker est un jeu de semi-hasard. Vos résultats, gains ou pertes, sont en partie dus à votre talent, et en partie dus au hasard. Votre talent consiste à prendre les meilleures décisions possibles pendant le jeu et autour du jeu, ainsi qu'à contrôler vos émotions lors des parties live. Le hasard se manifeste principalement à travers les cartes qui tombent.

Une des sempiternelles questions que l'on entend à propos du poker est :

« Quelle est la part de talent et quelle est la part de chance dans ce jeu ? »

 

Répondre à cette question en donnant un pourcentage de chance et un pourcentage de talent, que ce soit 40 % - 60 % ou 90 % - 10 % n'a pas vraiment de sens, en tout cas sans plus de précisions. Une réponse plus proche de la vérité serait : tout dépend du nombre de mains jouées.

Chacun sait que le pire des fishs pourrait décaver Phil Ivey sur un coup. Il peut même, s'il est en veine, sortir gagnant d'une session contre le champion. Cependant, Ivey parviendra toujours à recouvrer ses pertes si on lui en laisse le temps, et il finira par décaver le fish (si on part de l'hypothèse raisonnable qu'Ivey est meilleur que le fish, ndlr). En résumé, plus on joue longtemps, et plus l'edge d'un joueur va s'affirmer face à la part de chance.

Imaginons maintenant que l'on puisse répéter 100 fois la session précédente entre Ivey et le fish, exactement dans les mêmes conditions, en changeant uniquement les tirages de cartes ; on obtiendrait alors 100 résultats différents, le fish ressortant victorieux sur quelques sessions, et se faisant raser sur la plupart des autres. Ce sont ces fluctuations des résultats, dues au hasard, que l'on appelle variance. Une autre façon d'appréhender la variance est de regarder la courbe de gains d'Ivey sur l'enchaînement des 100 sessions : elle ne ressemblera pas à une droite montant régulièrement, mais elle présentera des variations, soudaines ou durables, que ce soit à la hausse ou à la baisse.

Avant d'aller plus loin avec le jeu complexe qu'est le poker, nous allons essayer de découvrir, sur un exemple aussi simple qu'un jeu de Pile ou Face, comment la chance finit par s'équilibrer sur le long terme en un sens et, au contraire, comment elle ne s'équilibre pas en un autre.

Remarque

La plupart des concepts exposés dans cet article seront développés à partir de jeux de Pile ou Face, par simplicité, mais ils s'appliquent de la même façon au Poker.

II. De la chance qui finit par s'équilibrer sur le long terme. Ou pas.

On considère le jeu de Pile ou Face suivant : on jette une pièce en l'air et, si elle retombe sur Pile, on gagne 1 € ; si elle retombe sur Face, on perd 1 €.

On représente l'edge (notre supériorité de niveau de jeu) qu'on aurait sur notre adversaire au poker par un déséquilibre de la pièce utilisée : cette dernière retombe sur PILE 53 % du temps et sur FACE 47 % du temps. Notre edge se traduit par une espérance de gain, qui est ici de 0,06 € par tirage.

Variable aléatoire

Le gain en euros sur un tirage est ce que l'on appelle une variable aléatoire. Cette variable aléatoire, (notons-la X), peut prendre les valeurs +1 ou -1 pour notre jeu, car nous gagnons (+) ou nous perdons (-) 1 € selon le résultat du lancer.

La loi de probabilité de X est définie par le fait que X=1 avec une probabilité de 0,53 et X=-1 avec une probabilité de 0,47. L'espérance de X, qui est le winrate théorique (une sorte de valeur moyenne de X, c'est-à-dire ce qui se passerait si la variance n'existait pas), se calcule ainsi :

E(X) = (chance_de_gagner * ce qu'on gagne) - (chance_de_perdre * ce qu'on perd)

E(X) = 0,53 * 1 + 0,47 * (-1) = 0,53 – 0,47 = 0,06

(Il est cohérent que ce nombre soit positif parce que, dans notre exemple avec une pièce truquée, on gagne plus souvent qu'on ne perd)

Considérons une série de 100, 1 000, 5 000 ou même 30 000 lancers. À quoi peut-on s'attendre en ce qui concerne notre courbe de gains ?

Voici les résultats donnés par la simulation d'une série de tirages :

Gains sur 100 tirages Variance 1

À court terme, notre edge n'a pas tellement "le temps de s'exprimer" face à la variance. Nous ne sommes pas du tout assurés d'être positifs sur une courte période. Notre courbe de gains (en bleu sur le dessin) semble se moquer de l'axe de gains théoriques (en rouge : le segment se finit bien à 100 lancers et 6 € gagnés, conformément à l'espérance).

Gains sur 1000 tirages Variance 2

À moyen terme, notre edge va nous permettre d'être positifs, même si nos gains peuvent rester petits en comparaison de ce que l'on aurait dû gagner. Notre courbe de gains s'écarte encore beaucoup de l'axe de gains théoriques.

Gains sur 5000 tirages Variance 2

Notons que l'écart absolu entre notre gain réel et notre gain théorique a tendance à grandir au fil des tirages. En ce sens, la chance ne s'équilibre pas sur le long terme : au contraire, la variance ne fait que s'accumuler au fil des tirages.

Gains sur 30000 tirages Variance 2

À long terme, notre edge va pleinement s'exprimer. Notre courbe de gains va de plus en plus coller à l'axe de gains théoriques et finit par ressembler à une droite (par effet de zoom arrière). Notre gain va devenir largement positif, relativement proche de notre gain théorique.

Variance, équilibrage de la chance, par Dudley

[img]

Sur cette même série de tirages, observons ce qu'il advient de notre courbe de gain moyen (appelé winrate) :

Winrate sur 100 tirages Variance 2

On remarque que les variations du winrate sont de moins en moins fortes à mesure de l'augmentation du nombre de tirages. À court terme, notre winrate va d'abord beaucoup varier et peut éventuellement être négatif.

Winrate sur 1000 tirages Variance 2

À moyen terme, le winrate devient positif. En réalité, il se rapproche plus ou moins du winrate théorique (0,06), et devient de facto positif.

Winrate sur 5000 tirages Variance 2

À long terme, notre winrate "tend" vers 0,06€, qui est la valeur du winrate théorique. On remarque que le début de la courbe bleue décrit une ligne assez erratique, puis s'assagit à mesure que le nombre de tirages croît.

Winrate sur 30000 tirages Variance 2

On peut dire qu'en ce sens, la chance s'équilibre sur le long terme. En tout cas, notre gain semble bien se rapprocher de notre winrate théorique (0,06) quand le nombre de tirages grandit.

Une autre illustration efficace de la variance

Une autre illustration efficace de la variance consiste à observer le sort de 10 joueurs différents.

Gains sur 100 tirages 10 joueurs Variance 2
Gains sur 1000 tirages 10 joueurs Variance 2
Gains sur 5000 tirages 10 joueurs Variance 2
Gains sur 30000 tirages 10 joueurs Variance 2

Remarquons qu'après 5 000 tirages, le plus chanceux des 10 joueurs a gagné 490 € (respectivement 160 € pour le moins chanceux) à la place des 300 € théoriques. Cela fait un écart de + 190 € soit + 63% (respectivement – 140 € soit – 47 %). Après 30 000 tirages, le plus chanceux des 10 joueurs a gagné 2150 € (respectivement 1500 € pour le moins chanceux) à la place des 1800 € théoriques. Cela fait un écart de + 350 € soit + 19 % (respectivement – 300 € soit – 17 %).

En résumé, lorsque l'on augmente le nombre de tirages, notre courbe de gains va avoir tendance à s'écarter de notre axe de gains théoriques en valeur absolue (en €), mais à s'en rapprocher en valeur relative (en %).

 

Attention, quand je dis que la courbe de gains va avoir tendance à s'écarter de l'axe de gains théoriques en valeur absolue, il ne faut pas croire que notre courbe va suivre une tendance irréversible. Plus on joue, plus on a de chances de se trouver loin de l'axe en valeur absolue. Ce n'est pas parce qu'on a manqué de chance jusqu'à présent que ça va continuer, ou qu'au contraire ça doit se compenser : il n'y a simplement aucun rapport entre la chance ou malchance passées et la chance ou malchance futures.

Retenons plutôt cette convergence de la courbe de gains réels vers l'axe de gains théoriques en valeur relative, qui est équivalente à la convergence de notre winrate réel vers notre winrate théorique. Cette convergence, connue sous le nom de « loi des grands nombres », se visualise d'ailleurs plus facilement sous cette forme :

Winrate sur 100 tirages 10 joueurs Variance 2
Winrate sur 1000 tirages 10 joueurs Variance 2
Winrate sur 5000 tirages 10 joueurs Variance 2
Winrate sur 3000 tirages 10 joueurs Variance 2

En conclusion, et c'est ce qui compte pour nous, joueurs de poker : nous pouvons être assurés que notre edge sera plus fort que la variance sur le long terme. Maintenant, la question que vous devez tous vous poser, c'est : « Est-ce que c'est loin le long terme ? ». Avant de pouvoir répondre à cette question, il nous faut d'abord savoir comment mesurer la variance et également comprendre ce qu'est une loi normale.

III. Mesure de la variance

Considérons un nouveau jeu de Pile ou Face, où l'on gagne 2 € si l'on fait Pile et l'on perd 2 € si l'on fait Face. La pièce est déséquilibrée, de sorte qu'elle tombe sur Pile 51,5 % du temps, et sur Face 48,5 % du temps (pour simplifier, avec notre jeu actuel, nous gagnons moins souvent, mais plus d'argent quand on gagne).

Si l'on compare avec le jeu étudié précédemment, on peut calculer que l'espérance de gains est la même, à savoir 0,06€ par tirage. Cependant, nous allons voir que ces deux jeux diffèrent en ce qui concerne la variance.

Regardons ce que ça donne au niveau des courbes de gains sur quelques simulations (en vert, le jeu actuel, et en bleu, l'ancien jeu) :

[img]

Gains sur 100 tirages Variance 3
Gains sur 1 000 tirages Variance 3
Gains sur 10 000 tirages Variance 3

 

On constate que la courbe de gains pour le deuxième jeu (en vert) présente des variations plus importantes, que ce soit à court ou à long terme, en comparaison avec la courbe de gains du premier jeu (en bleu). La variance est donc, empiriquement, plus grande dans le deuxième jeu. La raison en est que, pour ce deuxième jeu, les gains possibles sont plus dispersés par rapport à l'espérance.

 

Il est possible de quantifier précisément la variance associée à un jeu, par une mesure que l'on appelle l'écart-type.

 

Pour pouvoir mesurer l'écart-type associé à une variable aléatoire X, on calcule tout d'abord ce que l'on appelle la variance mathématique V(X), à l'aide de la (jolie) formule suivante : V(X) = E(X²) – E(X)² .

La variance mathématique est égale à l'espérance des carrés moins le carré de l'espérance.

 

Exemples de calculs de variance :

 

X désigne le gain sur un lancer correspondant au premier jeu : on sait que X=+1 ou X=–1. Dans tous les cas, on a donc X² =1 et par conséquent E(X²)=1. Par suite V(X) = 1 – 0,06² = 1 – 0,0036 ~ 1.

On note Y le gain sur un lancer correspondant au deuxième jeu : Y² = 4 et donc V(Y) = 4 – 0,0036 ~ 4.

V(Y) ~ 4 * V(X) : nous verrons que cela implique que le winrate du deuxième jeu va converger vers le winrate théorique 4 fois plus lentement que celui du premier jeu.

L'écart-type de X, noté σ(X) (lire "sigma de X"), est simplement la racine carrée de la variance mathématique de X.

Cet écart-type σ(X) est une sorte d'écart moyen entre les valeurs prises par X et l'espérance E(X). Précisons toutefois que l'écart-type n'est pas exactement égal à l'écart moyen.

 

Pour les deux jeux étudiés, on calcule que σ(X) ~ 1 et σ(Y) ~ 2.

σ(Y) ~ 2 * σ(X) : nous verrons que cela implique que les fluctuations de la courbe de gains du deuxième jeu par rapport à l'axe de gains théoriques sont deux fois plus importantes que celles de la courbe de gains du premier jeu. En moyenne, la courbe de gains du deuxième jeu va se trouver deux fois plus éloignée de l'axe de gains théoriques que la courbe de gains du premier jeu.

 

Une propriété de la variance mathématique est qu'elle est additive, c'est-à-dire que V(X+Y)=V(X)+V(Y) pour deux variables aléatoires indépendantes X et Y. Cela implique que la variance mathématique des gains pour 100 lancers est égale à 100 fois la variance mathématique du gain pour un lancer. On peut en déduire que la variance mathématique du winrate pour 100 lancers est 100 fois plus petite que la variance mathématique du gain pour un lancer (cf. explications ci-après).

L'écart-type des gains, quant à lui, n'augmentera qu'avec la racine carrée du nombre de lancers ; ainsi, l'écart-type des gains pour 100 lancers est égal à 10 fois l'écart-type du gain pour un lancer. L'écart-type du winrate pour 100 lancers sera 10 fois plus petit que l'écart-type du gain pour un lancer.

Explications pour les courageux

Notons X le gain sur une expérience aléatoire et Xn le gain cumulé sur la répétition de n fois cette expérience.

Le Winrate Wn sur les n expériences est défini par Wn=Xn/n.

La propriété d'additivité de la variance donne V(Xn)=V(X)*n.

D'autre part, on voit facilement que V(Xn/n)=V(Xn)/n².

Dès lors, V(Wn)=V(Xn/n)=V(Xn)/n²=V(x)*n/n²=V(X)/n.

On en déduit que σ(Xn)=σ(X)*rac(n) et que :

σ(Wn)=σ(X)/rac(n)

IV. Paramètres influant sur la variance au poker

En cash-game

Pour estimer la variance de votre jeu en Cash-Game, vous pouvez utiliser un tracker, comme Holdem Manager ou Poker Tracker. En anglais, l'écart-type se nomme "Standard Deviation", abrégé en SD (attention à ne pas confondre avec Showdown Value, qui n'est pas du tout le sujet ici). Celui-ci est en général exprimé en bb/100, c'est-à-dire en big blinds pour 100 mains. Cette unité permet de comparer des limites différentes, sur un nombre de mains fixé.

Avec Holdem Manager, dans les Reports, il faut ajouter (avec la croix blanche sur fond vert) la statistique "Standard Deviation big blinds" se trouvant dans "Default Stats". Avec Poker Tracker, dans l'onglet "Sessions", cliquez sur "More Details".

Pour donner un ordre de grandeur, en NL100 sur le .FR, j'ai un SD de 85 bb/100 en SH, 75 bb/100 en FR, et il monte jusqu'à plus de 140bb/100 en HU...

Vous pouvez obtenir des valeurs assez différentes suivant le jeu que vous avez l'habitude de jouer.

 

En Cash-Game, la variance mathématique du total de vos gains augmente avec la somme des carrés des gains de chaque main. Ce sont donc surtout les gros pots (et particulièrement les pots à tapis) qui font augmenter cette variance. Pour une limite donnée, un pot à +/- 100bb contribue pour autant de variance mathématique que 100 pots à +/- 10bb. Par exemple, sur les mains répertoriées par mon tracker, les pots à tapis ne représentent que 1 % des mains, mais contribuent à 50 % de la variance mathématique totale. Si vous avez l'habitude de jouer à différentes limites, sachez qu'à SD constant, 10 000 mains de NL400 contribuent à autant de variance mathématique que 160 000 mains de NL100.

 

La fréquence de gros pots dépend elle-même de plusieurs paramètres, parmi lesquels on peut citer :

  • Le nombre de joueurs : moins il y a de joueurs et plus la variance est grande. Si vous avez assimilé le concept de position, vous savez que plus vous êtes en position tardive, plus il est profitable d'ouvrir une main donnée. En FR, vous allez jeter la plupart de vos mains UTG et vous n'aurez le bouton qu'une fois sur 9. En HU, vous avez le bouton une fois sur 2 et vous allez ouvrir la majorité du temps. Cela va entraîner de nombreux 3-bet, et cette dynamique preflop est favorable à de fréquents tapis ; donc plus souvent de gros pots, et une variance de fait augmentée.
  • La variante : l'Omaha occasionne plus de variance que le Holdem. Cela est dû au fait qu'en Omaha, avec les multiples tirages possibles, on se retrouve souvent en situation de jouer, au pire un 60/40, ce qui donne les cotes pour suivre un tapis.
  • Le format de mise : le No Limit occasionne bien plus de variance que le Limit (on verra que ceci est à tempérer pour ce qui est de la variance relative).
  • La profondeur de votre tapis : un shortstacker aura moins de variance qu'un joueur qui est cavé au maximum (encore une fois, ceci est à tempérer pour ce qui est de la variance relative).
  • Le style de jeu de vos adversaires : la NL600 occasionne plus de variance (en bb/100) que la NL100, de par l'agressivité accrue de vos adversaires. La NL2 entraînera plus de variance que la NL100 de par la loositude accrue de vos adversaires, qui ont tendance à payer la moindre gutshot sans les cotes jusqu'au bout.

En tournoi (SNG et MTT)

Pour les tournois, il va falloir estimer la variance "à la main", car la mesure de la SD pour les tournois n'est, à ma connaissance, pas encore implémentée dans les trackers.

 

Exemple de calcul du SD sur un SNG 6 joueurs 100$ :

 

La structure de paiement sera de 356 $ pour la première place et 192 $ pour la deuxième. Imaginons que l'on fasse 20 % de 1res places (soit + 2,56 BI), 20% de 2es places (soit + 0,92 BI) et donc 60 % de places non payées (soit -1 BI).

Notre espérance de gains (ROI, return on investment) est de 9,6 % et notre variance se calcule ainsi :

V(X) = 20% * 2,56² + 20% * 0,92² + 60% * 1² - 9,6%² ~ 207 %.

Notre SD sur un tel SNG vaut donc σ(X) ~ 144%.

 

En tournoi, les paramètres influant sur votre variance seront :

  • La structure de paiement : elle peut être plate (faible variance) ou abrupte (grosse variance). Plus les gains possibles sont gros et plus la structure génère de variance. Pour un SNG 10 joueurs, une structure de paiement classique (50 % au vainqueur, 30 % au deuxième, et 20 % au troisième) génère moins de variance qu'un "Winner Takes All" mais plus qu'un "Double or Nothing".
  • Le nombre de joueurs : pour les SNGs et MTTs à structure de paiement classique, plus le nombre de joueurs est élevé et plus la variance est forte. En effet, la structure de paiement offrira des possibilités de gains plus importants s'il y a plus de joueurs.
  • Votre stratégie globale : jouer la gagne (plus de variance) ou plutôt jouer l'ITM (moins de variance).
  • Votre niveau : votre variance augmente avec votre pourcentage de gros gains. Un bon joueur aura une variance plus grande qu'un joueur lambda, car son pourcentage de gros gains sera plus élevé que celui d'un mauvais joueur (les HU et les DoN font exception à cette règle).
  • Votre style de jeu, ainsi que celui de vos adversaires.
  • La possibilité et la volonté de dealer : les joueurs participant à un deal en fin de tournoi vont faire baisser leur variance.

 

J'ai calculé des SDs pour quelques formats classiques de SNGs/MTTs :

[html]

Nombre de
joueurs
SD d'un joueur
moyen
SD d'un bon joueur
avec ROI ~ 10 %
SNG HU ou DON94 %94 %
SNG 6 joueurs138 %144%
SNG 9 joueurs141%149 %
SNG 10 joueurs152 %161 %
SNG 18 joueurs189 %207 %
SNG 27 joueurs220 %238 %
SNG 45 joueurs253 % 282 %
MTT 100 joueurs342 %370 %
EPT 891 joueurs736 %815 %

Précisions sur les choix des tournois du tableau

Le MTT 100 joueurs a une structure de paiement calquée sur le 2000 € de Wagram, avec 10 % de payés. La structure de l'EPT est celle du dernier EPT Deauville, avec 120 payés. Les SNGs ont le et les structures des Non Turbo sur PokerStars.fr.

V. La Loi Normale

Revenons à notre premier exemple de jeu de PILE ou FACE (rappel : 1 € de gain avec une probabilité de 53 %, et 1 € de perte le reste du temps). Voici les différentes probabilités de gains, représentées selon un nombre croissant de tirages :

Probabilités de gains sur 1 tirage

Sur un seul tirage, la probabilité de gagner le flip est de 0,53 et la probabilité de le perdre est de 0,47.

Probabilités de gains sur 2 tirages

Sur deux tirages, la probabilité de les gagner les deux est de 0,53 * 0,53 ~ 0,28. La probabilité de perdre les deux est de 0,47 * 0,47 ~ 0,22. La probabilité de gagner 1 flip sur les deux tirages est d'environ 0,50.

Probabilités de gains sur 5 tirages

On remarque que les valeurs centrales, proches de la moyenne, ont plus de chances d'être prises que les valeurs extrêmes. Le phénomène s'amplifie à mesure de l'augmentation du nombre de tirages.

Et ainsi de suite, en augmentant le nombre de tirages

Lorsque l'on augmente le nombre de tirages, les valeurs extrêmes sont pratiquement impossibles à atteindre et seules les valeurs centrales ont des chances raisonnables d'être prises. Les probabilités semblent dessiner une espèce de cloche. Cette cloche, ou "gaussienne", représente ce que l'on appelle une loi normale de probabilité. Cette loi est universelle : quelle que soit l'expérience aléatoire que vous répétez et quel que soit ce que vous comptabilisez, la somme de ce que vous êtes en train de compter sur toutes les expériences va suivre une loi qui tend vers une loi normale lorsque vous augmentez le nombre de tirages. Ce résultat est connu sous le nom de théorème central limite. L'approximation est ici déjà très bonne pour un nombre de tirages égal à 100.

Probabilités de gains sur 8 tirages
Probabilités de gains sur 100 tirages
Représentation de la loi normale

Pour caractériser une loi normale, il suffit de connaître où se trouve le sommet de la cloche (la moyenne µ (prononcer "mu") de la loi), et l'écartement de la cloche (l'écart-type σ de la loi). Cette loi normale peut se noter N(µ;σ). Voici la répartition des valeurs prises par une variable aléatoire suivant une loi normale N(µ;σ) :

 

[img]

 

On peut retenir (mais on n'est pas obligé, ndlr) que pour une variable aléatoire X qui suit une loi normale N(µ;σ) :

  • La probabilité que X se trouve dans l'intervalle [ µ - σ ; µ + σ ] est de plus de 68 %
  • La probabilité que X se trouve dans l'intervalle [ µ - 2σ ; µ + 2σ ] est de plus de 95 %
  • La probabilité que X se trouve dans l'intervalle [ µ - 3σ ; µ + 3σ ] est de plus de 99,7 %
  • La probabilité que X se trouve dans l'intervalle [ µ - 4σ ; µ + 4σ ] est de plus de 99,99 %

 

En français, la première assertion signifie, grosso modo : "avec plus de 68 % de chance, on se situe entre la moyenne (théorique) moins l'écart-type, et la moyenne théorique + l'écart-type", ndlr)

 

L'écart moyen entre X et µ est égal à environ 0,8 * σ.

L'écart médian entre X et µ est égal à environ 0,7 * σ.

 

Lorsque l'on répète un assez grand nombre n de fois une expérience aléatoire dont le gain X suit une loi d'espérance E(X) et d'écart-type σ(X), alors on peut approximer le gain Xn sur l'ensemble des n expériences par une loi normale N(µ=E(X)*n ; σ =σ(X)*rac(n)) et le Winrate Wn par une loi normale N(µ=E(X) ; σ =σ(X)/rac(n)).

 

Pour notre premier exemple de jeu de Pile ou Face, on peut considérer que le gain Xn sur n tirages suit une loi normale N(µ=0,06*n ; σ =rac(n)), et le Winrate Wn une loi normale N(µ=0,06 ; σ =1/rac(n)).

Ainsi, sur 100 tirages, on peut considérer que le gain X100 suit une loi normale N(µ=6 ; σ =10), et le Winrate W100 une loi normale N(µ=0,06 ; σ =0,1).

On peut par exemple en déduire que sur une série de 100 tirages, notre gain va se trouver dans l'intervalle [-14 ; 26[ dans plus de 95 % des cas. Cela est cohérent avec les simulations faites en début d'article.

VI. À la recherche du long terme perdu

Dans ce paragraphe, je répondrai à quelques questions usuelles postées sur le forum. J'y emploierai souvent l'expression de "vrai winrate" (paradoxalement je pourrai tout aussi bien employer les expressions de "winrate théorique" ou "winrate réel") pour désigner l'espérance de votre winrate dans une situation fixée (pour une limite donnée, sur un site donné, avec un [lexiqu fixé, avec un nombre de tables fixé, sur un field donné dont le niveau est fixé, votre niveau étant fixé lui aussi...). Ce "vrai winrate" est parfaitement impossible à évaluer, puisqu'il faudrait, pour toutes les situations de jeux possibles avec tous les joueurs possibles du field (et cela se chiffre à des milliards et des milliards de possibilités), connaître parfaitement les décisions des uns et des autres dans chacune de ces situations. Le "vrai winrate" s'oppose au "winrate observé" sur un certain échantillon de mains jouées.

VI.I. Après avoir joué 350 SNGs HU, j'obtiens un ROI de près de 12 %. À quel point ce ROI est-il significatif ?

D'après le tableau donné précédemment, le SD d'un SNG HU est de 94 %. Sur 350 SNGs HU, l'écart-type de ROI se calcule ainsi : σ = SD / rac(n) = 94 % / rac(350) ~ 5 %. On peut en déduire que :

  • L'écart entre ton ROI observé sur 350 SNGs et ton vrai ROI sera en moyenne de 0,8 * σ ~ 4 %.
  • Dans 50% des cas, cet écart sera inférieur à 0,7 * σ ~ 3,5 %.
  • Dans 68% des cas, cet écart sera inférieur à σ ~ 5 %.
  • Dans 95% des cas, cet écart sera inférieur à 2 * σ ~ 10 %.

VI.II. Après plus de 22 500 mains de NL25SH et de nombreux bad beats, j'atteins un winrate de presque 6 bb/100. Puis-je me considérer comme un joueur gagnant de NL25 et monter dès à présent en NL50 ?

Tablons sur un SD de 90 bb/100, ce qui est standard pour de la NL25SH. Sur ces 22 500 mains, l'écart-type de winrate se calcule ainsi : σ = SD / rac(n/100) = 90 / rac(22 500/100) = 6 bb/100.

  • L'écart entre ton winrate observé sur un échantillon de 22 500 mains et ton vrai winrate sera en moyenne de 0,8 * σ ~ 5 bb/100.
  • Dans 50 % des cas, cet écart sera supérieur à 0,7 * σ ~ 4 bb/100.
  • Dans près de 32 % des cas, cet écart sera supérieur à σ = 6 bb/100.

On voit bien que 22 500 mains sont insuffisantes pour estimer assez précisément ton vrai winrate et te considérer comme un joueur gagnant à cette limite sur le long terme.

D'autre part, il faut savoir qu'en NL25SH, le winrate moyen est d'environ -15 bb/100 à cause e=343]rake (disons -12 bb/100 avec le rakeback) et que la très grande majorité des joueurs sont perdants sur le long terme. Il est assez difficile de connaître la distribution précise des vrais winrates des joueurs de cette limite, mais je pense qu'après seulement 22 500 mains, la plupart des joueurs gagnants sur cet échantillon sont en fait des joueurs perdants sur le long terme qui ont eu de la réussite. Comment ça, les nombreux bad beats ?

Prise en compte de l'All-in EV : La part de chance ou malchance due aux bad beats ou good beats peut se mesurer grâce à l'All-in EV, que l'on obtient facilement avec un tracker. Attention, ce n'est pas toute la chance (ou malchance) qui est mesurée par l'All-in EV : celle-ci permet uniquement de mesurer à quel point vous avez été chanceux (ou malchanceux) après avoir fait tapis. Mais il y a également toutes les situations aléatoires qui surviennent avant d'avoir fait tapis : le fait d'être card dead ou de toucher des premiums, de flopper sa couleur ou son set, l'adversaire qui touche alors qu'on est commit, les setups, et toute la part de hasard qui n'est pas liée aux tirages de cartes...

Évidemment, on obtient une meilleure estimation de son vrai winrate en remplaçant le winrate observé sur 22 500 mains par l'All-in EV observée sur ces 22 500 mains. On peut alors restreindre la variance à celle de l'All-in EV pour gagner davantage en précision. J'ai pu estimer que le SD pour l'All-in EV vaut environ 85 % du SD total des gains.

VI.III. En cash-game, à combien de mains peut-on estimer le long terme ?

On peut déterminer combien de mains sont nécessaires pour être à peu près sûr d'obtenir un winrate observé suffisamment proche de son vrai winrate. Évidemment, tout dépend de la précision souhaitée. En NLHE, on peut par exemple décider qu'une estimation précise de son vrai winrate se ferait à +/-2 bb/100 maximum, avec un intervalle de confiance à 95 %. On trouve alors le nombre n de mains nécessaires pour atteindre une telle précision à l'aide de la formule suivante : n = 100 * SD².

Ainsi, pour un SD de 85 bb/100, la précision voulue ne s'atteint pas avant 700 000 mains.

L'écart entre notre winrate observé sur 700 000 mains et notre vrai winrate sera inférieur à 2 bb/100 dans plus de 95% des cas. Cet écart sera même inférieur à 1bb/100 dans plus de 68% des cas, et il sera inférieur à 0,7 bb/100 dans plus de 50% des cas. En moyenne, cet écart sera de 0,8 bb/100.

À noter que pour doubler votre précision, c'est-à-dire avoir une intervalle de confiance de +/-1 bb/100 à 95%, il faudra quadrupler le nombre de mains jouées.

Alors, vous me direz, en 700 000 mains (3 mois de grind pour certains, mais plusieurs années pour d'autres...), notre niveau a le temps d'évoluer et notre vrai winrate avec, ce qui fait qu'à l'arrivée notre estimation ne sera plus valable. Certes, notre niveau a le temps de changer en 700 000 mains, mais ce calcul, même s'il reste théorique pour certains, montre à quel point la variance est forte et à quel point le long terme est lointain au poker.

VI.IV. À combien de tournois peut-on estimer le long terme ?

On peut déterminer combien de tournois sont nécessaires pour avoir une estimation précise de son vrai ROI. Là encore tout dépend de la précision souhaitée. On peut par exemple décider qu'on veut approcher son vrai ROI à +/-3 % dans plus de 95% des cas. On trouve alors le nombre n de tournois nécessaires pour atteindre une telle précision à l'aide de la formule suivante : n = 4/9 * SD²

Par exemple sur un format de SNG HU, et donc avec un SD de 94 %, cette précision ne s'atteint pas avant près de 4 000 SNGs. Pour des SNGs 9 joueurs, il faudra compter près de 9 000 tournois, et pour des MTTs de 100 joueurs, la même précision nécessitera plus de 50 000 tournois !

VI.V. Je viens de monter en NL10FR, et après 50 000 mains, je me retrouve 20 caves sous l'EV. Est-ce standard ou bien y a-t-il un problème avec mon jeu ?

Tout d'abord, le fait que tu sois malchanceux après avoir fait tapis n'a rien à voir avec ton jeu. Ce n'est pas parce qu'on est bon ou mauvais que notre courbe de gains a plus de chances d'être au-dessus ou en dessous de notre courbe d'All-in EV. Tu as juste été malchanceux sur ces 50 000 mains, et l'on peut calculer à quel point. Tout d'abord, le SD de la différence entre gains et AIEV peut être estimé à 53 % du SD total. NB : cette estimation, que j'ai faite sur 2 000 pots à tapis dans ma BDD n'est pas hyper fiable. Admettons que ton SD soit de 80 bb/100 ; cela fait un SD de 53 % * 80 ~ 42 bb/100 pour l'écart entre tes gains et ton AIEV. Sur 50 000 mains, on obtient un écart-type σ = 42 * rac(500) ~ 941 bb, et par conséquent 20 caves sous l'EV représentent 2,13 * σ. Une table de loi normale nous apprend qu'obtenir un gain de 2,13 * σ sous l'EV se produit dans moins de 1,7 % des cas. En conclusion, le fait d'être 20 caves sous l'EV en 50 000 mains n'est pas vraiment standard ; sur ce coup là, tu fais juste partie des 1,7% des joueurs les plus malchanceux, et ton jeu n'est pas en cause là-dedans.

VI.VI. Quelle est la longueur d'un break-even normal ? Quelle est la profondeur d'un downswing normal ?

Précisions : Je suis un reg de NL100SH depuis près de 6 mois, qui joue environ 50kh/mois. Jusqu'à présent, j'ai toujours fait des mois autour de 3 000 € (rakeback compris), mon plus petit mois s'élevant à 1 500 €. Sur cette période, mon winrate s'établit à 5 bb/100. Mais le mois dernier s'est avéré particulièrement horrible, puisque j'ai terminé légèrement négatif sur ces 50kh après un downswing de plus de 20 caves ! Puis-je mettre ça sur le dos de la variance ?

 

Réponse : Tu ne donnes pas ton SD, mais admettons qu'il soit de 85 bb/100. Ton winrate de 5 bb/100 est observé sur 300 000 mains ; on peut calculer qu'il y a plus de 50 % de chances que l'écart entre ton winrate observé et ton vrai winrate soit supérieur à 1 bb/100. Il n'est pas improbable que ton vrai winrate soit de 4 bb/100 par exemple. Bon, admettons tout de même que ton vrai winrate est de µ = 5 bb/100. Sur 50 000 mains, l'écart-type σ de ton winrate est de σ = 85 / rac(500) ~ 3,8 bb/100. Ton mois est négatif quand ton winrate sur ces 50 000 mains est inférieur à µ - 1,32 * σ. Une table de loi normale nous apprend que cela se réalise dans environ 9,4 % des cas. Sur 6 mois, cela fait environ 45 % de chances de connaître un mois négatif au moins. Alors, oui, on peut mettre ça sur le dos de la variance.

Remarquons que ce qui compte dans cette question, c'est le rapport SD/Winrate que l'on peut appeler écart-type relatif (ou coefficient de variation) et qui vaut ici 17 pour 100 mains. Par exemple, un joueur de Limit avec un SD de 21 bb/100 et un winrate de 1,2 bb/100 connaît à peu près la même variance relative (le même écart-type relatif), et la même réponse pourra lui être faite sur ses chances d'être négatif sur les 50 000 prochaines mains.

De quoi la variance est capable

Gains 100kh mu5 SD85

Pour compléter les réponses aux questions 3 et 6 et visualiser de quoi est capable la variance, mais aussi de quoi elle n'est pas capable, voici des simulations faites pour des joueurs ayant un winrate théorique de 5 bb/100 et un SD de 85 bb/100. Sur les graphiques, j'ai fait apparaître les intervalles de confiance à 95 % et à 99,7 % ; ils représentent une sorte de garde-fou pour votre courbe de gains, qu'elle va très rarement dépasser.

[html]

Lors des différentes simulations faites sur 100 000 mains, un joueur sur deux expérimente un downswing de plus de 18 caves et un joueur sur deux expérimente un break-even de plus de 28 000 mains.

Winrate 100kh mu5 SD85

[html]

Les intervalles de confiance forment un entonnoir qui "oblige" les courbes de winrate à tendre vers le winrate théorique. Leur représentation permet de visualiser la rapidité de la convergence des winrates.

Gains 500kh mu5 SD85

[html]

Lors des différentes simulations faites sur 500 000 mains, un joueur sur deux expérimente un downswing de plus de 28 caves et un joueur sur deux expérimente un break-even de plus de 70 000 mains.

Winrate 500kh mu5 SD85

[html]

Vous pouvez vous même expérimenter de telles simulations ici. (Attention, la version téléchargeable du simulateur semble contenir un mouchard).

VI.VII. Quel est le pourcentage de chance et quel est le pourcentage de skill au poker ?

Part de chance part d edge

Alors premièrement, ce ne serait pas un pourcentage de skill mais plutôt un pourcentage d'edge. Imaginons que l'on fasse jouer un heads up entre Ivey et son clone : le résultat sera entièrement dû au hasard et donc dans ce cas-là la répartition serait 100 % chance et 0 % edge. On peut comparer la part du winrate due à l'edge (le winrate théorique µ) avec la part moyenne du winrate due à la chance (0,8 * σ). Pour du cash-game, on trouve que le part d'edge est de 1/(1+8*SD/(|µ|*rac(n))).

 

Si l'on fixe l'écart-type relatif à 17 pour 100 mains, comme dans la question précédente, la part d'edge est de 1/(1+136/rac(n)). Dans ce cas là, la répartition edge/chance sera :

  • pour 100 mains jouées : 7 % d'edge / 93 % de chance
  • pour 1 000 mains jouées : 19 % d'edge / 81 % de chance
  • pour 10 000 mains jouées : 42 % d'edge / 58 % de chance
  • pour 100 000 mains jouées : 70 % d'edge / 30 % de chance
  • pour 1 000 000 mains jouées : 88 % d'edge / 12 % de chance
  • pour 10 000 000 mains jouées : 96 % d'edge / 4 % de chance.

 

Toujours pour un écart-type relatif de 17 pour 100 mains, voici comment varient la part d'edge et la part de chance entre 0 et 100 000 mains :

[img]

On voit que la part de chance diminue assez vite au départ, mais cette diminution devient de plus en plus lente quand le nombre de mains augmente.

Une répartition 70 % d'edge / 30 % de chance, s'interprète de la manière suivante : si mon edge me permet en moyenne de gagner 70, la chance va venir mettre son grain de sel avec, en moyenne un décalage de 30 en valeur absolue. C'est-à-dire que les chanceux vont se retrouver en moyenne à 100, et les malchanceux en moyenne à 40.

Une autre définition du long terme, dépendant uniquement de la variance relative, peut se faire en demandant que la part de chance soit réduite à 1/8 par exemple. Dans le cas précédent d'un écart-type relatif de 17 sur 100 mains, on atteint cette condition après plus de 900 000 mains.

VI.VIII. Peut-on bad run à vie ?

Nanonoko no variance

Prenons un joueur de cercle parisien, pratiquant tous les MTTs à 300 €, 500 €, 1 000 €... de la capitale. Pour simplifier, nous supposerons que ces MTTs ont un buy-in fixe de 500 € et qu'ils comportent toujours 100 joueurs. Admettons que ce joueur est assez bon pour avoir un ROI théorique de 10 %, et qu'il joue inlassablement, à un rythme de 300 tournois par an, sur une période de 30 ans. Cela fait un total de 9 000 tournois, et en moyenne, ce joueur devrait gagner 450 000 € sur cette période. Bon, alors, imaginons qu'il soit extrêmement malchanceux sur cette période, disons comme un joueur sur 400 peut l'être. Pour un joueur avec un ROI théorique de 10 %, le SD d'un MTT 100 joueurs devrait tourner autour de 360 % avec les deals de fin de tournoi. A ce moment là, son winrate observé sur ces 30 ans pourrait être inférieur à µ - 3σ = 10% - 3 * 360 % / rac(9 000) = - 1,4 %. C'est-à-dire que malgré la quantité de tournois joués, il serait négatif de 62 000 €, au lieu d'être positif de 450 000 € ! Un bad run de 30 ans, je ne sais pas si c'est un bad run à vie, mais ça y ressemble un peu. Oh j'entends déjà plus d'un membre du CP sur 400 venir whiner que c'est toute sa vie. Rassurez-vous, ce cas existe mais il reste extrêmement rare : il ne devrait concerner que les joueurs de MTT live qui n'ont pas un edge de fou, et qui ont été extrêmement malchanceux. À l'opposé, si vous crushez une limite de CG online et multitablez suffisamment pour avoir un volume correct, vous avez largement le temps de réduire la variance à sa part congrue et avoir une courbe de gains qui ressemble à ça :

[html]

VI.IX. À votre tour de poser une question, je me ferai un plaisir d'y répondre si c'est dans mes cordes

Conclusion sur la variance (par Piercy)

Malgré quelques calculs assez ardus, le but de cet article est de vous faire prendre conscience de plusieurs points essentiels :

  • la variance dépend de nombreux facteurs
  • plus un joueur à d'edge, moins les effets de la variance se ressentent sur son winrate
  • plus un joueur joue de mains, moins les effets de la variance se ressentent sur son winrate
  • la variance n'est pas seulement la "chance à l'abattage", elle s'applique à tout : le nombre de paires de rois servies, le nombre de couleur floppées, le nombre de set-up, etc.

 

Surtout, s'il vous plaît, travaillez votre jeu plutôt que de vous en prendre à la variance : plus vous jouez et mieux vous jouez, moins la variance ne vous touchera, alors vous savez ce qui vous reste à faire.

Sommaire des articles : L'EV et la variance au poker

L'EV pour les nuls

Pile ou (cool) face

Cet article a pour vocation d'éclairer le débutant sur les notions d'espérance mathématique (EV), de long terme, de probabilités, etc. Il n'est que peu question de poker, et les mathématiques utilisées sont d'un niveau simple, afin que quiconque sachant compter et lire comprenne ce billet.

L'all-in EV

EV All-in 2009 06

Le jeu online permet l'utilisation de logiciels statistiques (les fameux "trackers", dont les principaux sont Hold'em Manager, Poker Tracker et Poker Office) permettant de suivre les parties de cash-game et d'analyser/afficher des indicateurs statistiques sur notre propre jeu ou sur celui des adversaires.

Parmi ces indicateurs se trouve celui qu'on appelle l'All-in EV, qui trace l'espérance des gains lors des situations à tapis. Cette courbe et sa comparaison avec la courbe des gains réels alimentent souvent fantasmes et discussions sur la "chance", ou bien plus souvent la "malchance", de tel ou tel joueur.

Nous allons essayer de voir dans cet article ce qu'est l'All-in EV... et ce qu'elle n'est pas.

La variance au poker

Phil Ivey Variance par Dudley

Quel que soit votre niveau au poker, vous subissez les effets de la variance. Qu'est-ce que la variance ? C'est ce qui éloigne votre courbe de gains (ou de pertes) réelle de votre courbe de gains (ou de pertes) théorique. La variance est, par exemple, ce qui fait que vous allez plutôt gagner que perdre un pile ou face. Elle reste impalpable, mais vous en ressentez pourtant les effets, et aucun joueur n'y échappe.

Dans la même rubrique
Dernières news Stratégie et technique poker