Pas de violence, c'est les vacances...
Saturnin (Brice de Nice) (sur mon T shirt!)
POKER-TRAINING : Une application (logiciel libre) téléchargement
Mise en ligne le 21 juillet 2014
21 juillet 2014 : 19:19
Correction d'un bug au niveau des indices dans le fichier xsl qui gère l'affichage du xml
L'archive est mise à jour. Le fichier en question (corrigé) est ici
22 juillet 2014 : 18:08
Correction d'une erreur dans l'affichage des éventails hors position, lors des séances d'exercices (erreur d'indice)

Janvier 2017, casino de Pittsburgh. Quatre des meilleurs joueurs de poker au monde – Dong Kim, Jason Les, Jimmy Chou et Daniel McAulay – s’installent autour d’une table pour un défi inédit : affronter Libratus, une intelligence artificielle développée par l’université Carnegie Mellon.
Pendant vingt jours et 120 000 mains de Texas Hold’em No Limit, les humains vont subir une défaite cuisante, perdant plus de 1,7 million de dollars virtuels face à l'intelligence artificielle .
Dong Kim, pourtant le moins mal loti des quatre, avouera après la partie :
« J’avais l’impression de jouer contre quelqu’un qui trichait, comme s’il pouvait voir mes cartes. »

Pour la première fois, une IA venait de prouver qu’elle pouvait non seulement rivaliser, mais dominer les champions humains dans un jeu où psychologie, bluff et prise de risque sont aussi cruciaux que les mathématiques. Le poker, longtemps considéré comme un bastion de l’intuition humaine, venait d’entrer dans une nouvelle ère.
Le poker n’est ni un jeu parfait, ni un jeu à information complète.
Contrairement aux échecs ou au go, il intègre :
En effet pour une IA, le poker n’est pas qu’un calcul : c’est un problème stratégique incomplet, proche de situations réelles (finance, négociation, cybersécurité).

Les premières grandes victoires médiatiques de l’intelligence artificielle ont eu lieu dans des jeux à information complète.
10 février 1996 – Philadelphie, USA, le monde des échecs est en état de choc : Kasparov, dominé, abandonne en 37 coups contre le super-ordinateur. C'est un moment-charnière dans l'histoire des échecs : pour la première fois, un champion du monde en exercice perd face à un ordinateur en cadence classique et dans les conditions d'un tournoi réel.
32…Te8 ?? : un coup qui ignore le danger
Le coup 32…Te8 ?? joué par Garry Kasparov lors cette parie n’est pas simplement discutable : il surprend parce qu’il ignore un danger immédiat. Ce n’est pas un repli prudent ni un coup d’attente, mais une décision qui semble sous-estimer les ressources tactiques adverses dans une position déjà tendue.
Pour un joueur de ce niveau, l’erreur n’est pas tant technique que diagnostique. Kasparov ne se trompe pas sur le calcul d’une variante précise, il se trompe sur la nature de la position. Il joue comme si le temps lui appartenait encore, alors que l’initiative est déjà en train de lui échapper. À très haut niveau, ce type d’erreur est rare, précisément parce qu’il ne relève pas d’un calcul raté, mais d’une mauvaise lecture du danger.
C’est ce qui rend ce coup si troublant lorsqu’on rejoue la partie, PGN à l’appui. L’impression laissée n’est pas celle d’une faiblesse structurelle ou d’un choix stratégique discutable, mais d’un moment de décrochage. Non pas une volonté de perdre, mais une rupture de vigilance, possiblement liée à la nouveauté de l’adversaire.
Face à une machine capable de produire des coups non intuitifs, Kasparov semble, l’espace d’un instant, accorder à Deep Blue un crédit stratégique excessif… et relâcher la tension là où elle était encore indispensable.
Ce passage est éclairant pour la suite de l’histoire de l’intelligence artificielle dans les jeux. Même dans un cadre entièrement observable comme les échecs, l’IA parvient déjà à perturber l’évaluation humaine du danger. Au poker, où cette évaluation est constamment incomplète, cet effet deviendra non plus une anomalie, mais un levier stratégique central..

En tout cas,lorsque Deep Blue bat Garry Kasparov , tout est visible : le plateau, les pièces, les coups possibles. L’ordinateur calcule plus vite et plus loin que l’humain, mais il ne fait qu’explorer un univers totalement déterministe.
Même constat avec AlphaGo, qui domine le go grâce à une puissance de calcul et d’apprentissage colossale dans un cadre où aucune information n’est cachée.
Même dans un jeu à information complète comme le go, la difficulté initiale pour l’intelligence artificielle a été colossale. Le nombre de positions possibles y est astronomique, bien supérieur à celui des échecs. On estime qu’il dépasse largement le nombre d’atomes dans l’univers observable. Cette explosion combinatoire rend toute approche par force brute totalement irréaliste : impossible de parcourir l’arbre des coups comme Deep Blue le faisait aux échecs.
C’est précisément ce mur que AlphaGo a permis de franchir, en combinant plusieurs ruptures technologiques : réseaux de neurones profonds, apprentissage par renforcement et exploration probabiliste des coups prometteurs plutôt qu’exhaustive. L’IA n’analysait plus toutes les variantes possibles, mais apprenait à évaluer intuitivement une position, à la manière d’un joueur humain expérimenté.
Cependant, malgré cette complexité extrême, le go reste un jeu où tout est visible. Une fois la position donnée, l’IA sait exactement dans quel état se trouve la partie. Le poker ajoute une couche de difficulté supplémentaire : même avec une capacité d’évaluation avancée, l’état réel du jeu est partiellement inconnu.
L’algorithme ne peut plus seulement juger une position, il doit raisonner sur des distributions de possibilités, anticiper des actions adverses invisibles et accepter l’idée qu’une bonne décision puisse produire un mauvais résultat à court terme.

Ainsi, si AlphaGo a marqué une révolution face à la complexité combinatoire, le poker représente un changement encore plus profond : le passage d’une intelligence qui choisit dans un espace immense, à une intelligence qui décide sans jamais disposer de toutes les informations.
Le poker change radicalement la donne. Ici, l’IA ne connaît ni les cartes adverses, ni ses intentions, et doit agir malgré cette incertitude permanente. Il n’existe pas de “meilleur coup” universel : une décision peut être correcte mathématiquement tout en menant à une perte immédiate.
Le poker impose donc l’abandon de la recherche d’une solution parfaite au profit de stratégies mixtes, où plusieurs actions sont volontairement alternées selon des probabilités précises.
Autre rupture majeure : le temps long. Aux échecs ou au go, chaque partie est une bataille isolée avec un vainqueur clair. Au poker, une bonne décision peut perdre aujourd’hui mais rester gagnante sur des milliers de mains.
L’intelligence artificielle doit apprendre à ignorer le résultat immédiat pour optimiser l’espérance globale.
En passant des échecs au poker, l’IA ne progresse pas seulement en puissance : elle change de nature.
Elle cesse d’être un simple moteur de calcul pour devenir un outil capable de raisonner dans l’incertitude, là où l’intuition humaine semblait jusque-là irremplaçable.
Contrairement à une idée reçue, l'intelligence artificielle ne cherche pas à lire dans vos pensées ou à détecter un tremblement dans votre main. Elle s’appuie sur une approche mathématique radicale : la GTO (Game Theory Optimal).
Le concept fondamental derrière l'IA est l'Équilibre de Nash (du nom du mathématicien John Nash). Dans le contexte du poker, cela signifie adopter une stratégie telle que, même si votre adversaire sait exactement comment vous jouez, il ne peut rien faire pour vous battre sur le long terme.
Pour une IA, le bluff n'est pas une prise de risque émotionnelle, c'est une nécessité mathématique pour rester "illisible".
Exemple : Pour que ses grosses mises soient rentables, l'IA sait qu'elle doit avoir:
- la meilleure main 70 % du temps
- bluffer 30 % du temps.
Si elle ne bluffait jamais, vous n'auriez qu'à vous coucher dès qu'elle mise. En bluffant avec une fréquence précise, elle vous force à commettre des erreurs de jugement.
Pour atteindre ce niveau, les algorithmes utilisent ce qu'on appelle des Solvers (PioSolver, GTO Wizard). Ces logiciels simulent des millions de mains en quelques secondes pour résoudre une situation donnée.
Ils utilisent souvent des calculs complexes, notamment pour minimiser le regret externe. Voici comment cela fonctionne schématiquement :
La force de la GTO est qu'elle n'a pas besoin de savoir si vous êtes un joueur agressif ou prudent. Elle joue son jeu parfait, et c'est votre déviation par rapport à ce jeu parfait qui crée son profit. C'est une approche "défensive" qui finit par devenir l'attaque la plus redoutable du monde.
Le passage du poker dans l’ère de l’intelligence artificielle ne se limite plus aux laboratoires de recherche ou aux matchs expérimentaux. Il est désormais une réalité quotidienne du poker en ligne. La question n’est plus de savoir si l’IA peut jouer au poker, mais comment elle influence déjà la manière dont les humains jouent.
D’un côté, les pokerbots constituent une menace bien réelle. Capables d’appliquer des stratégies proches de l’optimal théorique sans fatigue ni émotion, ils posent des problèmes éthiques et économiques majeurs. Leur détection devient de plus en plus complexe, à mesure que leurs comportements se rapprochent de ceux des joueurs humains.
Les plateformes doivent alors mener une course permanente entre surveillance algorithmique et sophistication croissante des bots.
Développé par Laurens Koppers, ce site classroomscreen.com peut être un incontournable en classe ! Je vous recommande une visite !