VOUS POURRIEZ AUSSI AIMER
TAGS ASSOCIÉS
arbres  converge  convergence  d'itérations  hold'em  imparfaite  information  infosets  itérations  l'arbre  l'équilibre  nœuds  regrets  sampling  vanilla  
DERNIÈRES PUBLICATIONS

Quand utiliser CFR ?

Quand utiliser CFR ?

Les fondements du CFR dans les jeux stratégiques

Le CFR repose sur l'idée que chaque joueur minimise ses regrets pour chaque action possible à chaque information set. Introduit par Zinkevic et al. en 2008, il itère sur l'arbre de jeu en calculant les regrets moyens et en les utilisant pour pondérer les stratégies. Dans un jeu biparti à somme nulle, la stratégie moyenne converge vers l'équilibre de Nash à un taux de O(1/sqrt(T)), où T est le nombre d'itérations.

Cette approche excelle quand les espaces d'action sont vastes : imaginez le poker avec 10^160 états possibles. Le CFR évite l'énumération complète en se focalisant sur les regrets contrefactuels, définis comme la différence entre le gain d'une action et le gain contre-factuel si elle avait été choisie plus souvent. Pour un arbre de 10^12 nœuds, une implémentation basique nécessite environ 10^9 itérations pour une précision de 0,01 mbb/g, selon les benchmarks de Pluribus en 2019.

Les variantes comme le CFR external sampling réduisent la variance en ne visitant qu'une fraction des nœuds par itération, accélérant la convergence de 20 à 50% dans les cas réels.

Pourquoi le CFR domine dans le poker à information imparfaite

Dans le No-Limit Hold'em, le CFR gère l'incertitude sur les cartes cachées mieux que les méthodes basées sur l'utilité espérée pure. Libratus, développé par Carnegie Mellon, a utilisé 12 millions d'itérations CFR pour atteindre un exploit de 70 mbb/g contre des humains en 2017. Pluribus, en 2019, a étendu cela au 6 joueurs, convergeant en 12 heures sur un cluster de 128 cœurs.

Le CFR surpasse les algorithmes comme le best-response dynamics, qui stagnent à 80% de l'équilibre en grands arbres. Ici, pas de place pour l'heuristique : le regret contrefactuel force une stratégie robuste contre tout adversaire.

Pour les amateurs, une table de CFR simplifiée sur du Limit Hold'em (10^14 infosets) converge en 10^6 itérations sur un PC standard, coûtant moins de 5 euros en électricité.

Comment choisir entre CFR vanilla et CFR+ ?

Le CFR vanilla suffit pour des jeux simplifiés, mais CFR+, introduit en 2015 par Tammelin, accélère la convergence en bornant les regrets négatifs à zéro et en utilisant une pondération quadratique. Résultat : 3 à 5 fois plus rapide sur des benchmarks poker, passant de 10^10 à 2x10^9 itérations pour ε=0,01.

Utilisez CFR+ quand les regrets explosent tôt dans l'entraînement, typique des jeux avec actions risquées comme le bluff au poker. Dans DeepStack, une variante CFR+ a réduit le temps d'entraînement de 70% par rapport au vanilla.

Une micro-digression : les puristes du CFR original le défendent pour sa simplicité mathématique, mais en pratique, CFR+ remporte les tournois IA depuis 2016.

Combien d'itérations pour une convergence fiable avec le CFR ?

La convergence dépend de la taille de l'arbre : pour 10^12 infosets, comptez 10^9 à 10^10 itérations pour un écart à Nash sous 0,05 mbb/g. Des études comme celles de Brown et Sandholm (2019) montrent que Monte Carlo CFR (MCCFR) divise cela par 100 en échantillonnant, mais avec une variance plus élevée – jusqu'à 30% d'oscillations.

En hardware moderne, un GPU RTX 4090 traite 10^8 infosets/seconde ; une session complète coûte autour de 50 euros en cloud pour un modèle poker 6-max. Priorisez les abstractions : bucketing les mains réduit l'arbre de 90%, accélérant de 10x.

Les données chiffrées varient : dans Leduc Poker (184 infosets), 10^4 itérations suffisent ; escaladez à 10^12 pour du vrai Hold'em.

Les limites du CFR : quand il patine vraiment

Le CFR cale sur les jeux à très longue horizon, comme Go avec 10^170 positions – là, MCTS domine avec 50% d'efficacité en plus sur des benchmarks AlphaGo. Dans le CFR, la mémoire explose : 10^12 infosets demandent 100 To de RAM sans compression.

Les études divergent : certains rapportent une convergence logarithmique en grands arbres, d'autres un plafonnement à 95% de Nash après 10^11 itérations. Ça dépend du sampling : outcome sampling booste de 40%, mais external sampling reste le plus stable.

Évitez le CFR pur pour les jeux multi-agents non-zérosomme ; là, les regrets ne garantissent rien.

Comparaison CFR vs alternatives : MCCFR et fictious play

MCCFR, une variante Monte Carlo, sample les histories pour scaler à 10^14 nœuds, convergeant 100x plus vite que CFR sur Pluribus. Fictious play, plus ancien, itère des best-responses mais diverge dans 20% des cas imparfaits, selon des tests 2020.

Le équilibre de Nash via CFR coûte 10-100x plus cher en compute que des approximations Q-learning, mais assure l'optimalité. Dans le StarCraft II, DeepMind préfère NFSP (inspiré CFR) pour 30% de winrate en plus contre rule-based bots.

Chiffres à l'appui : CFR bat fictious play de 25% en exploitability sur Liar's Dice.

Conseils pratiques et erreurs courantes en implémentation CFR

Abstrait d'abord : regroupez 169 mains de départ en 1000 buckets pour diviser l'arbre par 1000. Erreur n°1 : négliger le discounting des regrets anciens – appliquez un facteur 1/sqrt(t) pour booster de 2x la convergence.

Deuxième piège : sampler uniformément ; optez pour importance sampling, qui réduit la variance de 50%. Sur un cluster AWS, un entraînement 6-max Hold'em coûte 500-2000 euros pour 10^12 itérations.

Les débutants surestiment la précision : visez ε=0,1 mbb/g pour du fun, pas 0,001 qui multiplie le temps par 100. Et une touche d'ironie : si votre CFR bluffe moins que votre oncle à la belote, c'est que vous avez codé vanilla au lieu de CFR+.

FAQ CFR : réponses aux questions clés

Quelle est la différence entre CFR et CFR+ ?

CFR+ borne les regrets négatifs et utilise une moyenne quadratique, accélérant la convergence de 300% sur des arbres poker massifs. Utilisez CFR+ pour tout entraînement sérieux depuis 2015.

Comment implémenter le CFR en Python rapidement ?

Avec OpenSpiel de DeepMind, un squelette basique se code en 200 lignes : itérez regrets, moyennez stratégies, sampliez infosets. Pour du Hold'em, ajoutez abstractions via bucketing – convergence en 48h sur CPU.

Le CFR convient-il aux jeux non-poker ?

Oui, pour auctions ou trading HFT avec infos imparfaites, mais adaptez via deep CFR pour 20-50 infosets continus. Limite : horizon >100 tours favorise RL pur.

Conclusion : maîtrisez le CFR pour dominer les jeux imparfaits

Le CFR reste l'étalon-or pour minimiser les regrets dans les jeux à information imparfaite, dominant du poker IA aux négociations stratégiques. Utilisez-le quand l'exhaustivité échoue et que la convergence Nash prime – jusqu'à 10^14 nœuds gérés en semaines. Ses variantes comme CFR+ ou MCCFR adaptent à vos contraintes compute, avec des gains de 3-100x en vitesse. Évitez les pièges d'abstraction faible ou de sampling naïf pour des résultats optimaux. En 2024, les avancées deep CFR ouvrent des portes à l'économie comportementale ; investissez-y pour un edge de 15-30% sur les baselines. Priorisez itérations massives et abstractions solides : votre stratégie en sortira invincible.

💡 Points clés à retenir

  • Quand utiliser CFR ? - Confer, en forme souvent abrégée « cf.
  • Quand utiliser l'incoterm CFR ? - L'incoterm CFR – « Cost and Freight / Coût et Fret» port de destination – est utilisé exclusivement en transport maritime, que ce soit dans le
  • Pourquoi choisir l'incoterm CFR ? - Les avantages de l'incoterm CFR Pour le vendeur, le principal avantage est d'effectuer la livraison dans le pays de l'acheteur sans assumer les risque
  • C'est quoi le prix CFR ? - CFR désigne un incoterm dans lequel le vendeur prend en charge les coûts jusqu'au port de déchargement.
  • C'est quoi FOB et CFR ? - FOB : Free On Board (franco à bord du navire) CFR : Cost and Freight (coût et fret)18 mai 2022

❓ Questions fréquemment posées

1. Quand utiliser CFR ?

Confer, en forme souvent abrégée « cf. » ou « cfr » (sans point) dans les textes, est une expression latine utilisée par une rédaction pour inviter son lectorat à consulter un autre passage ou un autre ouvrage.

2. Quand utiliser l'incoterm CFR ?

L'incoterm CFR – « Cost and Freight / Coût et Fret» port de destination – est utilisé exclusivement en transport maritime, que ce soit dans le cas d'expédition en conteneur ou en navire conventionnel (breakbulk).

3. Pourquoi choisir l'incoterm CFR ?

Les avantages de l'incoterm CFR Pour le vendeur, le principal avantage est d'effectuer la livraison dans le pays de l'acheteur sans assumer les risques du transport maritime. De plus, il n'est pas concerné par les opérations de douane pour l'importation des marchandises.10 janv. 2023

4. C'est quoi le prix CFR ?

CFR désigne un incoterm dans lequel le vendeur prend en charge les coûts jusqu'au port de déchargement. Il s'agit d'un des 4 incoterms spécifiques au transport maritime et fluvial.

5. C'est quoi FOB et CFR ?

FOB : Free On Board (franco à bord du navire) CFR : Cost and Freight (coût et fret)18 mai 2022

6. Comment se calcule le CFR ?

2.1.1 Calcul de l'Incoterm CFR On sait que : CIF = CFR + assurance. Cela revient à écrire : CFR = CIF – Assurance. Cette formule de CFR dégagée constitue une déduction de celle de CIF ci-dessus. On sait aussi que : assurance = Taux de la prime x Valeur d'assurance.25 oct. 2020

7. Comment calculer le prix CFR ?

On obtient la formule suivante : CIF = CFR + Tp x 1,1 CIF alors CIF – Tp x 1,1 CIF = CFR. Déterminons l'expression de l'assurance en fonction de CFR. remplaçons donc CIF par son expression dans l'équation 2.15 mai 2019

8. Comment calculer la valeur CFR ?

On obtient la formule suivante : CIF = CFR + Tp x 1,1 CIF alors CIF – Tp x 1,1 CIF = CFR. Déterminons l'expression de l'assurance en fonction de CFR. remplaçons donc CIF par son expression dans l'équation 2.15 mai 2019

9. Quand utiliser créé ?

Le participe passé au masculin est : créé. Pour former le participe passé au féminin, on ajoute simple la terminaison ée : créée.25 oct. 2017

10. Quand utiliser coquelusedal ?

Quand donner du Coquelusedal nourrisson ? Coquelusedal Nourrisson est indiqué dans le traitement des affections bronchiques aiguës et bénignes chez le nourrisson, jusqu'à 30 mois. Donner 1 à 2 suppositoires par jour. La durée du traitement devra être la plus courte possible et ne devra pas dépasser 5 jours.

11. Quand utiliser Pediakid ?

Conseils d'utilisation : Peut être utilisé dès lors que l'alimentation est diversifiée. Agiter avant emploi. Avant 5 ans : 1 cuillère à café 1 à 2 fois par jour, le matin de préférence. Après 5 ans : 2 cuillères à café 1 à 2 fois par jour, le matin de préférence.

12. Quand utiliser eue ?

Dans votre phrase, il y a un seul participe passé (eue) et il est bien orthographié.
  • Eu est le participe passé du verbe avoir. ...
  • Elle a eu une note. ...
  • Si le participe passé (eu) est suivi d'un infinitif introduit par la préposition à, on préfère laisser invariable, car le C.O.D.
  • 5 mars 2017

    13. Quand utiliser qu'à ?

    Le sens de “tu n'as qu'à” (de n'avoir qu'à), c'est “tu devrais”, “il serait mieux”, voire même “il te suffit”. Dans “tu n'as qu'à”, il y a cette idée de “c'est facile à faire, ça te demande un petit effort seulement.”22 juil. 2019

    14. Quand utiliser nonobstant ?

    Nonobstant signifie "malgré, sans égard à, sans se laisser freiner par, sans être empêché par quoi que ce soit". Exemple : Nonobstant les conseils de mes professeurs, je vais arrêter mes études. [Juridique] En dépit de, malgré.19 juin 2021

    15. Quand utiliser derechef ?

    Adverbe. (Littéraire) (Vieilli) Une seconde fois, de nouveau ; employé de façon emphatique, pour insister. (Sens souvent compris et utilisé actuellement) Immédiatement.

    16. Quel sport est le plus facile à parier ?

    Le tennis. Un sport plus facile à pronostiquer que les deux autres même s'il est nécessaire de connaître une série de critères avant de se lancer. Dans un premier temps, le classement ATP du joueur ne veut souvent rien dire. Au tennis, on ne change pas de place comme au football.

    17. Comment 1xBet remboursé ?

    S'il y a victoire de votre équipe, alors vous empochez votre gain. Si, par contre, il y a match nul avec score vierge de 0-0 en première mi-temps et qu'à la fin de la rencontre votre équipe perd son match, vous serez remboursé.

    18. Quel site remboursé le premier pari en cash ?

    On rappelle que PMU est le seul site qui rembourse encore en cash le premier pari.

    19. Qui est ZEbet ?

    ZEbet est un opérateur de paris sportifs qui a obtenu l'agrément de l'ARJEL (Autorité de régulation des jeux en ligne) en 2014, peu avant la coupe du monde de football.

    20. Quel est le meilleur entre Betclic et Winamax ?

    L'offre de Winamax est meilleure que celle de Betclic. Elle est accessible à partir de 3 matchs (5 sur Betclic) et permet de remporter jusqu'à 100% de bonus (50% sur Betclic). ⚽ Pari combiné sur 1 match unique : formule de jeu aussi révolutionnaire que le cash out en son temps.

    21. Ou parier tabac ?

    Parier au tabac : comment ça marche ?
    • Se rendre dans le bureau de tabac le plus proche ;
    • Se rendre à la borne FDJ ;
    • Choisir un match de plusieurs matchs sur la liste affichée ;
    • Remplir un bulletin de pari avec le numéro des matchs, votre prédiction et votre mise ;
    • Donner le bulletin FDJ au buraliste ;

    22. Comment faire sortir de l'argent sur 1xbet ?

    Une fois que vous cliquez sur ce logo, un menu s'ouvre alors sur la gauche de l'écran, avec toutes les options disponibles de votre compte, votre solde y sera également affiché. Cliquez sur "Retirer des fonds" pour accéder à la page des retraits sur laquelle de nombreuses méthodes de retrait seront affichées.

    23. Quel est le numéro WhatsApp de 1xBet ?

    1xbet Côte d'Ivoire - Contacter ce numéro WhatsApp 777942831 | Facebook.

    24. Comment avoir 1xBet personnalisé ?

    Connectez-vous sur le site internet 1xBet. Cliquez sur l'onglet «inscription» placé en haut et à droite de l'écran. Choisissez le mode d'inscription (en un clic, par réseaux sociaux, par email, par téléphone). Choisissez votre nationalité, puis cliquez sur «s'inscrire».

    25. Comment gagner 1.000 euros sur TikTok ?

    Pour gagner de l'argent avec TikTok, vous devez être âgé de 18 ans ou plus, avoir au moins 10 000 abonnés et avoir eu plus de 100 000 vues sur vos vidéos au cours des 30 derniers jours. Vous pouvez ensuite vous adresser au TikTok Creator Fund via l'application.