論文の概要: Parallelizing Counterfactual Regret Minimization
- arxiv url: http://arxiv.org/abs/2605.14277v1
- Date: Thu, 14 May 2026 02:22:27 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-15 21:45:34.583409
- Title: Parallelizing Counterfactual Regret Minimization
- Title(参考訳): 並列化対実レグレスト最小化
- Authors: Juho Kim, Tuomas Sandholm,
- Abstract要約: 反実的後悔最小化(CFR)アルゴリズムのファミリーを並列化する。
我々は、GPU上のCFRの実装が、Google DeepMind OpenSpielのCPU上のCFR実装よりも最大4桁高速であることを示す。
- 参考スコア(独自算出の注目度): 62.94836578759359
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Parallelization has played an instrumental role in the field of artificial intelligence (AI), drastically reducing the time taken to train and evaluate large AI models. In contrast to its impact in the broader field of AI, applying parallelization to computational game solving is relatively unexplored, despite its great potential. In this paper, we parallelize the family of counterfactual regret minimization (CFR) algorithms, which were central to important breakthroughs for solving large imperfect-information games. We present a generalized parallelization framework, reframing CFR as a series of linear algebra operations. Then, existing techniques for parallelizing linear algebra operations can be applied to accelerate CFR. We also describe how our technique can be applied to other tabular members of the CFR family of algorithms, including the state-of-the-art, such as CFR+, discounted CFR, and predictive variants of CFR. Experimentally, we show that our CFR implementation on a GPU is up to four orders of magnitude faster than Google DeepMind OpenSpiel's CFR implementations on a CPU.
- Abstract(参考訳): 並列化は人工知能(AI)の分野で重要な役割を担い、大規模なAIモデルの訓練と評価に要する時間を劇的に削減してきた。
AIの幅広い分野におけるその影響とは対照的に、計算ゲーム解決に並列化を適用することは、その大きな可能性にもかかわらず、比較的未解明である。
本稿では,大規模な不完全情報ゲームにおいて重要なブレークスルーとなるCFRアルゴリズムを並列化する。
線形代数演算系として CFR を記述した一般化並列化フレームワークを提案する。
次に、線形代数演算を並列化する既存の手法を適用してCFRを加速する。
また,CFR+や割引CFR,CFRの予測変種など,CFRファミリーの他の表形式にも適用可能な手法について述べる。
実験により,GPU上でのCFR実装は,Google DeepMind OpenSpielのCPU上でのCFR実装よりも最大4桁高速であることがわかった。
関連論文リスト
- Deep (Predictive) Discounted Counterfactual Regret Minimization [47.323787598768284]
本稿では,CFRの高度な変種を近似する既存の手法の限界を克服する,効率的なモデルフリーなニューラルCFRアルゴリズムを提案する。
実験結果から、モデルなしニューラルネットワークと比較して、不完全情報ゲームにおいてより高速な収束を示すことが明らかとなった。
論文 参考訳(メタデータ) (2025-11-11T12:38:08Z) - Accelerating Nash Equilibrium Convergence in Monte Carlo Settings Through Counterfactual Value Based Fictitious Play [0.0]
MCCFVFPと呼ばれる不完全な情報ゲームを解決するための新しいMCベースのアルゴリズムを提案する。
MCCFVFPは、CFRの反実値計算と架空のプレイのベストレスポンス戦略を組み合わせる。
その結果,MCCFVFPは最も先進的なMCCFRよりも約20%$sim$50%速かった。
論文 参考訳(メタデータ) (2023-09-04T09:16:49Z) - Hierarchical Deep Counterfactual Regret Minimization [53.86223883060367]
本稿では,大規模な状態空間や深部ゲームツリーを含むタスクにおいて,学習効率を向上させる革新的な手法であるDeep CFRの最初の階層バージョンを紹介する。
HDCFRのこれまでの研究よりも顕著な利点は、事前に定義された(人間的な)専門知識による学習の促進と、同様のタスクに移行可能なスキルの獲得を促進する能力である。
論文 参考訳(メタデータ) (2023-05-27T02:05:41Z) - Large-scale Optimization of Partial AUC in a Range of False Positive
Rates [51.12047280149546]
ROC曲線 (AUC) の下の領域は、機械学習において最も広く使われている分類モデルのパフォーマンス指標の1つである。
近年の封筒平滑化技術に基づく効率的な近似勾配降下法を開発した。
提案アルゴリズムは,効率のよい解法を欠くランク付けされた範囲損失の和を最小化するためにも利用できる。
論文 参考訳(メタデータ) (2022-03-03T03:46:18Z) - Equivalence Analysis between Counterfactual Regret Minimization and
Online Mirror Descent [67.60077332154853]
反実的回帰最小化(英: Counterfactual Regret Minimization, CFR)は、局所的反実的後悔を最小化することにより、全遺を最小化する後悔最小化アルゴリズムである。
FTRL(Follow-the-Regularized-Lead)アルゴリズムとOMD(Online Mirror Descent)アルゴリズムは,オンライン凸最適化における最小化アルゴリズムである。
本稿では,CFR と Regret Matching+ の CFR が FTRL および OMD の特別な形式であることを証明し,CFR を解析・拡張する新しい方法を提案する。
論文 参考訳(メタデータ) (2021-10-11T02:12:25Z) - Model-free Neural Counterfactual Regret Minimization with Bootstrap
Learning [10.816436463322237]
現在のCFRアルゴリズムは、累積的後悔をニューラルネットワークで近似する必要がある。
新しいCFR変種であるRecursive CFRが提案され、Recursive Substitute Values (RSVs) によって累積的後悔が回復される。
新しい再帰的CFRはナッシュ平衡に収束することが証明されている。
実験の結果、新しいアルゴリズムは最先端のニューラルCFRアルゴリズムと一致できるが、トレーニングのオーバーヘッドは少ないことがわかった。
論文 参考訳(メタデータ) (2020-12-03T12:26:50Z) - Sparsified Linear Programming for Zero-Sum Equilibrium Finding [89.30539368124025]
我々は、この問題に対して全く異なるアプローチを示し、それは競争力があり、しばしば、以前の最先端技術よりも桁違いに優れている。
ポーカーエンドゲームの実験により、現代の線形プログラムソルバは、ゲーム固有のCFRの現代的な変種でさえも競合することを示した。
論文 参考訳(メタデータ) (2020-06-05T13:48:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。