論文の概要: No-Regret Strategy Solving in Imperfect-Information Games via Pre-Trained Embedding
- arxiv url: http://arxiv.org/abs/2511.12083v1
- Date: Sat, 15 Nov 2025 08:04:19 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-18 14:36:23.595439
- Title: No-Regret Strategy Solving in Imperfect-Information Games via Pre-Trained Embedding
- Title(参考訳): プレトレーニング埋め込みによる不完全情報ゲームにおけるノンレグレット・ストラテジーの解決
- Authors: Yanchang Fu, Shengda Liu, Pei Xu, Kaiqi Huang,
- Abstract要約: 本稿では,埋め込み空間内でIIEFGの戦略を解くための新しい手法であるEmbedding CFRを提案する。
このアルゴリズムは、孤立した情報集合の機能を相互接続された低次元連続空間に事前訓練し、埋め込みする。
ポーカーの実験では、同じ空間的オーバーヘッドで、エンベディングCFRは、はるかに高速なエクスプロイラビリティ収束を実現する。
- 参考スコア(独自算出の注目度): 23.90678135513633
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: High-quality information set abstraction remains a core challenge in solving large-scale imperfect-information extensive-form games (IIEFGs)-such as no-limit Texas Hold'em-where the finite nature of spatial resources hinders strategy solving over the full game. State-of-the-art AI methods rely on pre-trained discrete clustering for abstraction, yet their hard classification irreversibly loses critical information: specifically, the quantifiable subtle differences between information sets-vital for strategy solving-thereby compromising the quality of such solving. Inspired by the word embedding paradigm in natural language processing, this paper proposes the Embedding CFR algorithm, a novel approach for solving strategies in IIEFGs within an embedding space. The algorithm pre-trains and embeds features of isolated information sets into an interconnected low-dimensional continuous space, where the resulting vectors more precisely capture both the distinctions and connections between information sets. Embedding CFR presents a strategy-solving process driven by regret accumulation and strategy updates within this embedding space, with accompanying theoretical analysis verifying its capacity to reduce cumulative regret. Experiments on poker show that with the same spatial overhead, Embedding CFR achieves significantly faster exploitability convergence compared to cluster-based abstraction algorithms, confirming its effectiveness. Furthermore, to our knowledge, it is the first algorithm in poker AI that pre-trains information set abstractions through low-dimensional embedding for strategy solving.
- Abstract(参考訳): 高品質の情報集合抽象化は、空間資源の有限の性質がゲーム全体の解決を妨げているような、大規模な不完全情報拡張形式ゲーム(IIEFG)の解決において、依然として中心的な課題である。
最先端のAI手法は、事前訓練された個別のクラスタリングを抽象化に頼っているが、そのハードな分類は、重要な情報を不可逆的に失う。
自然言語処理における単語埋め込みパラダイムに着想を得て,埋め込み空間内のIIEFGの戦略を解く新しい手法である埋め込みCFRアルゴリズムを提案する。
このアルゴリズムは、孤立した情報集合の特徴を相互接続された低次元連続空間に事前訓練し、埋め込み、そこで得られるベクトルは情報集合間の区別と接続をより正確に捉える。
埋め込み CFR は、この埋め込み空間内での後悔の蓄積と戦略更新によって引き起こされる戦略解決過程を示し、累積的後悔を減らすためのその能力を検証する理論的解析を伴う。
ポーカーの実験では、同じ空間的オーバーヘッドで、Embedding CFRはクラスタベースの抽象化アルゴリズムよりもはるかに高速なエクスプロイラビリティ収束を実現し、その有効性を確認している。
さらに、我々の知る限り、戦略解決のための低次元埋め込みを通じて情報集合の抽象化を事前訓練するポーカーAIにおける最初のアルゴリズムである。
関連論文リスト
- RESIST: Resilient Decentralized Learning Using Consensus Gradient Descent [11.22833419439317]
経験的堅牢性リスク(ERM)は、現代の機械学習(ML)の基盤である
本稿では,MITM(man-in-the-middle)攻撃に焦点をあてる。
本稿では,敵に妥協された通信リンクに対して堅牢なアルゴリズムであるRESISTを提案する。
論文 参考訳(メタデータ) (2025-02-11T21:48:10Z) - Learning for Cross-Layer Resource Allocation in MEC-Aided Cell-Free Networks [71.30914500714262]
移動エッジコンピューティング(MEC)を援用したセルフリーネットワーク上でのクロスレイヤリソース割り当ては、データレートを促進するために、送信およびコンピューティングリソースを十分に活用することができる。
深層学習の観点からMEC支援セルフリーネットワークのサブキャリア配置とビームフォーミング最適化について検討した。
論文 参考訳(メタデータ) (2024-12-21T10:18:55Z) - Point Cloud Understanding via Attention-Driven Contrastive Learning [64.65145700121442]
トランスフォーマーベースのモデルは、自己認識機構を活用することにより、先進的なポイントクラウド理解を持つ。
PointACLは、これらの制限に対処するために設計された、注意駆動のコントラスト学習フレームワークである。
本手法では, 注意駆動型動的マスキング手法を用いて, モデルが非集中領域に集中するように誘導する。
論文 参考訳(メタデータ) (2024-11-22T05:41:00Z) - Anti-Collapse Loss for Deep Metric Learning Based on Coding Rate Metric [99.19559537966538]
DMLは、分類、クラスタリング、検索といった下流タスクのための識別可能な高次元埋め込み空間を学習することを目的としている。
埋め込み空間の構造を維持し,特徴の崩壊を避けるために,反崩壊損失と呼ばれる新しい損失関数を提案する。
ベンチマークデータセットの総合実験により,提案手法が既存の最先端手法より優れていることを示す。
論文 参考訳(メタデータ) (2024-07-03T13:44:20Z) - CHARME: A chain-based reinforcement learning approach for the minor embedding problem [10.896395182395601]
本稿では,CHARME という名前の小さな埋め込み問題に対処するために,強化学習(RL)技術を利用した新しい手法を提案する。
CHARMEには、ポリシーモデリングのためのグラフニューラルネットワーク(GNN)アーキテクチャ、妥当性を保証する状態遷移アルゴリズム、効果的なトレーニングのための順序探索戦略の3つの重要なコンポーネントが含まれている。
特に、CHARMEは、Minorminer や ATOM のような高速な埋め込み法と比較して、量子ビット利用の点で優れた解が得られる。
論文 参考訳(メタデータ) (2024-06-11T10:12:10Z) - Hyperspectral Image Analysis in Single-Modal and Multimodal setting
using Deep Learning Techniques [1.2328446298523066]
ハイパースペクトルイメージングは、その例外的なスペクトル分解能のため、土地利用とカバーの正確な分類を提供する。
しかし、高次元化と空間分解能の制限による課題は、その効果を妨げている。
本研究では,深層学習技術を用いて特徴を効率的に処理し,抽出し,データを統合的に分類することで,これらの課題に対処する。
論文 参考訳(メタデータ) (2024-03-03T15:47:43Z) - CasCIFF: A Cross-Domain Information Fusion Framework Tailored for
Cascade Prediction in Social Networks [4.480256642939794]
クロスドメイン情報融合フレームワーク(CasCIFF)は、情報カスケード予測に最適化されている。
このフレームワークは、ユーザ埋め込みを堅牢にするために、マルチホップ近隣情報を利用する。
特に、CasCIFFは、ユーザ分類とカスケード予測のタスクをシームレスに統合されたフレームワークに統合します。
論文 参考訳(メタデータ) (2023-08-09T13:52:41Z) - Large-scale Fully-Unsupervised Re-Identification [78.47108158030213]
大規模未ラベルデータから学ぶための2つの戦略を提案する。
第1の戦略は、近傍関係に違反することなく、それぞれのデータセットサイズを減らすために、局所的な近傍サンプリングを行う。
第2の戦略は、低時間上限の複雑さを持ち、メモリの複雑さを O(n2) から O(kn) に k n で還元する新しい再帰的手法を利用する。
論文 参考訳(メタデータ) (2023-07-26T16:19:19Z) - Hierarchical Deep Counterfactual Regret Minimization [53.86223883060367]
本稿では,大規模な状態空間や深部ゲームツリーを含むタスクにおいて,学習効率を向上させる革新的な手法であるDeep CFRの最初の階層バージョンを紹介する。
HDCFRのこれまでの研究よりも顕著な利点は、事前に定義された(人間的な)専門知識による学習の促進と、同様のタスクに移行可能なスキルの獲得を促進する能力である。
論文 参考訳(メタデータ) (2023-05-27T02:05:41Z) - Contextual Model Aggregation for Fast and Robust Federated Learning in
Edge Computing [88.76112371510999]
フェデレーション学習は、ネットワークエッジにおける分散機械学習の第一候補である。
既存のアルゴリズムは、性能の緩やかな収束や堅牢性の問題に直面している。
そこで本稿では,損失低減に対する最適コンテキスト依存境界を実現するためのコンテキストアグリゲーション手法を提案する。
論文 参考訳(メタデータ) (2022-03-23T21:42:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。