論文の概要: KrwEmd: Revising the Imperfect-Recall Abstraction from Forgetting Everything
- arxiv url: http://arxiv.org/abs/2511.12089v1
- Date: Sat, 15 Nov 2025 08:15:50 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-18 14:36:23.599078
- Title: KrwEmd: Revising the Imperfect-Recall Abstraction from Forgetting Everything
- Title(参考訳): KrwEmd: すべてを忘れることから不完全なリコール抽象化を修正する
- Authors: Yanchang Fu, Qiyue Yin, Shengda Liu, Pei Xu, Kaiqi Huang,
- Abstract要約: 本稿では,この問題に対処する最初の実用的なアルゴリズムであるKrwEmdを提案する。
我々はまずk-recall Winrate機能を導入し、将来と重要な歴史的ゲーム情報の両方を活用することで信号観測情報セットを質的に区別するだけでなく、それらの類似性を定量的に捉える。
そこで我々はKrwEmdアルゴリズムを開発し、地球移動器距離を用いて信号観測インフォセットをクラスタリングし、特徴間の不一致を計測する。
- 参考スコア(独自算出の注目度): 26.872387657059775
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Excessive abstraction is a critical challenge in hand abstraction-a task specific to games like Texas hold'em-when solving large-scale imperfect-information games, as it impairs AI performance. This issue arises from extreme implementations of imperfect-recall abstraction, which entirely discard historical information. This paper presents KrwEmd, the first practical algorithm designed to address this problem. We first introduce the k-recall winrate feature, which not only qualitatively distinguishes signal observation infosets by leveraging both future and, crucially, historical game information, but also quantitatively captures their similarity. We then develop the KrwEmd algorithm, which clusters signal observation infosets using earth mover's distance to measure discrepancies between their features. Experimental results demonstrate that KrwEmd significantly improves AI gameplay performance compared to existing algorithms.
- Abstract(参考訳): 過剰な抽象化は、AIのパフォーマンスを損なうため、大規模な不完全な情報ゲームを解くテキサスのようなゲームに特有のタスクである、手作業の抽象化において重要な課題である。
この問題は、歴史的情報を完全に破棄する不完全なリコール抽象化の極端な実装から生じる。
本稿では,この問題に対処する最初の実用的なアルゴリズムであるKrwEmdを提案する。
我々はまず,k-recall Winrate機能を導入し,将来と重要な歴史的ゲーム情報を活用することで,信号観測情報セットを質的に区別するだけでなく,その類似性を定量的に捉える。
そこで我々はKrwEmdアルゴリズムを開発し、地球移動器距離を用いて信号観測インフォセットをクラスタリングし、特徴間の不一致を計測する。
実験結果から,KrwEmdは既存のアルゴリズムと比較してAIゲームプレイ性能を著しく向上することが示された。
関連論文リスト
- Beyond Outcome-Based Imperfect-Recall: Higher-Resolution Abstractions for Imperfect-Information Games [26.872387657059775]
ハンド抽象化はテキサスホールドエムのような不完全な情報ゲーム(IIG)のスケーリングに不可欠である。
プレイヤーアクションシーケンスから信号をきれいに分離する'em-styleゲームを保持するように調整されたIIGのサブクラスである信号観測順序ゲーム(SOOGs)を紹介する。
本稿では,主要な結果に基づく不完全なリコールアルゴリズムが,歴史的情報を任意に破棄することで,かなりの損失を被ることを示す。
論文 参考訳(メタデータ) (2025-10-16T19:27:15Z) - Text Anomaly Detection with Simplified Isolation Kernel [58.13924648777626]
2段階のアプローチでは、事前訓練された大きな言語モデル埋め込みと異常検出を組み合わせている。
大規模言語モデルによって抽出された高次元密度埋め込みは、かなりのメモリ要件と高い計算時間のために課題を提起する。
本稿では,高次元密度埋め込みを低次元スパース表現にマッピングする簡易分離カーネル(SIK)を提案する。
論文 参考訳(メタデータ) (2025-10-15T06:35:54Z) - Reasoning-based Anomaly Detection Framework: A Real-time, Scalable, and Automated Approach to Anomaly Detection Across Domains [3.804483269194178]
Reasoning based Anomaly Detection Framework (RADF) は、非常に大きなデータセットでリアルタイムな異常検出を行うように設計されている。
RADFは9つの公開ベンチマークデータセットのうち5つで、AUCのパフォーマンスにおける最先端の異常検出モデルを上回っている。
論文 参考訳(メタデータ) (2025-10-03T20:06:31Z) - Generalizing Multi-Step Inverse Models for Representation Learning to Finite-Memory POMDPs [23.584313644411967]
本研究では,関連する情報のみを符号化し,無関係な情報を破棄する情報的,あるいはエージェント中心の状態表現の発見問題について検討する。
我々の結果は、決定論的力学設定の理論と、代替直観的アルゴリズムの反例を含む。
アルゴリズムを正しく使用した場合に成功させ、正しく使用した場合に劇的な失敗を引き起こす。
論文 参考訳(メタデータ) (2024-04-22T19:46:16Z) - SalienDet: A Saliency-based Feature Enhancement Algorithm for Object
Detection for Autonomous Driving [160.57870373052577]
未知の物体を検出するために,サリエンデット法(SalienDet)を提案する。
我々のSaienDetは、オブジェクトの提案生成のための画像機能を強化するために、サリエンシに基づくアルゴリズムを利用している。
オープンワールド検出を実現するためのトレーニングサンプルセットにおいて、未知のオブジェクトをすべてのオブジェクトと区別するためのデータセットレザベリングアプローチを設計する。
論文 参考訳(メタデータ) (2023-05-11T16:19:44Z) - NetRCA: An Effective Network Fault Cause Localization Algorithm [22.88986905436378]
ネットワーク障害の根本原因の特定は、ネットワークの運用と保守に不可欠である。
この問題に対処するために,NetRCAという新しいアルゴリズムを提案する。
ICASSP 2022 AIOps Challengeの実際のデータセットで実験と分析が行われる。
論文 参考訳(メタデータ) (2022-02-23T02:03:35Z) - An algorithm-based multiple detection influence measure for high
dimensional regression using expectile [0.4999814847776096]
本稿では,アルゴリズムに基づく多段階多重検出手法を提案する。
データ中の望ましくない変数を識別し、キャプチャする3ステップのアルゴリズムである$asymMIP,$は2つの相補的な統計に基づく。
自閉症脳画像データ交換データセットへの本手法の適用により,脳の成熟度をよりバランスよく正確に予測することができた。
論文 参考訳(メタデータ) (2021-05-26T01:16:24Z) - Unsupervised Feature Learning for Event Data: Direct vs Inverse Problem
Formulation [53.850686395708905]
イベントベースのカメラは、ピクセルごとの明るさ変化の非同期ストリームを記録する。
本稿では,イベントデータからの表現学習のための単一層アーキテクチャに焦点を当てる。
我々は,最先端手法と比較して,認識精度が最大9%向上したことを示す。
論文 参考訳(メタデータ) (2020-09-23T10:40:03Z) - Gravitational Models Explain Shifts on Human Visual Attention [80.76475913429357]
視覚的注意(英: visual attention)とは、人間の脳が優先的な処理のために関連する感覚情報を選択する能力を指す。
過去30年間に様々な評価方法が提案されてきた。
注意変動を記述するための重力モデル(GRAV)を提案する。
論文 参考訳(メタデータ) (2020-09-15T10:12:41Z) - Evolving Losses for Unsupervised Video Representation Learning [91.2683362199263]
大規模未ラベル映像データから映像表現を学習する新しい手法を提案する。
提案した教師なし表現学習では,単一のRGBネットワークが実現し,従来の手法よりも優れていた。
論文 参考訳(メタデータ) (2020-02-26T16:56:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。