論文の概要: Time-critical and confidence-based abstraction dropping methods
- arxiv url: http://arxiv.org/abs/2507.02703v1
- Date: Thu, 03 Jul 2025 15:12:05 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-04 15:37:16.49608
- Title: Time-critical and confidence-based abstraction dropping methods
- Title(参考訳): 時間臨界および信頼度に基づく抽象解法
- Authors: Robin Schmöcker, Lennart Kampmann, Alexander Dockhorn,
- Abstract要約: 非コンパクト抽象は抽象空間における最適作用への収束を不可能にする。
本稿では,OGA-IAAD と OGA-CAD の2つの新しい抽象化手法を提案する。
- 参考スコア(独自算出の注目度): 44.99833362998488
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: One paradigm of Monte Carlo Tree Search (MCTS) improvements is to build and use state and/or action abstractions during the tree search. Non-exact abstractions, however, introduce an approximation error making convergence to the optimal action in the abstract space impossible. Hence, as proposed as a component of Elastic Monte Carlo Tree Search by Xu et al., abstraction algorithms should eventually drop the abstraction. In this paper, we propose two novel abstraction dropping schemes, namely OGA-IAAD and OGA-CAD which can yield clear performance improvements whilst being safe in the sense that the dropping never causes any notable performance degradations contrary to Xu's dropping method. OGA-IAAD is designed for time critical settings while OGA-CAD is designed to improve the MCTS performance with the same number of iterations.
- Abstract(参考訳): Monte Carlo Tree Search (MCTS)の改善のパラダイムのひとつは、ツリー検索中に状態やアクションの抽象化を構築し、使用することだ。
しかし、非コンパクト抽象は、抽象空間における最適作用に収束する近似誤差を導入する。
したがって、XuらによるElastic Monte Carlo Tree Searchのコンポーネントとして提案されているように、抽象化アルゴリズムは最終的には抽象化を廃止すべきである。
本稿では,Xu のドロップ法に反する顕著な性能劣化を生じさせないという意味で,安全性を保ちつつ,明確な性能改善を実現するための2つの新しい抽象化ドロップ方式,すなわち OGA-IAAD と OGA-CAD を提案する。
OGA-IAADは時間的クリティカルな設定のために設計され、OGA-CADはMCTSの性能を同じ回数で改善するように設計されている。
関連論文リスト
- Monte Carlo Tree Diffusion for System 2 Planning [57.50512800900167]
モンテカルロ木探索(MCTS)の適応探索機能と拡散モデルの生成強度を統合する新しいフレームワークであるモンテカルロ木拡散(MCTD)を紹介する。
本手法は,木構造化プロセスとしてデノナイジングを再認識し,部分的にデノナイジングした計画を反復的に評価し,刈り取り,精錬する。
論文 参考訳(メタデータ) (2025-02-11T02:51:42Z) - Feature Attenuation of Defective Representation Can Resolve Incomplete Masking on Anomaly Detection [1.0358639819750703]
教師なし異常検出(UAD)研究では、計算効率が高くスケーラブルなソリューションを開発する必要がある。
再建・塗り替えのアプローチを再考し、強みと弱みを分析して改善する。
異常再構成の特徴情報を減衰させる2つの層のみを用いるFADeR(Feature Attenuation of Defective Representation)を提案する。
論文 参考訳(メタデータ) (2024-07-05T15:44:53Z) - Efficient Monte Carlo Tree Search via On-the-Fly State-Conditioned Action Abstraction [27.53460927687747]
状態とサブアクション間の構成構造に基づくアクション抽象化を提案する。
提案手法は,現在状態の遷移に関連するサブアクションをキャプチャする補助ネットワークを用いて,潜時ダイナミクスモデルを学習する。
論文 参考訳(メタデータ) (2024-06-02T04:31:30Z) - Accelerating Monte Carlo Tree Search with Probability Tree State
Abstraction [11.49169644917995]
我々はモンテカルロ木探索(MCTS)の探索効率を向上させるための新しい確率木状態抽象化(PTSA)アルゴリズムを提案する。
経路遷移性を持つ一般的なツリー状態抽象化が定義され、さらに、アグリゲーションステップ中に少ないミスに対して確率木状態抽象化が提案される。
実験結果から,提案手法は検索空間を10%-45%削減した最先端アルゴリズムの学習過程を高速化できることが示された。
論文 参考訳(メタデータ) (2023-10-10T10:55:12Z) - Hierarchical State Abstraction Based on Structural Information
Principles [70.24495170921075]
本稿では、情報理論の観点から、新しい数学的構造情報原理に基づく状態抽象化フレームワーク、すなわちSISAを提案する。
SISAは、様々な表現学習目標と柔軟に統合され、パフォーマンスをさらに向上する一般的なフレームワークである。
論文 参考訳(メタデータ) (2023-04-24T11:06:52Z) - When to Update Your Model: Constrained Model-based Reinforcement
Learning [50.74369835934703]
モデルベースRL(MBRL)の非遅延性能保証のための新規で一般的な理論スキームを提案する。
続いて導いた境界は、モデルシフトとパフォーマンス改善の関係を明らかにします。
さらなる例では、動的に変化する探索からの学習モデルが、最終的なリターンの恩恵をもたらすことが示されている。
論文 参考訳(メタデータ) (2022-10-15T17:57:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。