論文の概要: M2-PALE: A Framework for Explaining Multi-Agent MCTS--Minimax Hybrids via Process Mining and LLMs
- arxiv url: http://arxiv.org/abs/2604.14687v1
- Date: Thu, 16 Apr 2026 06:46:32 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-17 21:29:31.764985
- Title: M2-PALE: A Framework for Explaining Multi-Agent MCTS--Minimax Hybrids via Process Mining and LLMs
- Title(参考訳): M2-PALE:プロセスマイニングとLCMによるマルチエージェントMCTS--Minimaxハイブリッドの解説フレームワーク
- Authors: Yiyu Qian, Liyuan Zhao, Tim Miller,
- Abstract要約: Monte-Carlo Tree Search (MCTS) は、シーケンシャルな意思決定領域におけるオンラインプランニングに広く使われているサンプリングベースの検索アルゴリズムである。
人工知能の最近の進歩を推し進めることの成功にもかかわらず、MCTSエージェントの振る舞いを理解することは、開発者とユーザの両方にとって課題である。
我々は、結果の意思決定ロジックを復号化するためにtextsfM2-PALE (MCTS--Minimax Process-Aided Linguistic Explanations) を導入する。
我々は,より複雑な戦略領域においてハイブリッドエージェントを解釈するためのスケーラブルな基盤を確立するため,小規模チェッカー環境でのアプローチの有効性を実証する。
- 参考スコア(独自算出の注目度): 1.9983412460505416
- License: http://creativecommons.org/publicdomain/zero/1.0/
- Abstract: Monte-Carlo Tree Search (MCTS) is a fundamental sampling-based search algorithm widely used for online planning in sequential decision-making domains. Despite its success in driving recent advances in artificial intelligence, understanding the behavior of MCTS agents remains a challenge for both developers and users. This difficulty stems from the complex search trees produced through the simulation of numerous future states and their intricate relationships. A known weakness of standard MCTS is its reliance on highly selective tree construction, which may lead to the omission of crucial moves and a vulnerability to tactical traps. To resolve this, we incorporate shallow, full-width Minimax search into the rollout phase of multi-agent MCTS to enhance strategic depth. Furthermore, to demystify the resulting decision-making logic, we introduce \textsf{M2-PALE} (MCTS--Minimax Process-Aided Linguistic Explanations). This framework employs process mining techniques, specifically the Alpha Miner, iDHM, and Inductive Miner algorithms, to extract underlying behavioral workflows from agent execution traces. These process models are then synthesized by LLMs to generate human-readable causal and distal explanations. We demonstrate the efficacy of our approach in a small-scale checkers environment, establishing a scalable foundation for interpreting hybrid agents in increasingly complex strategic domains.
- Abstract(参考訳): Monte-Carlo Tree Search (MCTS) は、シーケンシャルな意思決定領域におけるオンラインプランニングに広く用いられている基本サンプリングに基づく探索アルゴリズムである。
人工知能の最近の進歩を推し進めることの成功にもかかわらず、MCTSエージェントの振る舞いを理解することは、開発者とユーザの両方にとって課題である。
この難しさは、多くの将来の状態と複雑な関係のシミュレーションによって生成される複雑な探索木に起因している。
標準的なMCTSの弱点は、高度に選択的な木の構造に依存しており、重要な動きが省略され、戦術的罠に対する脆弱性が生じる可能性があることである。
これを解決するために,マルチエージェントMCTSのロールアウトフェーズに,浅い全幅のMinimax探索を組み込んで,戦略的深度を高める。
さらに,結果の意思決定ロジックを復号化するために, MCTS--Minimax Process-Aided Linguistic Explanations(MCTS--Minimax Process-Aided Linguistic Explanations)を導入する。
このフレームワークはプロセスマイニング技術、特にAlpha Miner、iDHM、Inductive Minerアルゴリズムを使用して、エージェントの実行トレースから基礎となる振る舞いワークフローを抽出する。
これらのプロセスモデルはLLMによって合成され、人間の読みやすい因果関係と遠位関係の説明を生成する。
我々は,より複雑な戦略領域においてハイブリッドエージェントを解釈するためのスケーラブルな基盤を確立するため,小規模チェッカー環境でのアプローチの有効性を実証する。
関連論文リスト
- Beyond Monolithic Architectures: A Multi-Agent Search and Knowledge Optimization Framework for Agentic Search [56.78490647843876]
エージェント検索は、大規模言語モデル(LLM)が推論とツールの使用をインターリーブできるようにすることによって、複雑な情報を探すための有望なパラダイムとして登場した。
本稿では,bfM-ASKを提案する。bfM-ASK,bfM-ASK,bfM-ASK,bfM-ASK,bfM-ASK,bfM-ASK,bfM-ASK,bfM-ASK。
論文 参考訳(メタデータ) (2026-01-08T08:13:27Z) - Human-Centric Open-Future Task Discovery: Formulation, Benchmark, and Scalable Tree-Based Search [55.96277616578607]
我々は,人間中心のオープンフューチャータスク発見(HOTD)の問題を定式化し,複数の課題にまたがる人的労力を減らすタスクの特定に焦点をあてる。
本研究では,HOTD-Benchを提案する。HOTD-Benchは,2K以上の実世界のビデオ,半自動アノテーションパイプライン,オープンセットの将来の評価に適したシミュレーションベースのプロトコルである。
また,多エージェントシステムによる複雑な推論を分解し,スケーラブルな探索木モジュールによる推論プロセスを構築するCMAST(Collaborative Multi-Agent Search Tree)を提案する。
論文 参考訳(メタデータ) (2025-11-24T09:33:59Z) - The Landscape of Agentic Reinforcement Learning for LLMs: A Survey [103.32591749156416]
エージェント強化学習(Agentic RL)の出現は、大規模言語モデル(LLM RL)に適用された従来の強化学習からパラダイムシフトを示している。
本研究では, LLM-RLの縮退した単段階マルコフ決定過程(MDPs)と, エージェントRLを定義する部分可観測マルコフ決定過程(POMDPs)とを対比することにより, この概念シフトを定式化する。
論文 参考訳(メタデータ) (2025-09-02T17:46:26Z) - Exploring Explainable Multi-agent MCTS-minimax Hybrids in Board Game Using Process Mining [3.07405282890767]
本稿では,モンテカルロ木探索(MCTS)の意思決定と行動に関する潜在的説明について検討する。
MCTSの弱点は、非常に選択的な木を構築し、結果として決定的な動きを見逃し、戦術的な罠に陥ることである。
我々は,マルチエージェントMCTSのロールアウトフェーズに浅いミニマックス探索を統合し,プロセスマイニング技術を用いて3v3チェッカーにおけるエージェントの戦略を説明する。
論文 参考訳(メタデータ) (2025-03-30T05:48:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。