論文の概要: Toward Template-Free Explainability for Monte Carlo Tree Search
- arxiv url: http://arxiv.org/abs/2605.16524v2
- Date: Tue, 19 May 2026 21:16:55 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-21 14:55:44.215734
- Title: Toward Template-Free Explainability for Monte Carlo Tree Search
- Title(参考訳): モンテカルロ木探索のためのテンプレートフリー説明可能性に向けて
- Authors: Siqi Lu, Mirsaleh Bahavarnia, Hiba Baroud, Yixuan Zhang, Hemant Purohit, Ayan Mukhopadhyay,
- Abstract要約: 確率論的探索アルゴリズムは、不確実性の下でのシーケンシャルな意思決定タスクの解決に非常に効果的であることが証明されている。
大規模言語モデル(LLM)がモンテカルロ木探索決定の根拠に基づく説明を生成できるフレームワークを提案する。
本フレームワークは,自然言語質問を意図するカテゴリの構造化にマッピングし,既存の木に十分な証拠があるかどうかを判定し,必要に応じて対象拡大をトリガーし,訪問数,価値推定,リスク情報などのツリー統計を用いた説明を生成する。
- 参考スコア(独自算出の注目度): 7.879122162207435
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Probabilistic search algorithms, such as Monte Carlo Tree Search (MCTS), have proven very effective in solving sequential decision-making tasks under uncertainty. However, interpreting asymmetric search trees that incorporate bandit-based tree traversal and simulation-based value estimation is difficult for end users based solely on raw tree statistics. While prior work requires hand-crafted formal logic constraints that must be updated when the problem changes, we present a framework that enables large language models (LLMs) to generate evidence-grounded explanations of MCTS decisions from recorded search traces in an end-to-end manner. Our framework maps natural-language questions to a structured set of intent categories, determines whether the existing tree contains sufficient evidence, triggers targeted expansion when needed, and generates explanations using tree statistics such as visit counts, value estimates, and risk information. Experimental results provide the first evidence that LLMs can serve as end-to-end explainers for probabilistic search, without requiring intermediate formal representations.
- Abstract(参考訳): モンテカルロ木探索(MCTS)のような確率的探索アルゴリズムは、不確実性の下でシーケンシャルな意思決定タスクを解くのに非常に効果的であることが証明されている。
しかし,広帯域木トラバーサルとシミュレーションに基づく値推定を組み込んだ非対称探索木の解釈は,生木統計だけでは困難である。
従来の作業では,問題が発生したときに更新しなければならない手作業による形式論理の制約を必要とするが,我々は大規模言語モデル(LLM)を用いて,記録された検索トレースからMCTS決定の根拠に基づく説明をエンドツーエンドに生成するフレームワークを提案する。
本フレームワークは,自然言語質問を意図するカテゴリの構造化にマッピングし,既存の木に十分な証拠があるかどうかを判定し,必要に応じて対象拡大をトリガーし,訪問数,価値推定,リスク情報などのツリー統計を用いた説明を生成する。
実験結果から,LLMが中間形式表現を必要とせずに,確率探索の終端説明役として機能することを示す最初の証拠が得られた。
関連論文リスト
- OrLog: Resolving Complex Queries with LLMs and Probabilistic Reasoning [51.58235452818926]
そこで我々は,論理的推論から述語レベルの妥当性推定を分離するニューロシンボリック検索フレームワークOrLogを紹介する。
大規模言語モデル (LLM) は1つの復号のない前方通過において原子述語に対する可視性スコアを提供し、確率論的推論エンジンはクエリ満足度の後方確率を導出する。
論文 参考訳(メタデータ) (2026-01-30T15:31:58Z) - Ensembling LLM-Induced Decision Trees for Explainable and Robust Error Detection [24.742137117129502]
エラー検出はデータ品質の確保に重要である。
近年の最先端ED法では,大規模言語モデル(LLM)に組み込まれた事前学習された知識と意味的能力を利用して,細胞が誤っているかを直接ラベル付けしている。
ED(termed TreeED)の決定木を誘導するLLM-as-an-inducerフレームワークを提案し,さらにコンセンサス検出(termed ForestED)のために複数の木をアンサンブルする。
我々の手法は正確で説明可能で堅牢であり、最高のベースラインに対して平均16.1%のF1スコア改善を実現している。
論文 参考訳(メタデータ) (2025-12-08T07:40:48Z) - Approximate Optimal Active Learning of Decision Trees [4.834817711255487]
本稿では,メンバシップクエリのみを用いて未知のバイナリ決定木を積極的に学習する問題について考察する。
本稿では,仮説空間の減少を推定するために近似モデル計数を用いる決定木を能動的に学習するための記号的手法を提案する。
決定木に関する実験により、この手法は少数のクエリのみを用いて正しいモデルに確実に収束することが示された。
論文 参考訳(メタデータ) (2025-12-03T17:03:39Z) - MITS: Enhanced Tree Search Reasoning for LLMs via Pointwise Mutual Information [32.43291637979958]
情報理論の原理で推論を導く新しいフレームワークであるMutual Information Tree Search (MITS)を提案する。
MITSは、ポイントワイド相互情報(PMI)に基づく効果的なスコアリング機能を導入し、推論経路の段階的評価と探索木拡張を可能にする。
最終的な予測のために、MITSはPMIスコアと予測コンセンサスを組み合わせた重み付き投票方式を採用している。
論文 参考訳(メタデータ) (2025-10-04T02:30:40Z) - Combining LLMs with Logic-Based Framework to Explain MCTS [13.276888833862447]
我々はモンテカルロ木探索(MCTS)アルゴリズムのための計算木誘導大言語モデル(LLM)に基づく自然言語説明フレームワークを設計する。
ユーザクエリをロジックや変数ステートメントに変換することで,検索ツリーから得られたエビデンスが事実上一貫していることを保証する。
このフレームワークを定量的評価によって厳格に評価し,精度と事実整合性の観点から高い性能を示す。
論文 参考訳(メタデータ) (2025-05-01T15:40:58Z) - Learning Decision Trees as Amortized Structure Inference [59.65621207449269]
本稿では,予測決定木アンサンブルを学習するためのハイブリッドアモータイズされた構造推論手法を提案する。
提案手法であるDT-GFNは,標準分類ベンチマークにおける最先端決定木やディープラーニング手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2025-03-10T07:05:07Z) - Think&Cite: Improving Attributed Text Generation with Self-Guided Tree Search and Progress Reward Modeling [63.98194996746229]
大型言語モデル(LLM)は幻覚を起こし、事実的に誤った情報を生み出す傾向にある。
我々はThink&Citeと呼ばれる新しいフレームワークを提案し、検索と統合された多段階推論問題として属性付きテキスト生成を定式化する。
論文 参考訳(メタデータ) (2024-12-19T13:55:48Z) - Token-Supervised Value Models for Enhancing Mathematical Problem-Solving Capabilities of Large Language Models [56.32800938317095]
既存の検証器はテスト時の木探索技術に準最適である。
トークン制御値モデル(TVM)を提案する。
TVMは各トークンに、正しい最終回答に達する確率を反映した確率を割り当てる。
論文 参考訳(メタデータ) (2024-07-12T13:16:50Z) - Uncertainty-Guided Likelihood Tree Search [37.25859935454988]
ツリー探索は、木構造空間を探索するものとして、多くのシーケンシャルな意思決定問題を列挙できるため、計画のための基本的なツールである。
本研究では、報酬関数が経路のログ様関数であるような設定のための不確実性誘導木探索アルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-07-04T14:08:50Z) - RLET: A Reinforcement Learning Based Approach for Explainable QA with
Entailment Trees [47.745218107037786]
本稿では,強化学習に基づくEntailment Tree生成フレームワークであるRLETを提案する。
RLETは文の選択と推論生成モジュールによる単一ステップ推論を反復的に行う。
EntailmentBankデータセットの3つの設定の実験では、RLフレームワークを使用することの強みが示されている。
論文 参考訳(メタデータ) (2022-10-31T06:45:05Z) - Complex Event Forecasting with Prediction Suffix Trees: Extended
Technical Report [70.7321040534471]
複合イベント認識(CER)システムは、イベントのリアルタイムストリーム上のパターンを"即時"検出する能力によって、過去20年間に人気が高まっている。
このような現象が実際にCERエンジンによって検出される前に、パターンがいつ発生するかを予測する方法が不足している。
複雑なイベント予測の問題に対処しようとする形式的なフレームワークを提案する。
論文 参考訳(メタデータ) (2021-09-01T09:52:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。