論文の概要: SGA-MCTS: Decoupling Planning from Execution via Training-Free Atomic Experience Retrieval
- arxiv url: http://arxiv.org/abs/2604.14712v1
- Date: Thu, 16 Apr 2026 07:22:36 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-17 21:29:31.777066
- Title: SGA-MCTS: Decoupling Planning from Execution via Training-Free Atomic Experience Retrieval
- Title(参考訳): SGA-MCTS: 訓練不要な原子体験検索による実行からのプランニングの分離
- Authors: Xin Xie, Dongyun Xue, Wuguannan Yao, Mingxiao Feng, Wengang Zhou, Xiang Qi, Houqiang Li, Peng Zhang,
- Abstract要約: 我々は, LLM計画を非パラメトリック検索として活用するフレームワークである textbfSGA-MCTS を紹介する。
オンラインでは、検索増強剤は、関連するステート-ゴール-アクション原子を取得するために、ハイブリッドシンボリック-セマンティック機構を使用する。
SGA-MCTSは、探索の重い計算コストを効果的に減らし、System 1推論速度におけるシステム2推論の深さを達成し、スケーラブルかつリアルタイムに自律的な計画が実現可能である。
- 参考スコア(独自算出の注目度): 74.1918709002557
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: LLM-powered systems require complex multi-step decision-making abilities to solve real-world tasks, yet current planning approaches face a trade-off between the high latency of inference-time search and the limited generalization of supervised fine-tuning. To address this limitation, we introduce \textbf{SGA-MCTS}, a framework that casts LLM planning as non-parametric retrieval. Offline, we leverage Monte Carlo Tree Search (MCTS) to explore the solution space and distill high-fidelity trajectories into State-Goal-Action (SGA) atoms. These atoms are de-lexicalized primitives that abstract concrete entities into symbolic slots, preserving reusable causal logic while discarding domain-specific noise. Online, a retrieval-augmented agent employs a hybrid symbolic-semantic mechanism to fetch relevant SGAs and re-ground them into the current context as soft reasoning hints. Empirical results on complex benchmarks demonstrate that this paradigm enables frozen, open-weights models to match the performance of SOTA systems (e.g., GPT-5) without task-specific fine-tuning. By effectively amortizing the heavy computational cost of search, SGA-MCTS achieves System 2 reasoning depth at System 1 inference speeds, rendering autonomous planning both scalable and real-time feasible.
- Abstract(参考訳): LLMを利用したシステムでは、実世界の課題を解決するために複雑な多段階決定能力を必要とするが、現在の計画手法では、推論時間探索のレイテンシの高さと教師付き微調整の限定的な一般化とのトレードオフに直面している。
この制限に対処するために, LLM 計画を非パラメトリック検索として活用するフレームワークである \textbf{SGA-MCTS} を導入する。
オフラインではモンテカルロ木探索(MCTS)を用いて解空間を探索し,高忠実度軌道をSGA(State-Goal-Action)原子に蒸留する。
これらの原子は非レキシカル化プリミティブであり、具体的実体を象徴的なスロットに抽象化し、ドメイン固有のノイズを捨てながら再利用可能な因果論理を保存する。
オンライン上では、検索強化エージェントは、関連するSGAを取得し、それらをソフトな推論ヒントとして現在のコンテキストに再配置するために、ハイブリッドなシンボル・セマンティックメカニズムを使用する。
複雑なベンチマークの実証的な結果は、このパラダイムにより、タスク固有の微調整なしでSOTAシステム(例えば、GPT-5)の性能に適合するフリーズなオープンウェイトモデルが実現可能であることを証明している。
SGA-MCTSは、探索の重い計算コストを効果的に減らし、System 1推論速度におけるシステム2推論の深さを達成し、スケーラブルかつリアルタイムに自律的な計画が実現可能である。
関連論文リスト
- Multi-Turn Reasoning LLMs for Task Offloading in Mobile Edge Computing [15.718757401948304]
我々は,MECシステムにおける前向きな意思決定を可能にする生成フレームワークであるCOMLLMを提案する。
COMLLMは、ほぼ最適レイテンシを実現し、ロードバランシングの公平性を向上する。特に、ゼロショットのスケーラビリティを示し、小規模ネットワークでトレーニングされたモデルは、再トレーニングすることなく、より大きく、目に見えないトポロジに一般化することができる。
論文 参考訳(メタデータ) (2026-04-08T14:38:48Z) - AI4S-SDS: A Neuro-Symbolic Solvent Design System via Sparse MCTS and Differentiable Physics Alignment [0.0]
AI4S-SDSはクローズドループ型ニューロシンボリック・フレームワークであり,モンテカルロ木探索エンジンとマルチエージェント・コラボレーションを統合している。
我々は,AI4S-SDSがHSPに基づく物理制約の下で完全な妥当性を達成し,ベースラインエージェントと比較して探索の多様性を著しく向上することを示す。
論文 参考訳(メタデータ) (2026-03-04T03:30:17Z) - PhyG-MoE: A Physics-Guided Mixture-of-Experts Framework for Energy-Efficient GNSS Interference Recognition [49.955269674859004]
本稿では,PhyG-MoE(Physics-Guided Mixture-of-Experts)について述べる。
静的アーキテクチャとは異なり、提案システムはスペクトル特性の絡み合いに基づいて信号をルーティングするスペクトルベースのゲーティング機構を用いる。
高容量のTransNeXtエキスパートがオンデマンドでアクティベートされ、飽和シナリオで複雑な機能を分離する一方、軽量のエキスパートは基本的なシグナルを処理してレイテンシを最小化する。
論文 参考訳(メタデータ) (2026-01-19T07:57:52Z) - SparseSSM: Efficient Selective Structured State Space Models Can Be Pruned in One-Shot [8.080568103779893]
Mambaのような状態空間言語モデルは、線形複雑性推論を許容しながらTransformerの品質にマッチする。
既存のワンショットプルーニング手法はアテンションブロックに適合し、時間共有および離散化された状態遷移行列を考慮できない。
SparseSSMは、古典的最適な脳外科医(OBS)フレームワークをステートスペースアーキテクチャに拡張した最初のトレーニングフリープルーニングフレームワークである。
論文 参考訳(メタデータ) (2025-06-11T11:14:57Z) - Pangu Embedded: An Efficient Dual-system LLM Reasoner with Metacognition [95.54406667705999]
Pangu Embeddedは、Ascend Neural Processing Units (NPU) 上で開発された効率的なLarge Language Model (LLM) 推論器である。
既存の推論最適化 LLM でよく見られる計算コストと推論遅延の問題に対処する。
単一の統一モデルアーキテクチャ内で、迅速な応答と最先端の推論品質を提供する。
論文 参考訳(メタデータ) (2025-05-28T14:03:02Z) - Continuous Monte Carlo Graph Search [61.11769232283621]
連続モンテカルログラフサーチ(Continuous Monte Carlo Graph Search, CMCGS)は、モンテカルログラフサーチ(MCTS)のオンラインプランニングへの拡張である。
CMCGSは、計画中、複数の州で同じ行動方針を共有することで高いパフォーマンスが得られるという洞察を生かしている。
並列化によってスケールアップすることができ、学習力学モデルによる連続制御においてクロスエントロピー法(CEM)よりも優れている。
論文 参考訳(メタデータ) (2022-10-04T07:34:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。