論文の概要: Aligning Progress and Feasibility: A Neuro-Symbolic Dual Memory Framework for Long-Horizon LLM Agents
- arxiv url: http://arxiv.org/abs/2604.02734v1
- Date: Fri, 03 Apr 2026 05:11:19 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-06 17:20:24.327155
- Title: Aligning Progress and Feasibility: A Neuro-Symbolic Dual Memory Framework for Long-Horizon LLM Agents
- Title(参考訳): 長期LDMエージェントのための神経シンボリックデュアルメモリフレームワークの進歩と実現可能性
- Authors: Bin Wen, Ruoxuan Zhang, Yang Chen, Hongxia Xie, Lan-Zhe Guo,
- Abstract要約: 大規模言語モデル(LLM)は、長期の意思決定タスクにおいて大きな可能性を証明している。
本稿では,論理可能性検証から意味的進行指導を明示的に分離するニューロシンボリックデュアルメモリフレームワークを提案する。
- 参考スコア(独自算出の注目度): 20.162094925591354
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Large language models (LLMs) have demonstrated strong potential in long-horizon decision-making tasks, such as embodied manipulation and web interaction. However, agents frequently struggle with endless trial-and-error loops or deviate from the main objective in complex environments. We attribute these failures to two fundamental errors: global Progress Drift and local Feasibility Violation. Existing methods typically attempt to address both issues simultaneously using a single paradigm. However, these two challenges are fundamentally distinct: the former relies on fuzzy semantic planning, while the latter demands strict logical constraints and state validation. The inherent limitations of such a single-paradigm approach pose a fundamental challenge for existing models in handling long-horizon tasks. Motivated by this insight, we propose a Neuro-Symbolic Dual Memory Framework that explicitly decouples semantic progress guidance from logical feasibility verification. Specifically, during the inference phase, the framework invokes both memory mechanisms synchronously: on one hand, a neural-network-based Progress Memory extracts semantic blueprints from successful trajectories to guide global task advancement; on the other hand, a symbolic-logic-based Feasibility Memory utilizes executable Python verification functions synthesized from failed transitions to perform strict logical validation. Experiments demonstrate that this method significantly outperforms existing competitive baselines on ALFWorld, WebShop, and TextCraft, while drastically reducing the invalid action rate and average trajectory length.
- Abstract(参考訳): 大規模言語モデル(LLM)は、エンボディ操作やWebインタラクションなど、長期の意思決定タスクにおいて大きな可能性を証明している。
しかし、エージェントはしばしば無限の試行錯誤ループに苦しむか、複雑な環境での主な目的から逸脱する。
これらの失敗は、グローバルプログレッシブ・ドリフトとローカル・フィージビリティ・ヴァイオレーションの2つの根本的なエラーに起因する。
既存のメソッドは通常、両方の問題に1つのパラダイムを使って同時に対処しようとする。
前者はファジィなセマンティックプランニングに依存し、後者は厳密な論理的制約と状態検証を要求する。
このような単一パラダイムアプローチの本質的な制限は、長い水平タスクを扱う上で、既存のモデルに根本的な課題をもたらす。
この知見に触発されて,論理的可能性検証から意味的進行指導を明示的に分離するニューロシンボリックデュアルメモリフレームワークを提案する。
特に、推論フェーズの間、このフレームワークは両方のメモリメカニズムを同期的に呼び出す。一方、ニューラルネットワークベースのプログレスメモリは、成功したトラジェクトリからセマンティックブループリントを抽出してグローバルタスクの進行を導く。
実験により,ALFWorld,WebShop,TextCraftの既存の競争ベースラインを著しく上回り,無効な動作速度と平均軌道長を大幅に削減した。
関連論文リスト
- Training LLMs for Multi-Step Tool Orchestration with Constrained Data Synthesis and Graduated Rewards [76.49428173793386]
LLMは、中間出力を伝搬しながら、正しい順序で複数の依存APIを呼び出す必要がある。
既存の環境は、シミュレーションデータを使った単純なターン毎の関数呼び出しとバイナリ報酬に重点を置いている。
まず、実APIレスポンスの大規模キャッシュを背景とした強化学習環境を構築し、有効なマルチステップオーケストレーショントレースをサンプリングするデータ合成パイプラインを実現する。
第二に、正当性を原子の妥当性とオーケストレーションに分解する、段階的な報酬設計を提案する。
論文 参考訳(メタデータ) (2026-03-25T18:31:39Z) - BiManiBench: A Hierarchical Benchmark for Evaluating Bimanual Coordination of Multimodal Large Language Models [30.38546017617527]
MLLM(Multi Large Language Models)を評価するベンチマークであるBiManiBenchを紹介した。
本フレームワークは,腕の到達性や運動的制約など,独特な両面的課題を分離する。
30以上の最先端モデルの解析により、高度推論能力にもかかわらず、MLLMはデュアルアームの空間接地と制御に苦しむことが明らかとなった。
論文 参考訳(メタデータ) (2026-02-09T08:47:14Z) - OMG-Agent: Toward Robust Missing Modality Generation with Decoupled Coarse-to-Fine Agentic Workflows [9.617220633655716]
textbfunderlineOmni-textbfunderlineModality textbfunderlineGeneration Agent (textbfOMG-Agent)について述べる。
論文 参考訳(メタデータ) (2026-02-04T02:25:40Z) - StreamVLA: Breaking the Reason-Act Cycle via Completion-State Gating [8.031311182554981]
長距離ロボット操作は、高レベルの計画と低レベルの制御のギャップを埋める必要がある。
現在のVision-Language-Actionモデルは、しばしばこれらのプロセスを絡めて、各ステップで冗長なマルチモーダル推論を実行する。
本稿では、テキストタスクの分解、視覚目標の想像力、連続的なアクション生成を単一のパラメータ効率のバックボーン内で統合するデュアルシステムアーキテクチャStreamVLAを提案する。
論文 参考訳(メタデータ) (2026-02-01T08:51:17Z) - CoG: Controllable Graph Reasoning via Relational Blueprints and Failure-Aware Refinement over Knowledge Graphs [53.199517625701475]
CoGはDual-Process Theoryにインスパイアされたトレーニング不要のフレームワークで、直観と熟考の相互作用を模倣している。
CoGは精度と効率の両方において最先端のアプローチを著しく上回っている。
論文 参考訳(メタデータ) (2026-01-16T07:27:40Z) - Resolving Indirect Calls in Binary Code via Cross-Reference Augmented Graph Neural Networks [14.474710100574866]
グラフニューラルネットワークを用いて間接呼び出しを解決する新しいアプローチである CupidCall を導入する。
我々は,高度なコンパイラレベルの型解析を利用して,高品質なコールライトとキャリーのトレーニングペアを生成する。
さらに、拡張CFGとリレーショナルグラフ畳み込みを利用して正確な目標予測を行うグラフニューラルモデルを設計する。
論文 参考訳(メタデータ) (2025-07-24T20:54:41Z) - Disentangling Memory and Reasoning Ability in Large Language Models [97.26827060106581]
本稿では、複雑な推論プロセスを2つの異なる明確なアクションに分解する新しい推論パラダイムを提案する。
実験の結果, この分解によりモデル性能が向上し, 推論プロセスの解釈可能性も向上することがわかった。
論文 参考訳(メタデータ) (2024-11-20T17:55:38Z) - SHERL: Synthesizing High Accuracy and Efficient Memory for Resource-Limited Transfer Learning [63.93193829913252]
本稿では,リソース制限シナリオに対するSHERLと呼ばれる革新的なMETL戦略を提案する。
初期経路では、中間出力は反冗長動作によって統合される。
遅延ルートでは、最小限の遅延事前トレーニングされたレイヤを利用することで、メモリオーバーヘッドのピーク需要を軽減できる。
論文 参考訳(メタデータ) (2024-07-10T10:22:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。