論文の概要: DUPLEX: Agentic Dual-System Planning via LLM-Driven Information Extraction
- arxiv url: http://arxiv.org/abs/2603.23909v1
- Date: Wed, 25 Mar 2026 03:57:44 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-26 21:06:11.117773
- Title: DUPLEX: Agentic Dual-System Planning via LLM-Driven Information Extraction
- Title(参考訳): DUPLEX:LLM駆動情報抽出によるエージェントデュアルシステム計画
- Authors: Keru Hua, Ding Wang, Yaoying Gu, Xiaoguang Ma,
- Abstract要約: 大規模言語モデル(LLM)は、ロボットタスク計画のためのセマンティックな柔軟性を提供する。
幻覚や論理的不整合への感受性は、長い水平領域における信頼性を制限している。
本稿では,LLMをスキーマ誘導情報抽出に厳密に閉じ込めるデュアルシステムニューロシンボリックアーキテクチャを提案する。
- 参考スコア(独自算出の注目度): 11.920443665332629
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: While Large Language Models (LLMs) provide semantic flexibility for robotic task planning, their susceptibility to hallucination and logical inconsistency limits their reliability in long-horizon domains. To bridge the gap between unstructured environments and rigorous plan synthesis, we propose DUPLEX, an agentic dual-system neuro-symbolic architecture that strictly confines the LLM to schema-guided information extraction rather than end-to-end planning or code generation. In our framework, a feed-forward Fast System utilizes a lightweight LLM to extract entities, relations etc. from natural language, deterministically mapping them into a Planning Domain Definition Language (PDDL) problem file for a classical symbolic planner. To resolve complex or underspecified scenarios, a Slow System is activated exclusively upon planning failure, leveraging solver diagnostics to drive a high-capacity LLM in iterative reflection and repair. Extensive evaluations across 12 classical and household planning domains demonstrate that DUPLEX significantly outperforms existing end-to-end and hybrid LLM baselines in both success rate and reliability. These results confirm that The key is not to make the LLM plan better, but to restrict the LLM to the part it is good at - structured semantic grounding - and leave logical plan synthesis to a symbolic planner.
- Abstract(参考訳): 大規模言語モデル(LLM)はロボットタスク計画にセマンティックな柔軟性を提供するが、幻覚への感受性と論理的不整合は、長い水平領域における信頼性を制限する。
本研究では,非構造化環境と厳密な計画合成のギャップを埋めるために,LLMをエンドツーエンド計画やコード生成ではなく,スキーマ誘導情報抽出に厳密に閉じ込めるエージェント二重系ニューロシンボリックアーキテクチャであるDUPLEXを提案する。
本フレームワークでは,フィードフォワード高速システムを用いて,自然言語からエンティティや関係などを抽出し,古典的記号プランナのための計画ドメイン定義言語(PDDL)問題ファイルに決定的にマッピングする。
複雑なシナリオや未特定シナリオを解決するため、Slow Systemは計画失敗にのみアクティベートされ、リフレクションと修復において高容量のLCMを駆動するためにソルバ診断を利用する。
12の古典的・家庭的計画領域にわたる広範囲な評価は、DUPLEXが既存のエンドツーエンドとハイブリッドLSMベースラインを、成功率と信頼性の両方で著しく上回っていることを示している。
これらの結果は,LLM計画の改善ではなく,LLMが得意とする部分 – 構造的セマンティックグラウンドリング – に限定し,論理的計画合成を記号的プランナーに委ねることであることを確認した。
関連論文リスト
- SafePilot: A Framework for Assuring LLM-enabled Cyber-Physical Systems [2.2566909388480743]
大規模言語モデル(LLM)は、最近、様々なサイバー物理システムに統合され始めている。
LLMは"ハロシン化"(hallucination)を生成します。
属性ベースおよび時間仕様に従ってCPSのエンドツーエンド保証を提供する新しい階層型ニューロシンボリックフレームワークであるSafePilotを提案する。
論文 参考訳(メタデータ) (2026-03-23T03:31:51Z) - Scale-Plan: Scalable Language-Enabled Task Planning for Heterogeneous Multi-Robot Teams [11.964765256346857]
不均質なマルチロボットシステムのための長期タスクプランニングは、実環境における協調チームの配置に不可欠である。
自然言語命令からタスク関連問題表現をコンパクトに生成する,スケーラブルなLLM支援フレームワークであるScale-Planを提案する。
計画に先立って無関係な情報をフィルタリングすることにより、スケールプランは効率的な分解、割り当て、長期計画生成を可能にします。
論文 参考訳(メタデータ) (2026-03-09T18:13:18Z) - LogicGuard: Improving Embodied LLM agents through Temporal Logic based Critics [3.3890411643175646]
大規模言語モデル(LLM)はゼロショットと単一ステップの推論と意思決定の問題において有望であることを示している。
LogicGuardは,LLMアクターを軌跡レベルのLCM評論家に案内するモジュール型アクター・クリティックアーキテクチャである。
我々のセットアップは、言語モデルの推論強度と形式論理の保証を組み合わせる。
論文 参考訳(メタデータ) (2025-07-04T04:53:53Z) - Learning to Reason and Navigate: Parameter Efficient Action Planning with Large Language Models [63.765846080050906]
本稿では,大規模言語モデル (PEAP-LLM) を用いたパラメータ効率の高いアクションプランナを提案する。
実験により,提案したREVERIEモデルが従来の最先端モデルよりも優れていることが示された。
論文 参考訳(メタデータ) (2025-05-12T12:38:20Z) - LLM-Lasso: A Robust Framework for Domain-Informed Feature Selection and Regularization [59.75242204923353]
LLM-Lassoは大規模言語モデル(LLM)を利用してラッソ回帰における特徴選択を導くフレームワークである。
LLMは各特徴に対してペナルティ因子を生成し、単純でチューニング可能なモデルを用いてラスソペナルティの重みに変換される。
LLMによりより関連づけられた特徴は、より低い罰を受け、最終モデルに保持される可能性を高める。
論文 参考訳(メタデータ) (2025-02-15T02:55:22Z) - Think Small, Plan Smart: Minimalist Symbolic Abstraction and Heuristic Subspace Search for LLM-Guided Task Planning [19.421916137269275]
大規模言語モデル(LLM)は、複雑で曖昧な自然言語命令を実行可能な計画に変換するための有望なインターフェースを提供する。
最近のフレームワークは、まずアクションモデル(Planning Domain Definition Language)を生成し、次に検索を適用することで、LCMとシンボリックプランナーを組み合わせる。
抽象的シンボル表現とメタヒューリスティックな部分空間探索を並列かつ反復的に統合する2段階のLLMシンボリック計画フレームワークPLAHXを提案する。
論文 参考訳(メタデータ) (2025-01-25T13:33:22Z) - Interactive and Expressive Code-Augmented Planning with Large Language Models [62.799579304821826]
大きな言語モデル(LLM)は、常識的推論と対話的な意思決定において強力な能力を示す。
近年,制御フローなどのコード・アジャセント技術を用いてLCM出力を構造化し,計画性能を向上させる技術が提案されている。
完全コード表現で動的なLEM計画手法であるREPL-Planを提案する。
論文 参考訳(メタデータ) (2024-11-21T04:23:17Z) - Unlocking Reasoning Potential in Large Langauge Models by Scaling Code-form Planning [94.76546523689113]
CodePlanは、テキストコード形式の計画を生成し、追跡するフレームワークで、高いレベルの構造化された推論プロセスの概要を擬似コードで示します。
CodePlanは、洗練された推論タスク固有のリッチなセマンティクスと制御フローを効果的にキャプチャする。
反応を直接生成するのに比べて25.1%の相対的な改善が達成されている。
論文 参考訳(メタデータ) (2024-09-19T04:13:58Z) - Dynamic Planning with a LLM [15.430182858130884]
大言語モデル(LLM)はゼロショット設定で多くのNLPタスクを解くことができるが、具体化エージェントを含むアプリケーションは依然として問題である。
LLM動的プランナー(LLM-DP)は,LLMが従来のプランナーと手動で作業し,具体的課題を解決する,神経象徴的な枠組みである。
論文 参考訳(メタデータ) (2023-08-11T21:17:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。