論文の概要: Towards Reliable Code-as-Policies: A Neuro-Symbolic Framework for Embodied Task Planning
- arxiv url: http://arxiv.org/abs/2510.21302v1
- Date: Fri, 24 Oct 2025 10:01:08 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-28 09:00:15.43065
- Title: Towards Reliable Code-as-Policies: A Neuro-Symbolic Framework for Embodied Task Planning
- Title(参考訳): 信頼性の高いコード・アズ・ポリシーを目指して--タスクプランニングのためのニューロ・シンボリック・フレームワーク
- Authors: Sanghyun Ahn, Wonje Choi, Junyong Lee, Jinwoo Park, Honguk Woo,
- Abstract要約: 本稿では,コード生成時の明示的なシンボル検証と対話的検証処理を組み込んだ,ニューロシンボリックなタスク計画フレームワークを提案する。
我々はRLBenchと動的に部分的に観測可能なシナリオにわたる実環境設定のフレームワークを評価した。
- 参考スコア(独自算出の注目度): 25.860785629018356
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recent advances in large language models (LLMs) have enabled the automatic generation of executable code for task planning and control in embodied agents such as robots, demonstrating the potential of LLM-based embodied intelligence. However, these LLM-based code-as-policies approaches often suffer from limited environmental grounding, particularly in dynamic or partially observable settings, leading to suboptimal task success rates due to incorrect or incomplete code generation. In this work, we propose a neuro-symbolic embodied task planning framework that incorporates explicit symbolic verification and interactive validation processes during code generation. In the validation phase, the framework generates exploratory code that actively interacts with the environment to acquire missing observations while preserving task-relevant states. This integrated process enhances the grounding of generated code, resulting in improved task reliability and success rates in complex environments. We evaluate our framework on RLBench and in real-world settings across dynamic, partially observable scenarios. Experimental results demonstrate that our framework improves task success rates by 46.2% over Code-as-Policies baselines and attains over 86.8% executability of task-relevant actions, thereby enhancing the reliability of task planning in dynamic environments.
- Abstract(参考訳): 大規模言語モデル(LLM)の最近の進歩は、ロボットのようなエンボディエージェントのタスク計画と制御のための実行可能なコードの自動生成を可能にし、LLMベースのエンボディインテリジェンスの可能性を示している。
しかしながら、これらのLCMベースのコード・アズ・ポリティシー・アプローチは、特に動的または部分的に観察可能な設定において、限られた環境基盤に悩まされることが多く、不正確なコード生成や不完全なコード生成によって、最適でないタスクの成功率に繋がる。
本研究では,コード生成時の明示的なシンボル検証と対話的検証処理を組み込んだ,ニューロシンボリックな具体的タスク計画フレームワークを提案する。
検証フェーズにおいて、このフレームワークは、タスク関連状態を保ちながら、環境と活発に相互作用する探索コードを生成し、行方不明な観察を取得する。
この統合プロセスにより、生成されたコードの基盤が強化され、複雑な環境におけるタスクの信頼性と成功率が改善される。
我々はRLBenchと動的に部分的に観測可能なシナリオにわたる実環境設定のフレームワークを評価した。
実験の結果,コード・アズ・ポリシーよりもタスク成功率を46.2%向上させ,タスク関連行動の実行可能性86.8%以上を達成し,動的環境におけるタスク計画の信頼性を高めた。
関連論文リスト
- Exploratory Retrieval-Augmented Planning For Continual Embodied Instruction Following [30.757285244293794]
本研究では,動的非定常環境におけるエンボディエージェントのタスクに追従した継続的指導に対処するために,探索的検索型拡張計画(ExRAP)フレームワークを提案する。
このフレームワークは、物理環境を効率的に探索し、環境コンテキスト記憶を確立することにより、大規模言語モデルの具体的推論能力を高める。
目標達成率と実行効率の両面で、最先端のLCMベースのタスク計画アプローチを一貫して上回ります。
論文 参考訳(メタデータ) (2025-09-10T01:39:51Z) - Unlocking Smarter Device Control: Foresighted Planning with a World Model-Driven Code Execution Approach [82.27842884709378]
本研究では,自然言語理解と構造化推論を優先し,エージェントの環境に対するグローバルな理解を高める枠組みを提案する。
本手法は,従来の手法,特にタスク成功率の44.4%向上を達成している。
論文 参考訳(メタデータ) (2025-05-22T09:08:47Z) - CLEA: Closed-Loop Embodied Agent for Enhancing Task Execution in Dynamic Environments [39.5949489828609]
大規模言語モデル(LLM)は、意味論的推論を通じて複雑なタスクを階層的に分解する際、顕著な能力を示す。
クローズドループ・エンボダイド・エージェント (CLEA) は,クローズドループタスク管理のための機能的デカップリングを備えた,4つの特別なオープンソース LLM を組み込んだ新しいアーキテクチャである。
我々は、物体探索、操作、探索操作統合タスクのための2つの異種ロボットを用いて、操作可能な物体を実環境で実験する。
論文 参考訳(メタデータ) (2025-03-02T04:50:59Z) - DynaSaur: Large Language Agents Beyond Predefined Actions [126.98162266986554]
既存のLLMエージェントシステムは、通常、各ステップで固定セットと事前定義されたセットからアクションを選択する。
動作を動的に生成・構成できるLLMエージェントフレームワークを提案する。
このフレームワークでは、汎用プログラミング言語で書かれたプログラムを生成し実行することで、エージェントが環境と対話する。
論文 参考訳(メタデータ) (2024-11-04T02:08:59Z) - AgentGen: Enhancing Planning Abilities for Large Language Model based Agent via Environment and Task Generation [81.32722475387364]
大規模言語モデルに基づくエージェントが注目され、ますます人気が高まっている。
計画能力は LLM ベースのエージェントの重要な構成要素であり、通常は初期状態から望ましい目標を達成する必要がある。
近年の研究では、専門家レベルの軌跡を指導訓練用LLMに活用することで、効果的に計画能力を向上させることが示されている。
論文 参考訳(メタデータ) (2024-08-01T17:59:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。