論文の概要: Constrained Natural Language Action Planning for Resilient Embodied Systems
- arxiv url: http://arxiv.org/abs/2510.06357v1
- Date: Tue, 07 Oct 2025 18:23:12 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-09 16:41:20.141474
- Title: Constrained Natural Language Action Planning for Resilient Embodied Systems
- Title(参考訳): レジリエンス・エボダイドシステムのための制約付き自然言語行動計画
- Authors: Grayson Byrd, Corban Rivera, Bethany Kemp, Meghan Booker, Aurora Schmidt, Celso M de Melo, Lalithkumar Seenivasan, Mathias Unberath,
- Abstract要約: タスクプランニングのための大規模言語モデル(LLM)は、複雑な計画タスクの以前に難解な状態/アクション空間に対処しようとする。
信頼性と再現性を向上させるために,LLMプランナを象徴的な計画監督で強化する新しいロボット計画手法を提案する。
- 参考スコア(独自算出の注目度): 9.883720604599146
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Replicating human-level intelligence in the execution of embodied tasks remains challenging due to the unconstrained nature of real-world environments. Novel use of large language models (LLMs) for task planning seeks to address the previously intractable state/action space of complex planning tasks, but hallucinations limit their reliability, and thus, viability beyond a research context. Additionally, the prompt engineering required to achieve adequate system performance lacks transparency, and thus, repeatability. In contrast to LLM planning, symbolic planning methods offer strong reliability and repeatability guarantees, but struggle to scale to the complexity and ambiguity of real-world tasks. We introduce a new robotic planning method that augments LLM planners with symbolic planning oversight to improve reliability and repeatability, and provide a transparent approach to defining hard constraints with considerably stronger clarity than traditional prompt engineering. Importantly, these augmentations preserve the reasoning capabilities of LLMs and retain impressive generalization in open-world environments. We demonstrate our approach in simulated and real-world environments. On the ALFWorld planning benchmark, our approach outperforms current state-of-the-art methods, achieving a near-perfect 99% success rate. Deployment of our method to a real-world quadruped robot resulted in 100% task success compared to 50% and 30% for pure LLM and symbolic planners across embodied pick and place tasks. Our approach presents an effective strategy to enhance the reliability, repeatability and transparency of LLM-based robot planners while retaining their key strengths: flexibility and generalizability to complex real-world environments. We hope that this work will contribute to the broad goal of building resilient embodied intelligent systems.
- Abstract(参考訳): 具体的タスクの実行における人間レベルのインテリジェンスの再現は、現実の環境の制約のない性質のため、依然として困難である。
タスクプランニングにおける大規模言語モデル(LLM)の新たな利用は、複雑な計画タスクのそれまでの難解な状態/行動空間に対処しようとするが、幻覚は信頼性を制限し、研究コンテキストを超えた生存性を実現する。
さらに、適切なシステム性能を達成するために必要な素早いエンジニアリングは透明性を欠いているため、反復性がある。
LLM計画とは対照的に、シンボリックプランニング手法は信頼性と再現性を保証するが、現実のタスクの複雑さとあいまいさにスケールするのに苦労する。
我々は,LLMプランナに,信頼性と再現性の向上を図り,従来のプロンプトエンジニアリングよりもはるかに高い明快さで厳密な制約を定義するための透過的なアプローチを提供する,新しいロボット計画手法を提案する。
重要なことに、これらの拡張はLLMの推論能力を保ち、オープンワールド環境における印象的な一般化を維持している。
シミュレーションおよび実環境における我々のアプローチを実証する。
ALFWorld計画ベンチマークでは、我々の手法は現在の最先端の手法よりも優れており、ほぼ完全な99%の成功率を実現しています。
実世界の四足歩行ロボットへの本手法の展開により、100%のタスク成功が達成され、純粋なLSMとシンボルプランナーの50%と30%が、具体化されたピック・アンド・プレイス・タスクにまたがって達成された。
提案手法は, LLMをベースとしたロボットプランナの信頼性, 再現性, 透明性を向上させるとともに, 複雑な実環境への柔軟性, 一般化性といった重要な強みを維持しつつ, 効果的な戦略を示す。
この取り組みが、レジリエントなインボディード・インテリジェントなシステムを構築するという、幅広い目標に貢献できることを願っています。
関連論文リスト
- Instruction-Augmented Long-Horizon Planning: Embedding Grounding Mechanisms in Embodied Mobile Manipulation [39.43049944895508]
Instruction-Augmented Long-Horizon Planning (IALP) システムを提案する。
その結果, IALPシステムでは, 平均成功率80%を超えるタスクを効率的に解けることがわかった。
論文 参考訳(メタデータ) (2025-03-11T06:37:33Z) - Think Small, Plan Smart: Minimalist Symbolic Abstraction and Heuristic Subspace Search for LLM-Guided Task Planning [19.421916137269275]
大規模言語モデル(LLM)は、複雑で曖昧な自然言語命令を実行可能な計画に変換するための有望なインターフェースを提供する。
最近のフレームワークは、まずアクションモデル(Planning Domain Definition Language)を生成し、次に検索を適用することで、LCMとシンボリックプランナーを組み合わせる。
抽象的シンボル表現とメタヒューリスティックな部分空間探索を並列かつ反復的に統合する2段階のLLMシンボリック計画フレームワークPLAHXを提案する。
論文 参考訳(メタデータ) (2025-01-25T13:33:22Z) - Robotic World Model: A Neural Network Simulator for Robust Policy Optimization in Robotics [50.191655141020505]
この研究は、長期水平予測、エラー蓄積、およびsim-to-real転送の課題に対処することで、モデルに基づく強化学習を前進させる。
スケーラブルでロバストなフレームワークを提供することで、現実のアプリケーションにおいて適応的で効率的なロボットシステムを実現することができる。
論文 参考訳(メタデータ) (2025-01-17T10:39:09Z) - EgoPlan-Bench2: A Benchmark for Multimodal Large Language Model Planning in Real-World Scenarios [53.26658545922884]
EgoPlan-Bench2は,MLLMの計画能力を評価するためのベンチマークである。
我々は,21の競争的MLLMを評価し,その限界を詳細に分析した結果,実世界の計画において大きな課題に直面していることが明らかとなった。
EgoPlan-Bench2におけるGPT-4Vの10.24倍の性能向上を図る。
論文 参考訳(メタデータ) (2024-12-05T18:57:23Z) - Introspective Planning: Aligning Robots' Uncertainty with Inherent Task Ambiguity [0.659529078336196]
大規模言語モデル(LLM)は高度な推論能力を示し、ロボットが自然言語の指示を理解し、高レベルの行動を戦略的に計画することを可能にする。
LLMの幻覚は、ロボットがユーザー目標と不一致の計画を実行したり、クリティカルなシナリオでは安全でないりする可能性がある。
本稿では,LLMの不確かさとタスク固有のあいまいさを一致させる系統的手法であるイントロスペクティブプランニングを提案する。
論文 参考訳(メタデータ) (2024-02-09T16:40:59Z) - EgoPlan-Bench: Benchmarking Multimodal Large Language Models for Human-Level Planning [84.6451394629312]
実世界のシナリオにおけるMLLMの計画能力を評価するベンチマークであるEgoPlan-Benchを紹介する。
EgoPlan-Benchは、人間レベルのタスクプランニングを実現するためのMLLMの改善のかなりの範囲を浮き彫りにする。
また,EgoPlan-Bench上でのモデル性能を効果的に向上する特殊命令チューニングデータセットであるEgoPlan-ITを提案する。
論文 参考訳(メタデータ) (2023-12-11T03:35:58Z) - DREAMWALKER: Mental Planning for Continuous Vision-Language Navigation [107.5934592892763]
本稿では,世界モデルに基づくVLN-CEエージェントDREAMWALKERを提案する。
世界モデルは、複雑な連続環境の視覚的、位相的、動的特性を要約するために構築される。
コストのかかるアクションを実行する前に、そのような抽象的な世界で可能な計画を完全にシミュレートし、評価することができる。
論文 参考訳(メタデータ) (2023-08-14T23:45:01Z) - Efficient Learning of High Level Plans from Play [57.29562823883257]
本稿では,移動計画と深いRLを橋渡しするロボット学習のフレームワークであるELF-Pについて紹介する。
ELF-Pは、複数の現実的な操作タスクよりも、関連するベースラインよりもはるかに優れたサンプル効率を有することを示す。
論文 参考訳(メタデータ) (2023-03-16T20:09:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。