論文の概要: Context Matters! Relaxing Goals with LLMs for Feasible 3D Scene Planning
- arxiv url: http://arxiv.org/abs/2506.15828v1
- Date: Wed, 18 Jun 2025 19:14:56 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-23 19:00:04.816953
- Title: Context Matters! Relaxing Goals with LLMs for Feasible 3D Scene Planning
- Title(参考訳): 環境問題! LLMでゴールを緩和する3Dシーンプランニング
- Authors: Emanuele Musumeci, Michele Brienza, Francesco Argenziano, Vincenzo Suriani, Daniele Nardi, Domenico D. Bloisi,
- Abstract要約: 本稿では,古典的計画と大規模言語モデルを統合するアプローチを提案する。
本稿では,ロボットが実現不可能なタスクを抽出できるようにする階層型定式化を提案する。
提案手法は,3次元シーングラフを用いてモデル化した環境において,タスクの適応と実行を効果的に行うことができることを示す。
- 参考スコア(独自算出の注目度): 2.111102681327218
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Classical planning in AI and Robotics addresses complex tasks by shifting from imperative to declarative approaches (e.g., PDDL). However, these methods often fail in real scenarios due to limited robot perception and the need to ground perceptions to planning predicates. This often results in heavily hard-coded behaviors that struggle to adapt, even with scenarios where goals can be achieved through relaxed planning. Meanwhile, Large Language Models (LLMs) lead to planning systems that leverage commonsense reasoning but often at the cost of generating unfeasible and/or unsafe plans. To address these limitations, we present an approach integrating classical planning with LLMs, leveraging their ability to extract commonsense knowledge and ground actions. We propose a hierarchical formulation that enables robots to make unfeasible tasks tractable by defining functionally equivalent goals through gradual relaxation. This mechanism supports partial achievement of the intended objective, suited to the agent's specific context. Our method demonstrates its ability to adapt and execute tasks effectively within environments modeled using 3D Scene Graphs through comprehensive qualitative and quantitative evaluations. We also show how this method succeeds in complex scenarios where other benchmark methods are more likely to fail. Code, dataset, and additional material are released to the community.
- Abstract(参考訳): AIとロボティクスの古典的なプランニングは、命令型から宣言型アプローチ(PDDLなど)に移行することで複雑なタスクに対処する。
しかし、これらの手法は、ロボットの知覚が限られており、計画的な述語に対する認識を基盤にする必要があるため、現実のシナリオでは失敗することが多い。
これはしばしば、リラックスした計画を通じて目標を達成できるシナリオであっても、適応に苦労する、非常にハードコードされた振る舞いをもたらす。
一方、LLM(Large Language Models)は、常識推論を活用する計画システムに導かれるが、多くの場合、実現不可能で安全でない計画を生成するコストがかかる。
これらの制約に対処するため,従来のプランニングをLCMと統合し,コモンセンス知識と地上行動の抽出能力を活用する手法を提案する。
本稿では,ロボットが段階的緩和によって機能的に等価な目標を定義することによって,実現不可能なタスクを抽出できるようにする階層型定式化を提案する。
このメカニズムは、エージェントの特定のコンテキストに適した意図された目的の部分的な達成をサポートする。
本手法は,3次元シーングラフを用いてモデル化した環境下でのタスクの適応と実行を,包括的質的,定量的な評価によって効果的に行うことができることを示す。
また、この手法が、他のベンチマークメソッドが失敗しやすい複雑なシナリオでどのように成功するかを示す。
コード、データセット、および追加の資料がコミュニティにリリースされている。
関連論文リスト
- Grounding Language Models with Semantic Digital Twins for Robotic Planning [6.474368392218828]
セマンティック・デジタル・ツインズ(SDT)とLarge Language Models(LLM)を統合する新しいフレームワークを提案する。
提案フレームワークは,高レベル推論とセマンティック環境理解を効果的に組み合わせ,不確実性と障害に直面した信頼性の高いタスク完了を実現する。
論文 参考訳(メタデータ) (2025-06-19T17:38:00Z) - Scaling Autonomous Agents via Automatic Reward Modeling And Planning [52.39395405893965]
大規模言語モデル(LLM)は、様々なタスクにまたがる顕著な機能を示している。
しかし、彼らは多段階の意思決定と環境フィードバックを必要とする問題に苦戦している。
人間のアノテーションを使わずに環境から報酬モデルを自動的に学習できるフレームワークを提案する。
論文 参考訳(メタデータ) (2025-02-17T18:49:25Z) - MALMM: Multi-Agent Large Language Models for Zero-Shot Robotics Manipulation [52.739500459903724]
大規模言語モデル(LLM)は、ロボティクスの操作やナビゲーションなど、さまざまな領域にまたがる優れた計画能力を示している。
特殊なLLMエージェント間で高レベル計画および低レベル制御コード生成を分散する新しいマルチエージェントLLMフレームワークを提案する。
長軸タスクを含む9つのRLBenchタスクに対するアプローチを評価し、ゼロショット環境でロボット操作を解く能力を実証した。
論文 参考訳(メタデータ) (2024-11-26T17:53:44Z) - Introspective Planning: Aligning Robots' Uncertainty with Inherent Task Ambiguity [0.659529078336196]
大規模言語モデル(LLM)は高度な推論能力を示し、ロボットが自然言語の指示を理解し、高レベルの行動を戦略的に計画することを可能にする。
LLMの幻覚は、ロボットがユーザー目標と不一致の計画を実行したり、クリティカルなシナリオでは安全でないりする可能性がある。
本稿では,LLMの不確かさとタスク固有のあいまいさを一致させる系統的手法であるイントロスペクティブプランニングを提案する。
論文 参考訳(メタデータ) (2024-02-09T16:40:59Z) - LLM-Assist: Enhancing Closed-Loop Planning with Language-Based Reasoning [65.86754998249224]
従来のルールベースプランナとLCMベースのプランナを併用した,新しいハイブリッドプランナを開発した。
当社のアプローチでは,既存のプランナが苦労する複雑なシナリオをナビゲートし,合理的なアウトプットを生成すると同時に,ルールベースのアプローチと連携して作業する。
論文 参考訳(メタデータ) (2023-12-30T02:53:45Z) - Embodied Task Planning with Large Language Models [86.63533340293361]
本研究では,現場制約を考慮した地上計画のための具体的タスクにおけるTAsk Planing Agent (TaPA)を提案する。
推論の際には,オープンボキャブラリオブジェクト検出器を様々な場所で収集された多視点RGB画像に拡張することにより,シーン内の物体を検出する。
実験の結果,我々のTaPAフレームワークから生成されたプランは,LLaVAやGPT-3.5よりも大きなマージンで高い成功率が得られることがわかった。
論文 参考訳(メタデータ) (2023-07-04T17:58:25Z) - Planning to Practice: Efficient Online Fine-Tuning by Composing Goals in
Latent Space [76.46113138484947]
汎用ロボットは、現実世界の非構造環境において困難なタスクを完了するために、多様な行動レパートリーを必要とする。
この問題に対処するため、目標条件強化学習は、コマンド上の幅広いタスクの目標に到達可能なポリシーを取得することを目的としている。
本研究では,長期的課題に対する目標条件付き政策を実践的に訓練する手法であるPlanning to Practiceを提案する。
論文 参考訳(メタデータ) (2022-05-17T06:58:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。