論文の概要: Integrated Exploration and Sequential Manipulation on Scene Graph with LLM-based Situated Replanning
- arxiv url: http://arxiv.org/abs/2602.04419v2
- Date: Sat, 14 Feb 2026 03:23:05 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-23 08:17:41.16498
- Title: Integrated Exploration and Sequential Manipulation on Scene Graph with LLM-based Situated Replanning
- Title(参考訳): LLMに基づくSituated Replanningによるシーングラフの総合的探索と逐次操作
- Authors: Heqing Yang, Ziyuan Jiao, Shu Wang, Yida Niu, Si Liu, Hangxin Liu,
- Abstract要約: 本研究では,Scene Graphs 上での探索に基づく逐次操作計画フレームワーク EPoG を提案する。
EPoGはグラフベースのグローバルプランナとLarge Language Model(LLM)ベースの位置対応ローカルプランナを統合している。
46の現実的な家庭シーンと5つのロングホライゾン・デイリー・オブジェクト・トランスポート・タスクのアブレーション調査において、EPoGは91.3%の成功率を達成した。
- 参考スコア(独自算出の注目度): 14.022940016337808
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In partially known environments, robots must combine exploration to gather information with task planning for efficient execution. To address this challenge, we propose EPoG, an Exploration-based sequential manipulation Planning framework on Scene Graphs. EPoG integrates a graph-based global planner with a Large Language Model (LLM)-based situated local planner, continuously updating a belief graph using observations and LLM predictions to represent known and unknown objects. Action sequences are generated by computing graph edit operations between the goal and belief graphs, ordered by temporal dependencies and movement costs. This approach seamlessly combines exploration and sequential manipulation planning. In ablation studies across 46 realistic household scenes and 5 long-horizon daily object transportation tasks, EPoG achieved a success rate of 91.3%, reducing travel distance by 36.1% on average. Furthermore, a physical mobile manipulator successfully executed complex tasks in unknown and dynamic environments, demonstrating EPoG's potential for real-world applications.
- Abstract(参考訳): 部分的に知られている環境では、ロボットは探索と効率的な実行のためのタスクプランニングを組み合わせなければならない。
この課題に対処するため,Scene Graphs 上での探索型シーケンシャルな操作計画フレームワーク EPoG を提案する。
EPoGは、グラフベースのグローバルプランナとLarge Language Model (LLM)ベースの位置対応ローカルプランナを統合し、観測とLCM予測を使用して信念グラフを継続的に更新し、未知のオブジェクトを表現している。
アクションシーケンスは、目標と信念グラフの間のグラフ編集操作を計算し、時間的依存と移動コストによって順序付けすることで生成される。
このアプローチは、探索とシーケンシャルな操作計画をシームレスに結合する。
46の現実的な家庭シーンと5つのロングホライズン・デイリー・オブジェクト・トランスポート・タスクのアブレーション調査において、EPoGは91.3%の成功率を達成し、平均して旅行距離を36.1%削減した。
さらに、物理移動マニピュレータは未知および動的環境において複雑なタスクをうまく実行し、実世界のアプリケーションに対するEPoGの可能性を示した。
関連論文リスト
- Spatially Grounded Long-Horizon Task Planning in the Wild [49.614308474374035]
GroundedPlanBenchは、空間的に接地された長距離行動計画のための新しいベンチマークである。
Video-to-Spatially Grounded Planning (V2GP)は、現実のロボットビデオのデモを活用して、空間的地平面の長期計画を改善する自動データ生成フレームワークである。
論文 参考訳(メタデータ) (2026-03-13T05:42:18Z) - Boosting Zero-Shot VLN via Abstract Obstacle Map-Based Waypoint Prediction with TopoGraph-and-VisitInfo-Aware Prompting [18.325003967982827]
視覚言語ナビゲーション (VLN) は、広範囲に応用されたエージェントの具体化のための重要なタスクとして登場した。
マルチモーダル大言語モデル(MLLM)と簡易かつ効果的なウェイポイント予測器を統合したゼロショットフレームワークを提案する。
R2R-CE と RxR-CE の実験結果から,本手法は最先端のゼロショット性能を実現し,成功率は 41% と 36% であった。
論文 参考訳(メタデータ) (2025-09-24T19:21:39Z) - Embodied Instruction Following in Unknown Environments [64.57388036567461]
未知環境における複雑なタスクに対するEIF(Embodied instruction following)法を提案する。
我々は,ハイレベルなタスクプランナと低レベルな探索コントローラを含む,階層的な具体化命令に従うフレームワークを構築した。
タスクプランナに対しては、タスク完了プロセスと既知の視覚的手がかりに基づいて、人間の目標達成のための実行可能なステップバイステッププランを生成する。
論文 参考訳(メタデータ) (2024-06-17T17:55:40Z) - Deep Reinforcement Learning with Dynamic Graphs for Adaptive Informative Path Planning [22.48658555542736]
ロボットデータ取得における重要な課題は、当初未知の環境を抜けて観測を収集する計画経路である。
そこで本研究では,未知の3D環境において,ロボット経路を適応的に計画し,対象をマップする深層強化学習手法を提案する。
論文 参考訳(メタデータ) (2024-02-07T14:24:41Z) - SayPlan: Grounding Large Language Models using 3D Scene Graphs for
Scalable Robot Task Planning [15.346150968195015]
本研究では,3次元シーングラフ(DSG)表現を用いた大規模タスクプランニングのスケーラブルなアプローチであるSayPlanを紹介する。
我々は,最大3フロア,36部屋,140部屋までの大規模な2つの環境に対するアプローチを評価した。
論文 参考訳(メタデータ) (2023-07-12T12:37:55Z) - Embodied Task Planning with Large Language Models [86.63533340293361]
本研究では,現場制約を考慮した地上計画のための具体的タスクにおけるTAsk Planing Agent (TaPA)を提案する。
推論の際には,オープンボキャブラリオブジェクト検出器を様々な場所で収集された多視点RGB画像に拡張することにより,シーン内の物体を検出する。
実験の結果,我々のTaPAフレームワークから生成されたプランは,LLaVAやGPT-3.5よりも大きなマージンで高い成功率が得られることがわかった。
論文 参考訳(メタデータ) (2023-07-04T17:58:25Z) - Sequential Manipulation Planning on Scene Graph [90.28117916077073]
我々は,効率的な逐次タスク計画のための3次元シーングラフ表現であるコンタクトグラフ+(cg+)を考案する。
ゴール設定は、自然にコンタクトグラフに指定され、最適化法を用いて遺伝的アルゴリズムによって作成することができる。
次に、初期接触グラフと目標設定との間のグラフ編集距離(GED)を計算してタスクプランを簡潔化し、ロボット動作に対応するグラフ編集操作を生成する。
論文 参考訳(メタデータ) (2022-07-10T02:01:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。