論文の概要: TASKOGRAPHY: Evaluating robot task planning over large 3D scene graphs
- arxiv url: http://arxiv.org/abs/2207.05006v1
- Date: Mon, 11 Jul 2022 16:51:44 GMT
- ステータス: 処理完了
- システム内更新日: 2022-07-12 14:22:36.796146
- Title: TASKOGRAPHY: Evaluating robot task planning over large 3D scene graphs
- Title(参考訳): タスクグラフィ:大規模3次元シーングラフを用いたロボットタスク計画の評価
- Authors: Christopher Agia, Krishna Murthy Jatavallabhula, Mohamed Khodeir,
Ondrej Miksik, Vibhav Vineet, Mustafa Mukadam, Liam Paull, Florian Shkurti
- Abstract要約: TASKOGRAPHYは、3DSGを使った最初の大規模ロボットタスク計画ベンチマークである。
タスク条件付き3DSGスカラー化手法であるSCRUBを提案する。
また,学習ベースプランナが3DSG構造を活用できる手法であるSEEKを提案する。
- 参考スコア(独自算出の注目度): 33.25317860393983
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: 3D scene graphs (3DSGs) are an emerging description; unifying symbolic,
topological, and metric scene representations. However, typical 3DSGs contain
hundreds of objects and symbols even for small environments; rendering task
planning on the full graph impractical. We construct TASKOGRAPHY, the first
large-scale robotic task planning benchmark over 3DSGs. While most benchmarking
efforts in this area focus on vision-based planning, we systematically study
symbolic planning, to decouple planning performance from visual representation
learning. We observe that, among existing methods, neither classical nor
learning-based planners are capable of real-time planning over full 3DSGs.
Enabling real-time planning demands progress on both (a) sparsifying 3DSGs for
tractable planning and (b) designing planners that better exploit 3DSG
hierarchies. Towards the former goal, we propose SCRUB, a task-conditioned 3DSG
sparsification method; enabling classical planners to match and in some cases
surpass state-of-the-art learning-based planners. Towards the latter goal, we
propose SEEK, a procedure enabling learning-based planners to exploit 3DSG
structure, reducing the number of replanning queries required by current best
approaches by an order of magnitude. We will open-source all code and baselines
to spur further research along the intersections of robot task planning,
learning and 3DSGs.
- Abstract(参考訳): 3dシーングラフ(3dsgs)は、シンボリック、トポロジカル、メトリックシーンの表現を統一する、新たな記述である。
しかし、典型的な3DSGは、小さな環境であっても数百のオブジェクトとシンボルを含んでいる。
3DSG上での大規模ロボットタスク計画ベンチマークであるTASKOGRAPHYを構築した。
この領域におけるほとんどのベンチマークは視覚に基づく計画に焦点を当てているが、私たちは計画のパフォーマンスと視覚的表現学習を分離するためにシンボリックプランニングを体系的に研究している。
既存の手法では,古典的・学習的プランナでも,完全な3DSGをリアルタイムに計画することができない。
両方のリアルタイム計画要求の進展
(a)トラクタブルプランニングのための3DSG
b) 3DSG階層をよりよく活用するプランナーの設計。
従来の目標に向けて,タスク条件付き3DSGスカラー化手法であるSCRUBを提案する。
後者の目標に向けて,学習ベースのプランナーが3dsg構造を活用できる手法である seek を提案し,現在のベストアプローチで要求される再計画クエリ数を桁違いに削減する。
私たちはすべてのコードとベースラインをオープンソース化し、ロボットタスク計画、学習、3dsgsの交点に沿ってさらなる研究を進めます。
関連論文リスト
- Socratic Planner: Inquiry-Based Zero-Shot Planning for Embodied Instruction Following [17.608330952846075]
EIF(Embodied Instruction following)は、3D環境のオブジェクトをナビゲートして操作することで自然言語命令を実行するタスクである。
EIFの主な課題の1つは構成的タスク計画であり、しばしばラベル付きデータによる教師付きまたはコンテキスト内学習で対処される。
トレーニングデータを必要とせずに推測できる最初のゼロショットプランニング手法であるソクラティックプランナーを紹介する。
論文 参考訳(メタデータ) (2024-04-21T08:10:20Z) - Planning as In-Painting: A Diffusion-Based Embodied Task Planning
Framework for Environments under Uncertainty [56.30846158280031]
具体的AIのためのタスクプランニングは、最も難しい問題の1つだ。
In-paintingとしての計画」というタスク非依存の手法を提案する。
提案するフレームワークは,様々な具体的AIタスクにおいて,有望なパフォーマンスを実現する。
論文 参考訳(メタデータ) (2023-12-02T10:07:17Z) - ConceptGraphs: Open-Vocabulary 3D Scene Graphs for Perception and
Planning [125.90002884194838]
ConceptGraphsはオープンな3Dシーン用のグラフ構造化表現である。
2Dファウンデーションモデルを活用し、マルチビューアソシエーションによってアウトプットを3Dに融合することで構築される。
我々は,この表現の有用性を,下流の計画タスクを通じて実証する。
論文 参考訳(メタデータ) (2023-09-28T17:53:38Z) - SayPlan: Grounding Large Language Models using 3D Scene Graphs for
Scalable Robot Task Planning [15.346150968195015]
本研究では,3次元シーングラフ(DSG)表現を用いた大規模タスクプランニングのスケーラブルなアプローチであるSayPlanを紹介する。
我々は,最大3フロア,36部屋,140部屋までの大規模な2つの環境に対するアプローチを評価した。
論文 参考訳(メタデータ) (2023-07-12T12:37:55Z) - Embodied Task Planning with Large Language Models [86.63533340293361]
本研究では,現場制約を考慮した地上計画のための具体的タスクにおけるTAsk Planing Agent (TaPA)を提案する。
推論の際には,オープンボキャブラリオブジェクト検出器を様々な場所で収集された多視点RGB画像に拡張することにより,シーン内の物体を検出する。
実験の結果,我々のTaPAフレームワークから生成されたプランは,LLaVAやGPT-3.5よりも大きなマージンで高い成功率が得られることがわかった。
論文 参考訳(メタデータ) (2023-07-04T17:58:25Z) - Learning to Reason over Scene Graphs: A Case Study of Finetuning GPT-2
into a Robot Language Model for Grounded Task Planning [45.51792981370957]
本研究では,ロボットタスク計画における小クラス大規模言語モデル(LLM)の適用性について,計画立案者が順次実行するためのサブゴール仕様にタスクを分解することを学ぶことによって検討する。
本手法は,シーングラフとして表現される領域上でのLLMの入力に基づいて,人間の要求を実行可能なロボット計画に変換する。
本研究は,LLMに格納された知識を長期タスクプランニングに効果的に活用できることを示唆し,ロボット工学におけるニューロシンボリックプランニング手法の今後の可能性を示すものである。
論文 参考訳(メタデータ) (2023-05-12T18:14:32Z) - A Framework for Neurosymbolic Robot Action Planning using Large Language Models [3.0501524254444767]
本稿では,象徴的タスク計画と機械学習アプローチのギャップを埋めることを目的としたフレームワークを提案する。
大規模言語モデル(LLM)を計画ドメイン定義言語(PDDL)と互換性のあるニューロシンボリックタスクプランナーに訓練する根拠
選択されたドメインにおける予備的な結果から, (i) テストデータセットの95.5%の問題を1,000個のサンプルで解決し, (ii) 従来のシンボルプランナーよりも最大13.5%短いプランを作成し, (iii) 計画の可利用性の平均待ち時間を61.4%まで削減する。
論文 参考訳(メタデータ) (2023-03-01T11:54:22Z) - Sequential Manipulation Planning on Scene Graph [90.28117916077073]
我々は,効率的な逐次タスク計画のための3次元シーングラフ表現であるコンタクトグラフ+(cg+)を考案する。
ゴール設定は、自然にコンタクトグラフに指定され、最適化法を用いて遺伝的アルゴリズムによって作成することができる。
次に、初期接触グラフと目標設定との間のグラフ編集距離(GED)を計算してタスクプランを簡潔化し、ロボット動作に対応するグラフ編集操作を生成する。
論文 参考訳(メタデータ) (2022-07-10T02:01:33Z) - Enabling Visual Action Planning for Object Manipulation through Latent
Space Roadmap [72.01609575400498]
高次元状態空間を有する複雑な操作タスクの視覚的行動計画のための枠組みを提案する。
低次元潜時空間におけるシステムダイナミクスを世界規模で捉えたグラフベースの構造であるタスク計画のためのLatent Space Roadmap(LSR)を提案する。
実ロボットで実行された2つの模擬ボックス積み重ねタスクと折り畳みタスクについて,本フレームワークの徹底的な検討を行う。
論文 参考訳(メタデータ) (2021-03-03T17:48:26Z) - Planning with Learned Object Importance in Large Problem Instances using
Graph Neural Networks [28.488201307961624]
現実の計画問題は、数百から数千ものオブジェクトを巻き込むことが多い。
単一推論パスにおけるオブジェクトの重要性を予測するためのグラフニューラルネットワークアーキテクチャを提案する。
提案手法では,プランナと遷移モデルをブラックボックスとして扱い,既製のプランナで使用することができる。
論文 参考訳(メタデータ) (2020-09-11T18:55:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。