論文の概要: Contextual Graph Representations for Task-Driven 3D Perception and Planning
- arxiv url: http://arxiv.org/abs/2603.26685v1
- Date: Thu, 12 Mar 2026 00:45:12 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-06 02:36:13.072669
- Title: Contextual Graph Representations for Task-Driven 3D Perception and Planning
- Title(参考訳): タスク駆動型3次元知覚と計画のための文脈グラフ表現
- Authors: Christopher Agia,
- Abstract要約: コンピュータビジョンの最近の進歩は、視覚慣性データからオブジェクト中心リレーショナル表現を完全に自動抽出することを促進する。
これらの状態表現は、3次元シーングラフと呼ばれ、密な多重グラフ構造を持つ実世界のシーンの階層的な分解である。
この論文は、ロボットタスク計画と3Dシーングラフの交点における研究のために、既存の組み込みAI環境の適合性をテストする。
- 参考スコア(独自算出の注目度): 1.7421265706896534
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recent advances in computer vision facilitate fully automatic extraction of object-centric relational representations from visual-inertial data. These state representations, dubbed 3D scene graphs, are a hierarchical decomposition of real-world scenes with a dense multiplex graph structure. While 3D scene graphs claim to promote efficient task planning for robot systems, they contain numerous objects and relations when only small subsets are required for a given task. This magnifies the state space that task planners must operate over and prohibits deployment in resource constrained settings. This thesis tests the suitability of existing embodied AI environments for research at the intersection of robot task planning and 3D scene graphs and constructs a benchmark for empirical comparison of state-of-the-art classical planners. Furthermore, we explore the use of graph neural networks to harness invariances in the relational structure of planning domains and learn representations that afford faster planning.
- Abstract(参考訳): コンピュータビジョンの最近の進歩は、視覚慣性データからオブジェクト中心リレーショナル表現を完全に自動抽出することを促進する。
これらの状態表現は、3次元シーングラフと呼ばれ、密な多重グラフ構造を持つ実世界のシーンの階層的な分解である。
3Dシーングラフは、ロボットシステムの効率的なタスク計画を促進するが、与えられたタスクに小さなサブセットしか必要としない場合、多数のオブジェクトと関係を含む。
これはタスクプランナが操作しなければならない状態空間を拡大し、リソース制約のある設定でのデプロイメントを禁止します。
この論文は、ロボットタスク計画と3Dシーングラフの交点における研究のための既存の実施済みAI環境の適合性を検証し、最先端の古典的プランナーの実証的な比較のためのベンチマークを構築する。
さらに、計画領域のリレーショナル構造における不変性を生かし、より高速な計画が可能な表現を学習するためのグラフニューラルネットワークの利用についても検討する。
関連論文リスト
- Queryable 3D Scene Representation: A Multi-Modal Framework for Semantic Reasoning and Robotic Task Planning [28.803789915686398]
3D Queryable Scene Representation(3D QSR)は、3つの補完的な3D表現を統合するマルチメディアデータ上に構築されたフレームワークである。
オブジェクト中心の設計に基づいて構築されたこのフレームワークは、意味的なクエリビリティを実現するために、大きな視覚言語モデルと統合されている。
その結果,シーン理解の促進と空間的および意味的推論の統合が,フレームワークの持つ能力を示す。
論文 参考訳(メタデータ) (2025-09-24T12:53:32Z) - Language-Grounded Hierarchical Planning and Execution with Multi-Robot 3D Scene Graphs [44.52978937479273]
マッピング,ローカライゼーション,タスク・アンド・モーション・プランニング(TAMP)を統合したマルチロボットシステムを提案する。
本システムでは,マルチロボット3Dシーングラフの融合に利用されるオープンセットのオブジェクトベースマップを組み込んだ共有3Dシーングラフを構築している。
本研究では,大規模な屋外環境における実環境タスクにおけるシステム性能の実験的評価を行う。
論文 参考訳(メタデータ) (2025-06-09T06:02:34Z) - ConceptGraphs: Open-Vocabulary 3D Scene Graphs for Perception and
Planning [125.90002884194838]
ConceptGraphsはオープンな3Dシーン用のグラフ構造化表現である。
2Dファウンデーションモデルを活用し、マルチビューアソシエーションによってアウトプットを3Dに融合することで構築される。
我々は,この表現の有用性を,下流の計画タスクを通じて実証する。
論文 参考訳(メタデータ) (2023-09-28T17:53:38Z) - Incremental 3D Semantic Scene Graph Prediction from RGB Sequences [86.77318031029404]
RGB画像列が与えられたシーンの一貫性のある3Dセマンティックシーングラフをインクリメンタルに構築するリアルタイムフレームワークを提案する。
提案手法は,新たなインクリメンタルエンティティ推定パイプラインとシーングラフ予測ネットワークから構成される。
提案するネットワークは,シーンエンティティから抽出した多視点および幾何学的特徴を用いて,反復的メッセージパッシングを用いた3次元セマンティックシーングラフを推定する。
論文 参考訳(メタデータ) (2023-05-04T11:32:16Z) - Sequential Manipulation Planning on Scene Graph [90.28117916077073]
我々は,効率的な逐次タスク計画のための3次元シーングラフ表現であるコンタクトグラフ+(cg+)を考案する。
ゴール設定は、自然にコンタクトグラフに指定され、最適化法を用いて遺伝的アルゴリズムによって作成することができる。
次に、初期接触グラフと目標設定との間のグラフ編集距離(GED)を計算してタスクプランを簡潔化し、ロボット動作に対応するグラフ編集操作を生成する。
論文 参考訳(メタデータ) (2022-07-10T02:01:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。