論文の概要: Learning 3D Semantic Scene Graphs from 3D Indoor Reconstructions
- arxiv url: http://arxiv.org/abs/2004.03967v1
- Date: Wed, 8 Apr 2020 12:25:25 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-15 09:12:59.612249
- Title: Learning 3D Semantic Scene Graphs from 3D Indoor Reconstructions
- Title(参考訳): 3次元室内再構成から3次元セマンティックシーングラフを学習する
- Authors: Johanna Wald, Helisa Dhamo, Nassir Navab, Federico Tombari
- Abstract要約: 我々は、グラフ内のシーンのエンティティを整理するデータ構造であるシーングラフに焦点を当てる。
本研究では,シーンの点雲からシーングラフを回帰する学習手法を提案する。
本稿では,3D-3Dおよび2D-3Dマッチングの中間表現としてグラフが機能するドメインに依存しない検索タスクにおける本手法の適用について述べる。
- 参考スコア(独自算出の注目度): 94.17683799712397
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Scene understanding has been of high interest in computer vision. It
encompasses not only identifying objects in a scene, but also their
relationships within the given context. With this goal, a recent line of works
tackles 3D semantic segmentation and scene layout prediction. In our work we
focus on scene graphs, a data structure that organizes the entities of a scene
in a graph, where objects are nodes and their relationships modeled as edges.
We leverage inference on scene graphs as a way to carry out 3D scene
understanding, mapping objects and their relationships. In particular, we
propose a learned method that regresses a scene graph from the point cloud of a
scene. Our novel architecture is based on PointNet and Graph Convolutional
Networks (GCN). In addition, we introduce 3DSSG, a semi-automatically generated
dataset, that contains semantically rich scene graphs of 3D scenes. We show the
application of our method in a domain-agnostic retrieval task, where graphs
serve as an intermediate representation for 3D-3D and 2D-3D matching.
- Abstract(参考訳): シーン理解はコンピュータビジョンに大きな関心を寄せている。
シーン内のオブジェクトを識別するだけでなく、与えられたコンテキスト内での関係も含む。
この目標により、最近の一連の作業は3Dセマンティックセグメンテーションとシーンレイアウト予測に取り組む。
私たちは、グラフ内のシーンのエンティティを整理するデータ構造であるシーングラフに注目し、オブジェクトはノードであり、それらの関係はエッジとしてモデル化される。
シーングラフの推論を,3次元シーン理解,オブジェクトのマッピング,それらの関連性の実行手段として活用する。
特に,シーンの点雲からシーングラフを回帰させる学習手法を提案する。
我々の新しいアーキテクチャはPointNetとGraph Convolutional Networks (GCN)に基づいている。
さらに,3次元シーンのセマンティックなリッチなシーングラフを含む半自動生成データセットである3DSSGを導入する。
本稿では,3D-3Dおよび2D-3Dマッチングの中間表現としてグラフが機能するドメインに依存しない検索タスクにおける本手法の適用について述べる。
関連論文リスト
- Open-Vocabulary Octree-Graph for 3D Scene Understanding [54.11828083068082]
Octree-Graphはオープンな3Dシーン理解のための新しいシーン表現である。
セマンティクスを記憶し、その形状に応じてオブジェクトの占有度を調節するアダプティブ・オクツリー構造を開発する。
論文 参考訳(メタデータ) (2024-11-25T10:14:10Z) - Open3DSG: Open-Vocabulary 3D Scene Graphs from Point Clouds with Queryable Objects and Open-Set Relationships [15.513180297629546]
ラベル付きシーングラフデータを必要としないオープンな世界で3次元シーングラフを学習するための代替手法であるOpen3DSGを提案する。
我々は,3次元シーングラフ予測バックボーンの機能を,強力なオープンワールド2Dビジョン言語基盤モデルの特徴空間と組み合わせた。
論文 参考訳(メタデータ) (2024-02-19T16:15:03Z) - Lang3DSG: Language-based contrastive pre-training for 3D Scene Graph
prediction [16.643252717745348]
本稿では,3次元シーングラフのための言語ベースの事前学習手法を提案する。
一般的な視覚言語モデルであるCLIPの言語エンコーダを利用して、その知識をグラフベースのネットワークに抽出する。
提案手法は,メインセマンティックな3Dシーングラフベンチマークにおいて,最先端の結果を達成している。
論文 参考訳(メタデータ) (2023-10-25T09:26:16Z) - ConceptGraphs: Open-Vocabulary 3D Scene Graphs for Perception and
Planning [125.90002884194838]
ConceptGraphsはオープンな3Dシーン用のグラフ構造化表現である。
2Dファウンデーションモデルを活用し、マルチビューアソシエーションによってアウトプットを3Dに融合することで構築される。
我々は,この表現の有用性を,下流の計画タスクを通じて実証する。
論文 参考訳(メタデータ) (2023-09-28T17:53:38Z) - SGAligner : 3D Scene Alignment with Scene Graphs [84.01002998166145]
3Dシーングラフの構築は、いくつかの具体的AIアプリケーションのためのシーン表現のトピックとして登場した。
オーバーラップ可能な3次元シーングラフのペアをゼロから部分的に整列させるという基本的な問題に着目する。
そこで我々はSGAlignerを提案する。SGAlignerは3次元シーングラフのペアを組合わせるための最初の方法であり、その組込みシナリオに対して堅牢である。
論文 参考訳(メタデータ) (2023-04-28T14:39:22Z) - Graph-to-3D: End-to-End Generation and Manipulation of 3D Scenes Using
Scene Graphs [85.54212143154986]
制御可能なシーン合成は、基本的な仕様を満たす3D情報を生成することで構成される。
シーングラフは、オブジェクト(ノード)とオブジェクト間の関係(エッジ)からなるシーンの表現である
本稿では,シーングラフから形状を直接エンドツーエンドに生成する手法を提案する。
論文 参考訳(メタデータ) (2021-08-19T17:59:07Z) - SceneGraphFusion: Incremental 3D Scene Graph Prediction from RGB-D
Sequences [76.28527350263012]
rgb-dフレームのシーケンスを与えられた3次元環境から意味的シーングラフを漸進的に構築する手法を提案する。
我々は、グラフニューラルネットワークを用いて、プリミティブシーンコンポーネントからpointnet機能を集約する。
提案手法は,35hzで動作する他の3dセマンティクスおよびパンオプティカルセグメンテーション法と同等の精度で,高いマージンで3dシーングラフ予測手法を上回る。
論文 参考訳(メタデータ) (2021-03-27T13:00:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。