論文の概要: Spatial Commonsense Graph for Object Localisation in Partial Scenes
- arxiv url: http://arxiv.org/abs/2203.05380v2
- Date: Mon, 14 Mar 2022 14:44:41 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-15 11:22:08.876441
- Title: Spatial Commonsense Graph for Object Localisation in Partial Scenes
- Title(参考訳): 部分的シーンにおけるオブジェクトローカライズのための空間コモンセンスグラフ
- Authors: Francesco Giuliari and Geri Skenderi and Marco Cristani and Yiming
Wang and Alessio Del Bue
- Abstract要約: 部分的なシーンにおける物体の局所化は,シーンの部分的な3次元スキャンによって物体の未知の位置を推定する新たな問題である。
提案手法は,新たなシーングラフモデルである空間コモンセンスグラフ(SCG)に基づいて,オブジェクトがノードであり,エッジが相互距離を定義する。
まず、ターゲットオブジェクトを表すノードと観測対象を表すノードの間の距離予測を行うグラフニューラルネットワークであるProximity Prediction NetworkにSCGを供給します。
- 参考スコア(独自算出の注目度): 36.47035776975184
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We solve object localisation in partial scenes, a new problem of estimating
the unknown position of an object (e.g. where is the bag?) given a partial 3D
scan of a scene. The proposed solution is based on a novel scene graph model,
the Spatial Commonsense Graph (SCG), where objects are the nodes and edges
define pairwise distances between them, enriched by concept nodes and
relationships from a commonsense knowledge base. This allows SCG to better
generalise its spatial inference over unknown 3D scenes. The SCG is used to
estimate the unknown position of the target object in two steps: first, we feed
the SCG into a novel Proximity Prediction Network, a graph neural network that
uses attention to perform distance prediction between the node representing the
target object and the nodes representing the observed objects in the SCG;
second, we propose a Localisation Module based on circular intersection to
estimate the object position using all the predicted pairwise distances in
order to be independent of any reference system. We create a new dataset of
partially reconstructed scenes to benchmark our method and baselines for object
localisation in partial scenes, where our proposed method achieves the best
localisation performance.
- Abstract(参考訳): 部分的なシーンにおける物体の局所化は、シーンの部分的な3Dスキャンにより、物体の未知の位置(例えば、バッグはどこにあるのか)を推定する新しい問題である。
提案手法は新たなシーングラフモデルであるSpatial Commonsense Graph (SCG) に基づいており、オブジェクトはノードであり、エッジは概念ノードとコモンセンス知識ベースからの関連性によって強化されたペアワイズ距離を定義する。
これにより、SCGは未知の3Dシーンに対して空間的推論をより一般化することができる。
The SCG is used to estimate the unknown position of the target object in two steps: first, we feed the SCG into a novel Proximity Prediction Network, a graph neural network that uses attention to perform distance prediction between the node representing the target object and the nodes representing the observed objects in the SCG; second, we propose a Localisation Module based on circular intersection to estimate the object position using all the predicted pairwise distances in order to be independent of any reference system.
提案手法は,部分的なシーンにおけるオブジェクトのローカライゼーションのための手法とベースラインをベンチマークするために,部分的に再構成されたシーンのデータセットを作成する。
関連論文リスト
- Open-Vocabulary Octree-Graph for 3D Scene Understanding [54.11828083068082]
Octree-Graphはオープンな3Dシーン理解のための新しいシーン表現である。
セマンティクスを記憶し、その形状に応じてオブジェクトの占有度を調節するアダプティブ・オクツリー構造を開発する。
論文 参考訳(メタデータ) (2024-11-25T10:14:10Z) - Multiview Scene Graph [7.460438046915524]
適切なシーン表現は、空間知性の追求の中心である。
未提示画像からマルチビューシーングラフ(MSG)を構築することを提案する。
MSGは、場所とオブジェクトノードを相互接続したシーンをトポロジ的に表現する。
論文 参考訳(メタデータ) (2024-10-15T02:04:05Z) - GOReloc: Graph-based Object-Level Relocalization for Visual SLAM [17.608119427712236]
本稿では,ロボットシステムのオブジェクトレベル再ローカライズのための新しい手法を紹介する。
軽量なオブジェクトレベルマップにおいて、現在のフレーム内の物体検出と3Dオブジェクトとの密接な関連付けにより、カメラセンサのポーズを決定する。
論文 参考訳(メタデータ) (2024-08-15T03:54:33Z) - 3DRP-Net: 3D Relative Position-aware Network for 3D Visual Grounding [58.924180772480504]
3Dビジュアルグラウンドは、自由形式の言語記述によって、ターゲットオブジェクトを3Dポイントクラウドにローカライズすることを目的としている。
3次元相対位置認識ネットワーク(3-Net)という,関係性を考慮した一段階フレームワークを提案する。
論文 参考訳(メタデータ) (2023-07-25T09:33:25Z) - Leveraging commonsense for object localisation in partial scenes [36.47035776975184]
空間コモンセンスグラフ(D-SCG)の幾何学的推論を容易にする新しいシーン表現を提案する。
新たな注目メッセージパッシング機構を実装したグラフニューラルネットワークを用いて,対象物体の未知の位置を推定する。
本研究では, 局所化精度を8倍に向上させるため, 部分ScanNetによる手法の評価を行い, 最先端技術の改善を5.9%向上させた。
論文 参考訳(メタデータ) (2022-11-01T16:17:07Z) - Neural Correspondence Field for Object Pose Estimation [67.96767010122633]
1枚のRGB画像から3次元モデルで剛体物体の6DoFポーズを推定する手法を提案する。
入力画像の画素で3次元オブジェクト座標を予測する古典的対応法とは異なり,提案手法はカメラフラストラムでサンプリングされた3次元クエリポイントで3次元オブジェクト座標を予測する。
論文 参考訳(メタデータ) (2022-07-30T01:48:23Z) - HDNet: Human Depth Estimation for Multi-Person Camera-Space Localization [83.57863764231655]
本稿では,根の絶対的局所化のためのエンドツーエンドフレームワークであるHuman Depth Estimation Network (HDNet)を提案する。
関節間の特徴伝達に骨格ベースのグラフニューラルネットワーク(GNN)を用いる。
我々は,2つのベンチマークデータセットを用いて,ルートジョイントローカライゼーションとルート相対的な3次元ポーズ推定タスクについて,HDNetの評価を行った。
論文 参考訳(メタデータ) (2020-07-17T12:44:23Z) - Joint Spatial-Temporal Optimization for Stereo 3D Object Tracking [34.40019455462043]
本研究では,空間時間最適化に基づくステレオ3次元物体追跡手法を提案する。
ネットワークから隣接画像上の対応する2Dバウンディングボックスを検出し,初期3Dバウンディングボックスを回帰する。
オブジェクトセントロイドに関連づけられた複雑なオブジェクトキューは、リージョンベースのネットワークを使用して予測される。
論文 参考訳(メタデータ) (2020-04-20T13:59:46Z) - GPS-Net: Graph Property Sensing Network for Scene Graph Generation [91.60326359082408]
シーングラフ生成(SGG)は、画像内のオブジェクトとそれらのペア関係を検出することを目的としている。
GPS-Netは、エッジ方向情報、ノード間の優先度の差、長期にわたる関係の分布という、SGGの3つの特性を網羅している。
GPS-Netは、VG、OI、VRDの3つの一般的なデータベース上での最先端のパフォーマンスを、さまざまな設定とメトリクスで大幅に向上させる。
論文 参考訳(メタデータ) (2020-03-29T07:22:31Z) - Object as Hotspots: An Anchor-Free 3D Object Detection Approach via
Firing of Hotspots [37.16690737208046]
オブジェクトレベルのアンカーを用いた既存のメソッドとは逆のアプローチを論じる。
構成モデルに着想を得て、内部の空でないボクセルの組成として、ホットスポットと呼ばれる物体を提案する。
提案手法は,OHSに基づく新しい地中真理割当て戦略を用いたアンカーフリー検出ヘッドを提案する。
論文 参考訳(メタデータ) (2019-12-30T03:02:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。