論文の概要: Instance-wise Occlusion and Depth Orders in Natural Scenes
- arxiv url: http://arxiv.org/abs/2111.14562v2
- Date: Tue, 30 Nov 2021 07:55:21 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-01 11:49:08.989331
- Title: Instance-wise Occlusion and Depth Orders in Natural Scenes
- Title(参考訳): 自然場面におけるケースワイズ排除と深度順序
- Authors: Hyunmin Lee and Jaesik Park
- Abstract要約: このデータセットは、101Kの自然シーンにおけるクラスラベルのインスタンスのための幾何学的順序付けの2.9Mアノテーションで構成されている。
我々はInstaOrderNetと呼ばれる幾何学的順序予測ネットワークを導入し、最先端のアプローチよりも優れている。
InstaDepthNetは、MiDaSのインスタンス単位の深さ予測精度を高めるために、補助的な幾何学的順序損失を使用する。
- 参考スコア(独自算出の注目度): 18.336750862244454
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: In this paper, we introduce a new dataset, named InstaOrder, that can be used
to understand the spatial relationships of instances in a 3D space. The dataset
consists of 2.9M annotations of geometric orderings for class-labeled instances
in 101K natural scenes. The scenes were annotated by 3,659 crowd-workers
regarding (1) occlusion order that identifies occluder/occludee and (2) depth
order that describes ordinal relations that consider relative distance from the
camera. The dataset provides joint annotation of two kinds of orderings for the
same instances, and we discover that the occlusion order and depth order are
complementary. We also introduce a geometric order prediction network called
InstaOrderNet, which is superior to state-of-the-art approaches. Moreover, we
propose InstaDepthNet that uses auxiliary geometric order loss to boost the
instance-wise depth prediction accuracy of MiDaS. These contributions to
geometric scene understanding will help to improve the accuracy of various
computer vision tasks.
- Abstract(参考訳): 本稿では、3次元空間におけるインスタンスの空間的関係を理解するために使用できるinstaorderという新しいデータセットを提案する。
データセットは、101kの自然シーンにおけるクラスラベルインスタンスの幾何順序付けの2.9mアノテーションで構成されている。
シーンは,(1)咬合・咬合を識別する閉塞順序と,(2)カメラから相対距離を考慮した順序関係を記述する深さ順序について,3,659人の群集労働者によって注釈された。
データセットは同じインスタンスに対して2種類の順序の合同アノテーションを提供し、閉塞順序と深さ順序が相補的であることを発見した。
また,最先端手法よりも優れているinstaordernetと呼ばれる幾何学的順序予測ネットワークも導入する。
さらに,MiDaSのインスタンス単位の深度予測精度を高めるために,幾何的順序損失を用いたInstaDepthNetを提案する。
これらの幾何学的シーン理解への貢献は、様々なコンピュータビジョンタスクの精度を向上させるのに役立つ。
関連論文リスト
- Open-Vocabulary Octree-Graph for 3D Scene Understanding [54.11828083068082]
Octree-Graphはオープンな3Dシーン理解のための新しいシーン表現である。
セマンティクスを記憶し、その形状に応じてオブジェクトの占有度を調節するアダプティブ・オクツリー構造を開発する。
論文 参考訳(メタデータ) (2024-11-25T10:14:10Z) - AutoInst: Automatic Instance-Based Segmentation of LiDAR 3D Scans [41.17467024268349]
3D環境を理解するには、きめ細かい風景を理解する必要がある。
教師なしの方法で3次元シーンのインスタンスセグメンテーションを予測することを提案する。
平均精度は13.3%,F1スコアは9.1%向上した。
論文 参考訳(メタデータ) (2024-03-24T22:53:16Z) - Coupled Laplacian Eigenmaps for Locally-Aware 3D Rigid Point Cloud Matching [0.0]
局所構造を考慮したグラフラプラシアン固有写像に基づく新しい手法を提案する。
ラプラシアン固有写像の順序と符号のあいまいさに対処するために、結合ラプラシアンと呼ばれる新しい作用素を導入する。
これらの高次元空間間の類似性は、形状に一致するような局所的な意味のあるスコアを与えることを示す。
論文 参考訳(メタデータ) (2024-02-27T10:10:12Z) - Neural Semantic Surface Maps [52.61017226479506]
本稿では,2つの属とゼロの形状の地図を自動計算する手法を提案する。
提案手法は,手動のアノテーションや3Dトレーニングデータ要求を排除し,意味的表面-表面マップを生成する。
論文 参考訳(メタデータ) (2023-09-09T16:21:56Z) - Deep Semantic Graph Matching for Large-scale Outdoor Point Clouds
Registration [22.308070598885532]
我々は、ポイントクラウド登録問題をセマンティックインスタンスマッチングと登録タスクとして扱う。
大規模屋外クラウド登録のためのディープセマンティックグラフマッチング法(DeepSGM)を提案する。
KITTIオドメトリデータセットで行った実験結果から,提案手法が登録性能を向上させることが示された。
論文 参考訳(メタデータ) (2023-08-10T03:07:28Z) - Contour Context: Abstract Structural Distribution for 3D LiDAR Loop
Detection and Metric Pose Estimation [31.968749056155467]
本稿では,高精度な3DoF距離ポーズ推定を用いた簡易かつ効果的かつ効率的なトポロジカルループ閉包検出パイプラインを提案する。
我々は,3次元LiDAR点から投影されるBEV像を構造層分布として解釈する。
検索キーは、層状KD木でインデックスされたデータベースの検索を高速化するように設計されている。
論文 参考訳(メタデータ) (2023-02-13T07:18:24Z) - Geometry-Aware Network for Domain Adaptive Semantic Segmentation [64.00345743710653]
本稿では,ドメイン間のギャップを小さくするために,ドメイン適応のための幾何学的ネットワーク(GANDA)を提案する。
我々は、RGB-D画像から生成された点雲上の3Dトポロジを利用して、対象領域における座標色歪みと擬似ラベルの微細化を行う。
我々のモデルは,GTA5->CityscapesとSynTHIA->Cityscapesの最先端技術より優れている。
論文 参考訳(メタデータ) (2022-12-02T00:48:44Z) - MORE: Multi-Order RElation Mining for Dense Captioning in 3D Scenes [89.75025195440287]
既存の手法では、対象の特徴学習の副産物のような関係を、特にそれを符号化することなく扱うことができる。
より記述的で包括的なキャプションを生成するためのマルチオーダーリレーションマイニングモデルMOREを提案する。
我々のMOREは、複雑な関係を限られた数の基本関係から導出できるため、進行的にオブジェクト関係を符号化する。
論文 参考訳(メタデータ) (2022-03-10T07:26:15Z) - Self-supervised Geometric Perception [96.89966337518854]
自己教師付き幾何知覚(self-supervised geometric perception)は、基底幾何モデルラベルなしで対応マッチングのための特徴記述子を学ぶためのフレームワークである。
また,SGPは,地上トラスラベルを用いて訓練した教師付きオークルよりも同等か優れる最先端性能を達成できることを示す。
論文 参考訳(メタデータ) (2021-03-04T15:34:43Z) - Primal-Dual Mesh Convolutional Neural Networks [62.165239866312334]
本稿では,グラフ・ニューラル・ネットワークの文献からトライアングル・メッシュへ引き起こされた原始双対のフレームワークを提案する。
提案手法は,3次元メッシュのエッジと顔の両方を入力として特徴付け,動的に集約する。
メッシュ単純化の文献から得られたツールを用いて、我々のアプローチに関する理論的知見を提供する。
論文 参考訳(メタデータ) (2020-10-23T14:49:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。