論文の概要: MonoIndoor: Towards Good Practice of Self-Supervised Monocular Depth
Estimation for Indoor Environments
- arxiv url: http://arxiv.org/abs/2107.12429v2
- Date: Wed, 28 Jul 2021 00:32:57 GMT
- ステータス: 処理完了
- システム内更新日: 2021-07-29 09:13:25.963915
- Title: MonoIndoor: Towards Good Practice of Self-Supervised Monocular Depth
Estimation for Indoor Environments
- Title(参考訳): MonoIndoor: 屋内環境における自己監督型単眼深度推定の実践に向けて
- Authors: Pan Ji, Runze Li, Bir Bhanu, Yi Xu
- Abstract要約: 屋内環境の自己監督深度推定は屋外環境よりも困難である。
屋内シーケンスの深さ範囲は異なるフレーム間で大きく異なり、奥行きネットワークが一貫した深さキューを誘導することは困難である。
屋外シーンの最大距離は、カメラが通常空を見るのと同じである。
屋外シーケンスの動作は、特にKITTIのようなデータセットを駆動するために、前もって翻訳される。
- 参考スコア(独自算出の注目度): 55.05401912853467
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Self-supervised depth estimation for indoor environments is more challenging
than its outdoor counterpart in at least the following two aspects: (i) the
depth range of indoor sequences varies a lot across different frames, making it
difficult for the depth network to induce consistent depth cues, whereas the
maximum distance in outdoor scenes mostly stays the same as the camera usually
sees the sky; (ii) the indoor sequences contain much more rotational motions,
which cause difficulties for the pose network, while the motions of outdoor
sequences are pre-dominantly translational, especially for driving datasets
such as KITTI. In this paper, special considerations are given to those
challenges and a set of good practices are consolidated for improving the
performance of self-supervised monocular depth estimation in indoor
environments. The proposed method mainly consists of two novel modules, \ie, a
depth factorization module and a residual pose estimation module, each of which
is designed to respectively tackle the aforementioned challenges. The
effectiveness of each module is shown through a carefully conducted ablation
study and the demonstration of the state-of-the-art performance on three indoor
datasets, \ie, EuRoC, NYUv2, and 7-scenes.
- Abstract(参考訳): Self-supervised depth estimation for indoor environments is more challenging than its outdoor counterpart in at least the following two aspects: (i) the depth range of indoor sequences varies a lot across different frames, making it difficult for the depth network to induce consistent depth cues, whereas the maximum distance in outdoor scenes mostly stays the same as the camera usually sees the sky; (ii) the indoor sequences contain much more rotational motions, which cause difficulties for the pose network, while the motions of outdoor sequences are pre-dominantly translational, especially for driving datasets such as KITTI.
本稿では,これらの課題に対して特別に考察し,室内環境における自己教師付き単眼深度推定の性能を向上させるための一連の実践をまとめる。
提案手法は主に, 2つの新しいモジュール, \ie, 深さ分解モジュール, 残留ポーズ推定モジュールで構成され, それぞれが上記の課題に対処するように設計されている。
各モジュールの有効性は, 3つの屋内データセット, \ie, euroc, nyuv2, 7-sceneにおいて, 注意深く実施したアブレーション実験および最新性能の実証により示される。
関連論文リスト
- GAM-Depth: Self-Supervised Indoor Depth Estimation Leveraging a
Gradient-Aware Mask and Semantic Constraints [12.426365333096264]
本稿では,勾配認識マスクと意味制約という,2つの新しいコンポーネントをベースとしたGAM-Depthを提案する。
グラデーション対応マスクは、キー領域とテクスチャレス領域の両方の適応的かつ堅牢な監視を可能にする。
室内における自己監督深度推定のセマンティック制約の導入は、物体の境界における深度差を改善する。
論文 参考訳(メタデータ) (2024-02-22T07:53:34Z) - Deeper into Self-Supervised Monocular Indoor Depth Estimation [7.30562653023176]
単分子配列から室内深度を自己教師付きで学習することは、研究者にとって非常に難しい。
本研究では,IndoorDepthという手法を2つのイノベーションから構成する。
NYUv2ベンチマークの実験では、私たちのIndoorDepthは従来の最先端の手法よりも大きなマージンで優れています。
論文 参考訳(メタデータ) (2023-12-03T04:55:32Z) - GasMono: Geometry-Aided Self-Supervised Monocular Depth Estimation for
Indoor Scenes [47.76269541664071]
本稿では,フレームと低テクスチャの大きな回転に起因する屋内シーンにおける自己教師型単眼深度推定の課題に対処する。
モノクラーシーケンスから粗いカメラポーズを多視点形状で取得し,前者に対応する。
低テクスチャの効果を和らげるために、視覚変換器のグローバルな推論と過度に適合する反復的な自己蒸留機構を組み合わせる。
論文 参考訳(メタデータ) (2023-09-26T17:59:57Z) - GEDepth: Ground Embedding for Monocular Depth Estimation [4.95394574147086]
本稿では,画像からカメラパラメータを分離する新たな接地モジュールを提案する。
地下深度と残留深度を最適に組み合わせるために、地上の注意をモジュール内に設計する。
実験の結果,本手法は一般的なベンチマークで最先端の結果が得られることがわかった。
論文 参考訳(メタデータ) (2023-09-18T17:56:06Z) - The Second Monocular Depth Estimation Challenge [93.1678025923996]
MDEC (Monocular Depth Estimation Challenge) の第2版は、いかなる種類の監視方法にも開放された。
この課題はSynS-Patchesデータセットをベースとしており、高品質な高密度地下構造を持つ多様な環境を特徴としている。
上位の監督官は相対的なFスコアを27.62%改善し、上位の監督官は16.61%改善した。
論文 参考訳(メタデータ) (2023-04-14T11:10:07Z) - Multi-Camera Collaborative Depth Prediction via Consistent Structure
Estimation [75.99435808648784]
本稿では,新しいマルチカメラ協調深度予測法を提案する。
カメラ間の構造的整合性を維持しながら、大きな重なり合う領域を必要としない。
DDADおよびNuScenesデータセットの実験結果から,本手法の優れた性能を示す。
論文 参考訳(メタデータ) (2022-10-05T03:44:34Z) - MonoIndoor++:Towards Better Practice of Self-Supervised Monocular Depth
Estimation for Indoor Environments [45.89629401768049]
自己監督型単分子深度推定は近年,特に屋外環境において顕著な進歩を遂げている。
しかし、既存のデータの大半を携帯端末で捉えている屋内シーンでは、深度予測結果は満足できない。
室内環境における自己教師型単眼深度推定の性能向上を目的とした,新しいフレームワーク-IndoorMono++を提案する。
論文 参考訳(メタデータ) (2022-07-18T21:34:43Z) - SelfDeco: Self-Supervised Monocular Depth Completion in Challenging
Indoor Environments [50.761917113239996]
自己教師付き単分子深度補完のための新しいアルゴリズムを提案する。
提案手法は,深度ラベルを含まない疎深度測定とそれに対応する単眼ビデオシーケンスのみを必要とするニューラルネットワークのトレーニングに基づく。
我々の自己監督アルゴリズムは、テクスチャのない領域、光沢のない透明な表面、非ランバートの表面、動く人々、より長く多様な深度範囲、複雑なエゴモーションによって捉えられたシーンを含む屋内環境に挑戦するために設計されている。
論文 参考訳(メタデータ) (2020-11-10T08:55:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。