論文の概要: Semi-Supervised Learning of Monocular Depth Estimation via Consistency
Regularization with K-way Disjoint Masking
- arxiv url: http://arxiv.org/abs/2212.10806v2
- Date: Thu, 22 Dec 2022 02:37:48 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-23 11:27:03.517181
- Title: Semi-Supervised Learning of Monocular Depth Estimation via Consistency
Regularization with K-way Disjoint Masking
- Title(参考訳): K-way Disjoint Maskingを用いた一貫性正規化による単眼深度推定の半教師付き学習
- Authors: Jongbeom Baek, Gyeongnyeon Kim, Seonghoon Park, Honggyu An, Matteo
Poggi, Seungryong Kim
- Abstract要約: 本稿では,分子深度推定ネットワークの半教師付き学習のための新しいフレームワークを提案する。
そこで我々は,K-way disjoint maskingと呼ばれる新しいデータ拡張手法を提案する。
KITTIとNYU-Depth-v2データセットの実験は、パイプラインの各コンポーネントの有効性を示しています。
- 参考スコア(独自算出の注目度): 38.09399326203952
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Semi-Supervised Learning (SSL) has recently accomplished successful
achievements in various fields such as image classification, object detection,
and semantic segmentation, which typically require a lot of labour to construct
ground-truth. Especially in the depth estimation task, annotating training data
is very costly and time-consuming, and thus recent SSL regime seems an
attractive solution. In this paper, for the first time, we introduce a novel
framework for semi-supervised learning of monocular depth estimation networks,
using consistency regularization to mitigate the reliance on large ground-truth
depth data. We propose a novel data augmentation approach, called K-way
disjoint masking, which allows the network for learning how to reconstruct
invisible regions so that the model not only becomes robust to perturbations
but also generates globally consistent output depth maps. Experiments on the
KITTI and NYU-Depth-v2 datasets demonstrate the effectiveness of each component
in our pipeline, robustness to the use of fewer and fewer annotated images, and
superior results compared to other state-of-the-art, semi-supervised methods
for monocular depth estimation. Our code is available at
https://github.com/KU-CVLAB/MaskingDepth.
- Abstract(参考訳): Semi-Supervised Learning (SSL)は、画像分類、オブジェクト検出、セマンティックセグメンテーションなど様々な分野で成功している。
特に、奥行き推定タスクでは、トレーニングデータのアノテートは非常に費用がかかり、時間を要するため、最近のsslレジームは魅力的なソリューションに思える。
本稿では,本論文で初めて,単眼深度推定ネットワークの半教師付き学習のための新しい枠組みを提案する。
そこで我々は,K-way disjoint masking と呼ばれる新しいデータ拡張手法を提案する。この手法により,モデルは摂動に頑健になるだけでなく,一貫した出力深度マップを生成することができる。
KITTIとNYU-Depth-v2データセットの実験は、パイプライン内の各コンポーネントの有効性、注釈付き画像の使用に対する堅牢性、そして、他の最先端の半教師付き単眼深度推定法よりも優れた結果を示している。
私たちのコードはhttps://github.com/KU-CVLAB/MaskingDepth.comで入手可能です。
関連論文リスト
- Consistency Regularisation for Unsupervised Domain Adaptation in Monocular Depth Estimation [15.285720572043678]
整合性に基づく半教師付き学習問題として,単眼深度推定のための教師なし領域適応を定式化する。
複数の拡張ビューにまたがって一貫性を保ちながら、ソースドメイン上の予測を規則化するペアワイズ損失関数を導入する。
実験では, KITTI と NYUv2 の標準深度推定ベンチマークを用いて,最先端の結果を示す。
論文 参考訳(メタデータ) (2024-05-27T23:32:06Z) - Small Object Detection via Coarse-to-fine Proposal Generation and
Imitation Learning [52.06176253457522]
本稿では,粗粒度パイプラインと特徴模倣学習に基づく小型物体検出に適した2段階フレームワークを提案する。
CFINetは、大規模な小さなオブジェクト検出ベンチマークであるSODA-DとSODA-Aで最先端の性能を達成する。
論文 参考訳(メタデータ) (2023-08-18T13:13:09Z) - SemHint-MD: Learning from Noisy Semantic Labels for Self-Supervised
Monocular Depth Estimation [19.229255297016635]
自己教師付き深度推定は、光度損失の勾配-局所性の問題により、局所的に最小限に抑えられる。
セマンティックセグメンテーションを活用して、ネットワークを局所的な最小限から切り離すための奥行きを高めるためのフレームワークを提案する。
論文 参考訳(メタデータ) (2023-03-31T17:20:27Z) - DUDES: Deep Uncertainty Distillation using Ensembles for Semantic
Segmentation [11.099838952805325]
予測の不確実性の定量化は、そのようなアプリケーションにディープニューラルネットワークを使用するための、有望な取り組みである。
本稿では,アンサンブルを用いた深部不確実性蒸留(DuDES)と呼ばれる,効率的かつ確実な不確実性評価手法を提案する。
DUDESはディープ・アンサンブル(Deep Ensemble)による学生-教師の蒸留を適用し、予測の不確かさを1つの前方パスで正確に推定する。
論文 参考訳(メタデータ) (2023-03-17T08:56:27Z) - DesNet: Decomposed Scale-Consistent Network for Unsupervised Depth
Completion [28.91716162403531]
教師なし深度補完は、接地トラスアノテーションを使わずにスパースから密集した深度を回復することを目的としている。
本研究では,絶対深度を相対深度予測とグローバルスケール推定に分解するDSCL戦略を提案する。
提案手法は,室内のNYUv2データセット上での最先端性能を実現する。
論文 参考訳(メタデータ) (2022-11-20T14:56:18Z) - Unsupervised Domain Adaptive Salient Object Detection Through
Uncertainty-Aware Pseudo-Label Learning [104.00026716576546]
そこで本研究では,手動のアノテーションを使わずに,自然に高いピクセルラベル品質を有する合成・クリーンなラベルから,サリエンスを学習することを提案する。
提案手法は,複数のベンチマークデータセット上で,既存の最先端の深層教師なしSOD法よりも優れていることを示す。
論文 参考訳(メタデータ) (2022-02-26T16:03:55Z) - Unsupervised Scale-consistent Depth Learning from Video [131.3074342883371]
本研究では,単眼深度推定器SC-Depthを提案する。
スケール一貫性予測の能力により,我々の単分子学習深層ネットワークは簡単にORB-SLAM2システムに統合可能であることを示す。
提案したハイブリッドPseudo-RGBD SLAMは、KITTIにおいて魅力的な結果を示し、追加のトレーニングなしでKAISTデータセットにうまく一般化する。
論文 参考訳(メタデータ) (2021-05-25T02:17:56Z) - Adaptive confidence thresholding for monocular depth estimation [83.06265443599521]
本稿では,自己教師付ステレオマッチング法から生成されたステレオ画像の擬似地上真実深度マップを利用する新しい手法を提案する。
擬似地底深度マップの信頼度マップを推定し、不正確な擬似地底深度マップによる性能劣化を緩和する。
実験結果から, 最先端の単分子深度推定法よりも優れた性能を示した。
論文 参考訳(メタデータ) (2020-09-27T13:26:16Z) - Deep Semi-supervised Knowledge Distillation for Overlapping Cervical
Cell Instance Segmentation [54.49894381464853]
本稿では, ラベル付きデータとラベルなしデータの両方を, 知識蒸留による精度向上に活用することを提案する。
摂動に敏感なサンプルマイニングを用いたマスク誘導型平均教師フレームワークを提案する。
実験の結果,ラベル付きデータのみから学習した教師付き手法と比較して,提案手法は性能を著しく向上することがわかった。
論文 参考訳(メタデータ) (2020-07-21T13:27:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。