論文の概要: Learning Monocular Depth Estimation via Selective Distillation of Stereo
Knowledge
- arxiv url: http://arxiv.org/abs/2205.08668v1
- Date: Wed, 18 May 2022 00:34:28 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-19 13:02:26.989027
- Title: Learning Monocular Depth Estimation via Selective Distillation of Stereo
Knowledge
- Title(参考訳): ステレオ知識の選択的蒸留による単眼深度推定の学習
- Authors: Kyeongseob Song and Kuk-Jin Yoon
- Abstract要約: 本研究では,各画素のプロキシ不均一度マップと推定深度マップとを最適に選択するように訓練された2つのバイナリマスクを学習するデコーダ (MaskDecoder) を設計する。
学習したマスクは、推定深度を強制するために別のデコーダ(DepthDecoder)に送られる。
自己およびプロキシによる単分子深度推定における最先端性能の検証実験を行った。
- 参考スコア(独自算出の注目度): 34.380048111601894
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Monocular depth estimation has been extensively explored based on deep
learning, yet its accuracy and generalization ability still lag far behind the
stereo-based methods. To tackle this, a few recent studies have proposed to
supervise the monocular depth estimation network by distilling disparity maps
as proxy ground-truths. However, these studies naively distill the stereo
knowledge without considering the comparative advantages of stereo-based and
monocular depth estimation methods. In this paper, we propose to selectively
distill the disparity maps for more reliable proxy supervision. Specifically,
we first design a decoder (MaskDecoder) that learns two binary masks which are
trained to choose optimally between the proxy disparity maps and the estimated
depth maps for each pixel. The learned masks are then fed to another decoder
(DepthDecoder) to enforce the estimated depths to learn from only the masked
area in the proxy disparity maps. Additionally, a Teacher-Student module is
designed to transfer the geometric knowledge of the StereoNet to the MonoNet.
Extensive experiments validate our methods achieve state-of-the-art performance
for self- and proxy-supervised monocular depth estimation on the KITTI dataset,
even surpassing some of the semi-supervised methods.
- Abstract(参考訳): 単眼深度推定は深層学習に基づいて広範囲に研究されてきたが、その精度と一般化能力はステレオ法よりもはるかに遅れている。
この問題に対処するため,近年の研究では,不均一マップを代用土木として蒸留することにより,単分子深度推定網を監督する研究が提案されている。
しかし, 本研究では, ステレオベースと単眼深度推定法の利点を考慮せずに, ステレオ知識を精査した。
本稿では,より信頼性の高いプロキシ管理を行うために,分散マップを選択的に蒸留することを提案する。
具体的には、まずデコーダ(MaskDecoder)を設計し、各画素のプロキシ不均一度マップと推定深度マップとを最適に選択するように訓練された2つのバイナリマスクを学習する。
その後、学習されたマスクは別のデコーダ(deepdecoder)に送られ、推定深さを強制してプロキシ格差マップのマスク領域のみから学習する。
さらに、Teacher-Studentモジュールは、SteleoNetの幾何学的知識をMonoNetに転送するように設計されている。
KITTIデータセット上での自己およびプロキシによる単分子深度推定に対して, 半教師付き手法のいくつかを超越した, 最先端の手法の有効性を検証した。
関連論文リスト
- Stereo-Matching Knowledge Distilled Monocular Depth Estimation Filtered
by Multiple Disparity Consistency [31.261772846687297]
複数の不均一マップを用いて擬似深度マップの誤りを特定しフィルタする手法を提案する。
実験の結果,提案手法は従来の手法よりも優れていた。
論文 参考訳(メタデータ) (2024-01-22T15:05:05Z) - SwinDepth: Unsupervised Depth Estimation using Monocular Sequences via
Swin Transformer and Densely Cascaded Network [29.798579906253696]
教師付きトレーニングのための深層地下深度ラベルの取得は困難であり,単分子配列を用いた教師なし深度推定が有望な代替手段として出現する。
本稿では,画像特徴抽出器としてコンボリューションフリーのSwin Transformerを用い,局所的幾何学的特徴と大域的意味的特徴の両方を網羅して深度推定を行う。
また,Densely Cascaded Multi-scale Network (DCMNet)を提案する。
論文 参考訳(メタデータ) (2023-01-17T06:01:46Z) - SelfTune: Metrically Scaled Monocular Depth Estimation through
Self-Supervised Learning [53.78813049373321]
本稿では,事前学習した教師付き単分子深度ネットワークに対する自己教師付き学習手法を提案する。
本手法は移動ロボットナビゲーションなどの様々な応用に有用であり,多様な環境に適用可能である。
論文 参考訳(メタデータ) (2022-03-10T12:28:42Z) - 360 Depth Estimation in the Wild -- The Depth360 Dataset and the SegFuse
Network [35.03201732370496]
全方位画像からの一視点深度推定は、自律運転やシーン再構築といった幅広い応用で人気を博している。
本研究ではまず,トレーニングデータ問題に対処するため,Depth360と呼ばれるさまざまな設定の大規模データセットを構築した。
次に、人間の眼を模倣してデータセットから効果的に学習する、エンドツーエンドのマルチタスク学習ネットワークであるSegFuseを提案する。
論文 参考訳(メタデータ) (2022-02-16T11:56:31Z) - X-Distill: Improving Self-Supervised Monocular Depth via Cross-Task
Distillation [69.9604394044652]
そこで本研究では,クロスタスク知識蒸留による単眼深度の自己指導的訓練を改善する手法を提案する。
トレーニングでは,事前訓練されたセマンティックセグメンテーション教師ネットワークを使用し,そのセマンティック知識を深度ネットワークに転送する。
提案手法の有効性をKITTIベンチマークで評価し,最新技術と比較した。
論文 参考訳(メタデータ) (2021-10-24T19:47:14Z) - Pseudo Supervised Monocular Depth Estimation with Teacher-Student
Network [90.20878165546361]
疑似監視機構に基づく新しい教師なし深度推定手法を提案する。
これは、教師なしおよび教師なしの単分子深度推定の利点を戦略的に統合する。
実験の結果,提案手法はKITTIベンチマークの最先端性よりも優れていた。
論文 参考訳(メタデータ) (2021-10-22T01:08:36Z) - H-Net: Unsupervised Attention-based Stereo Depth Estimation Leveraging
Epipolar Geometry [4.968452390132676]
本稿では,教師なしステレオ深度推定のためのディープラーニングフレームワークであるH-Netを紹介する。
初めて、Siameseオートエンコーダアーキテクチャが深さ推定に使用されます。
本手法は,最先端の非監視ステレオ深度推定法を上回っている。
論文 参考訳(メタデータ) (2021-04-22T19:16:35Z) - Adaptive confidence thresholding for monocular depth estimation [83.06265443599521]
本稿では,自己教師付ステレオマッチング法から生成されたステレオ画像の擬似地上真実深度マップを利用する新しい手法を提案する。
擬似地底深度マップの信頼度マップを推定し、不正確な擬似地底深度マップによる性能劣化を緩和する。
実験結果から, 最先端の単分子深度推定法よりも優れた性能を示した。
論文 参考訳(メタデータ) (2020-09-27T13:26:16Z) - Reversing the cycle: self-supervised deep stereo through enhanced
monocular distillation [51.714092199995044]
多くの分野において、自己教師付き学習ソリューションは急速に進化し、教師付きアプローチでギャップを埋めている。
本稿では,両者の相互関係を逆転する自己教師型パラダイムを提案する。
深層ステレオネットワークを訓練するために,単分子完備ネットワークを通じて知識を抽出する。
論文 参考訳(メタデータ) (2020-08-17T07:40:22Z) - Single Image Depth Estimation Trained via Depth from Defocus Cues [105.67073923825842]
単一のRGB画像から深度を推定することはコンピュータビジョンの基本的な課題である。
この作業では、異なる視点ではなく、フォーカスキューからの奥行きに依存しています。
我々は,KITTIとMake3Dデータセットの教師あり手法と同等な結果を提示し,教師なし学習手法より優れていることを示す。
論文 参考訳(メタデータ) (2020-01-14T20:22:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。