論文の概要: Self-distilled Feature Aggregation for Self-supervised Monocular Depth
Estimation
- arxiv url: http://arxiv.org/abs/2209.07088v1
- Date: Thu, 15 Sep 2022 07:00:52 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-16 12:59:26.276073
- Title: Self-distilled Feature Aggregation for Self-supervised Monocular Depth
Estimation
- Title(参考訳): 自己教師付き単眼深度推定のための自己蒸留特徴集約
- Authors: Zhengming Zhou and Qiulei Dong
- Abstract要約: 本稿では,低スケールと高スケールの2つの特徴を同時に集約する自己拡張型特徴集合(SDFA)モジュールを提案する。
自己教師付き単眼深度推定のためのSDFAに基づくネットワークを提案し,提案したネットワークをトレーニングするための自己蒸留トレーニング戦略を設計する。
KITTIデータセットにおける実験結果から,提案手法は,ほとんどの場合において,比較最先端手法よりも優れていることが示された。
- 参考スコア(独自算出の注目度): 11.929584800629673
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Self-supervised monocular depth estimation has received much attention
recently in computer vision. Most of the existing works in literature aggregate
multi-scale features for depth prediction via either straightforward
concatenation or element-wise addition, however, such feature aggregation
operations generally neglect the contextual consistency between multi-scale
features. Addressing this problem, we propose the Self-Distilled Feature
Aggregation (SDFA) module for simultaneously aggregating a pair of low-scale
and high-scale features and maintaining their contextual consistency. The SDFA
employs three branches to learn three feature offset maps respectively: one
offset map for refining the input low-scale feature and the other two for
refining the input high-scale feature under a designed self-distillation
manner. Then, we propose an SDFA-based network for self-supervised monocular
depth estimation, and design a self-distilled training strategy to train the
proposed network with the SDFA module. Experimental results on the KITTI
dataset demonstrate that the proposed method outperforms the comparative
state-of-the-art methods in most cases. The code is available at
https://github.com/ZM-Zhou/SDFA-Net_pytorch.
- Abstract(参考訳): 近年,コンピュータビジョンにおいて,自己教師付き単眼深度推定が注目されている。
文献における既存の研究の多くは、単純な結合または要素の付加による深度予測のための多スケール特徴を集約するが、そのような特徴集約操作は一般的に、多スケール特徴間のコンテキスト整合性を無視している。
この問題に対処するため,我々は,低スケールと高スケールの2つの機能を同時に集約し,コンテキスト整合性を維持する自己拡張機能集約(SDFA)モジュールを提案する。
SDFAは、入力された低階特徴を精錬する1つのオフセットマップと、設計された自己蒸留方式で入力された高階特徴を精錬する2つのオフセットマップをそれぞれ3つのブランチで学習する。
次に,自己教師付き単眼深度推定のためのSDFAベースのネットワークを提案し,SDFAモジュールを用いてネットワークをトレーニングするための自己蒸留トレーニング戦略を設計する。
KITTIデータセットにおける実験結果から,提案手法は,ほとんどの場合において,比較最先端手法よりも優れていることが示された。
コードはhttps://github.com/ZM-Zhou/SDFA-Net_pytorchで公開されている。
関連論文リスト
- DepthSplat: Connecting Gaussian Splatting and Depth [90.06180236292866]
ガウススプラッティングと深さ推定を結合するDepthSplatを提案する。
まず,事前学習した単眼深度特徴を生かして,頑健な多眼深度モデルを提案する。
また,ガウス的スプラッティングは教師なし事前学習の目的として機能することを示す。
論文 参考訳(メタデータ) (2024-10-17T17:59:58Z) - Self-supervised Monocular Depth Estimation with Large Kernel Attention [30.44895226042849]
より詳細な情報を得るために,自己教師付き単眼深度推定ネットワークを提案する。
具体的には,長距離依存性をモデル化可能なカーネルアテンションに基づくデコーダを提案する。
提案手法は,KITTIデータセット上での競合結果を実現する。
論文 参考訳(メタデータ) (2024-09-26T14:44:41Z) - Self-Supervised Monocular Depth Estimation by Direction-aware Cumulative
Convolution Network [80.19054069988559]
自己教師付き単眼深度推定は, 方向感度と環境依存性を示す。
本稿では2つの側面において深度表現を改善する方向対応累積畳み込みネットワーク(DaCCN)を提案する。
実験の結果,提案手法は広く使用されている3つのベンチマークにおいて大幅な改善が得られた。
論文 参考訳(メタデータ) (2023-08-10T14:32:18Z) - The Devil is in the Task: Exploiting Reciprocal Appearance-Localization
Features for Monocular 3D Object Detection [62.1185839286255]
低コストのモノクル3D物体検出は、自律運転において基本的な役割を果たす。
DFR-Netという動的特徴反射ネットワークを導入する。
我々は、KITTIテストセットの全ての単分子3D物体検出器の中で、第1位にランク付けする。
論文 参考訳(メタデータ) (2021-12-28T07:31:18Z) - DFC: Deep Feature Consistency for Robust Point Cloud Registration [0.4724825031148411]
複雑なアライメントシーンのための学習に基づくアライメントネットワークを提案する。
我々は,3DMatchデータセットとKITTIオドメトリデータセットに対するアプローチを検証する。
論文 参考訳(メタデータ) (2021-11-15T08:27:21Z) - Unsupervised Scale-consistent Depth Learning from Video [131.3074342883371]
本研究では,単眼深度推定器SC-Depthを提案する。
スケール一貫性予測の能力により,我々の単分子学習深層ネットワークは簡単にORB-SLAM2システムに統合可能であることを示す。
提案したハイブリッドPseudo-RGBD SLAMは、KITTIにおいて魅力的な結果を示し、追加のトレーニングなしでKAISTデータセットにうまく一般化する。
論文 参考訳(メタデータ) (2021-05-25T02:17:56Z) - Embedded Self-Distillation in Compact Multi-Branch Ensemble Network for
Remote Sensing Scene Classification [17.321718779142817]
本稿では,特徴表現能力を向上させるマルチブランチアンサンブルネットワークを提案する。
自己蒸留法(SD)を組み込んで,アンサンブルネットワークからメインブランチへ知識を伝達する。
その結果,提案するESD-MBENetは,従来のSOTA(State-of-the-art)モデルよりも精度が高いことがわかった。
論文 参考訳(メタデータ) (2021-04-01T03:08:52Z) - M3DSSD: Monocular 3D Single Stage Object Detector [82.25793227026443]
特徴アライメントと非対称非局所的注意を有するモノクロ3次元単段物体検出器(M3DSSD)を提案する。
提案したM3DSSDは,KITTIデータセット上のモノラルな3Dオブジェクト検出手法よりも大幅に性能が向上する。
論文 参考訳(メタデータ) (2021-03-24T13:09:11Z) - PC-RGNN: Point Cloud Completion and Graph Neural Network for 3D Object
Detection [57.49788100647103]
LiDARベースの3Dオブジェクト検出は、自動運転にとって重要なタスクです。
現在のアプローチでは、遠方および閉ざされた物体の偏りと部分的な点雲に苦しむ。
本稿では,この課題を2つの解決法で解決する新しい二段階アプローチ,pc-rgnnを提案する。
論文 参考訳(メタデータ) (2020-12-18T18:06:43Z) - Monocular 3D Object Detection with Sequential Feature Association and
Depth Hint Augmentation [12.55603878441083]
FADNetは、モノクル3Dオブジェクト検出の課題に対処するために提示される。
専用のディープヒントモジュールは、ディープヒントと呼ばれる行ワイズ機能を生成するように設計されている。
この研究の貢献は、KITTIベンチマークの実験およびアブレーション研究によって検証される。
論文 参考訳(メタデータ) (2020-11-30T07:19:14Z) - Towards Better Generalization: Joint Depth-Pose Learning without PoseNet [36.414471128890284]
自己教師型共同深層学習におけるスケール不整合の本質的問題に対処する。
既存の手法の多くは、全ての入力サンプルで一貫した深さとポーズを学習できると仮定している。
本稿では,ネットワーク推定からスケールを明示的に切り離す新しいシステムを提案する。
論文 参考訳(メタデータ) (2020-04-03T00:28:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。