論文の概要: Excavating the Potential Capacity of Self-Supervised Monocular Depth
Estimation
- arxiv url: http://arxiv.org/abs/2109.12484v1
- Date: Sun, 26 Sep 2021 03:40:56 GMT
- ステータス: 処理完了
- システム内更新日: 2021-09-30 06:59:57.335565
- Title: Excavating the Potential Capacity of Self-Supervised Monocular Depth
Estimation
- Title(参考訳): 自己教師付き単眼深度推定の潜在能力の抽出
- Authors: Rui Peng, Ronggang Wang, Yawen Lai, Luyang Tang, Yangang Cai
- Abstract要約: 自己教師付き単眼深度推定の潜在能力は,このコストを増大させることなく発掘できることが示唆された。
私たちのコントリビューションは、計算オーバーヘッドを減らしながら、ベースラインに大幅なパフォーマンス改善をもたらすことができます。
我々のモデルはEPCDepthと呼ばれ、従来の最先端の手法を超越している。
- 参考スコア(独自算出の注目度): 10.620856690388376
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Self-supervised methods play an increasingly important role in monocular
depth estimation due to their great potential and low annotation cost. To close
the gap with supervised methods, recent works take advantage of extra
constraints, e.g., semantic segmentation. However, these methods will
inevitably increase the burden on the model. In this paper, we show theoretical
and empirical evidence that the potential capacity of self-supervised monocular
depth estimation can be excavated without increasing this cost. In particular,
we propose (1) a novel data augmentation approach called data grafting, which
forces the model to explore more cues to infer depth besides the vertical image
position, (2) an exploratory self-distillation loss, which is supervised by the
self-distillation label generated by our new post-processing method - selective
post-processing, and (3) the full-scale network, designed to endow the encoder
with the specialization of depth estimation task and enhance the
representational power of the model. Extensive experiments show that our
contributions can bring significant performance improvement to the baseline
with even less computational overhead, and our model, named EPCDepth, surpasses
the previous state-of-the-art methods even those supervised by additional
constraints.
- Abstract(参考訳): 自己監督的手法は、大きなポテンシャルと低いアノテーションコストのため、単眼深度推定においてますます重要な役割を果たす。
教師付きメソッドとのギャップを埋めるために、最近の研究はセマンティックセグメンテーションのような余分な制約を利用する。
しかし、これらの手法は必然的にモデルの負担を増大させます。
本稿では, 自己監督型単分子深度推定の潜在能力が, コストを増大させることなく発掘可能であることを示す。
In particular, we propose (1) a novel data augmentation approach called data grafting, which forces the model to explore more cues to infer depth besides the vertical image position, (2) an exploratory self-distillation loss, which is supervised by the self-distillation label generated by our new post-processing method - selective post-processing, and (3) the full-scale network, designed to endow the encoder with the specialization of depth estimation task and enhance the representational power of the model.
広範な実験によって、我々の貢献は計算オーバーヘッドを少なくしてベースラインに大幅なパフォーマンス改善をもたらすことが示され、epcdepthと名付けられたこのモデルは、追加の制約によって監視されたものでさえ、以前の最先端のメソッドを上回っています。
関連論文リスト
- GroCo: Ground Constraint for Metric Self-Supervised Monocular Depth [2.805351469151152]
本稿では,自己監督パラダイムに特化して設計された地盤領域に関する新しい制約を提案する。
このメカニズムはスケールを正確に回復するだけでなく、深度予測と地上とのコヒーレンスを確保する。
論文 参考訳(メタデータ) (2024-09-23T09:30:27Z) - Fine-Tuning Image-Conditional Diffusion Models is Easier than You Think [53.2706196341054]
認識された非効率性は、これまで気付かれなかった推論パイプラインの欠陥によって引き起こされたことを示している。
タスク固有の損失を伴う単一ステップモデル上でエンドツーエンドの微調整を行い、他の拡散に基づく深さモデルや正規推定モデルよりも優れた決定論的モデルを得る。
論文 参考訳(メタデータ) (2024-09-17T16:58:52Z) - Unsupervised Monocular Depth Estimation Based on Hierarchical Feature-Guided Diffusion [21.939618694037108]
教師なし単分子深度推定は、地上の真実を示さずに訓練できるため、広く注目を集めている。
我々は、教師なし単眼深度推定のために、生成ネットワーク間でよく収束する拡散モデルを用いる。
このモデルは深度分布の学習と解釈の能力を大幅に向上させる。
論文 参考訳(メタデータ) (2024-06-14T07:31:20Z) - Self-Supervised Monocular Depth Estimation with Self-Reference
Distillation and Disparity Offset Refinement [15.012694052674899]
自己教師付き単分子深度推定を改善するための2つの新しいアイデアを提案する。
我々は,教師が訓練の時期に合わせて更新したパラメータ最適化モデルを用いて,さらなる指導を行う。
我々は,高次特徴量と低次特徴量とのコンテキスト整合性を利用して,マルチスケールの相違オフセットを得る。
論文 参考訳(メタデータ) (2023-02-20T06:28:52Z) - FG-Depth: Flow-Guided Unsupervised Monocular Depth Estimation [17.572459787107427]
そこで本研究では,典型的な測光損失を代替する流量蒸留損失と,不適切な画素を除去するための前向きフローベースマスクを提案する。
提案手法は,KITTIとNYU-Depth-v2の両方のデータセットの最先端結果を実現する。
論文 参考訳(メタデータ) (2023-01-20T04:02:13Z) - SC-DepthV3: Robust Self-supervised Monocular Depth Estimation for
Dynamic Scenes [58.89295356901823]
自己監督型単眼深度推定は静的な場面で顕著な結果を示した。
トレーニングネットワークのマルチビュー整合性の仮定に依存するが、動的オブジェクト領域に違反する。
単一画像の深度を事前に生成するための,外部トレーニング付き単眼深度推定モデルを提案する。
我々のモデルは、高度にダイナミックなシーンのモノクロビデオからトレーニングしても、シャープで正確な深度マップを予測できる。
論文 参考訳(メタデータ) (2022-11-07T16:17:47Z) - Pseudo Supervised Monocular Depth Estimation with Teacher-Student
Network [90.20878165546361]
疑似監視機構に基づく新しい教師なし深度推定手法を提案する。
これは、教師なしおよび教師なしの単分子深度推定の利点を戦略的に統合する。
実験の結果,提案手法はKITTIベンチマークの最先端性よりも優れていた。
論文 参考訳(メタデータ) (2021-10-22T01:08:36Z) - High-Dimensional Bayesian Optimisation with Variational Autoencoders and
Deep Metric Learning [119.91679702854499]
本研究では,高次元の入力空間上でベイズ最適化を行うためのディープ・メトリック・ラーニングに基づく手法を提案する。
このような帰納バイアスを、利用可能なラベル付きデータの1%だけを用いて達成する。
実証的な貢献として、実世界の高次元ブラックボックス最適化問題に対する最先端の結果を示す。
論文 参考訳(メタデータ) (2021-06-07T13:35:47Z) - Calibrating Self-supervised Monocular Depth Estimation [77.77696851397539]
近年、ニューラルネットワークが深度を学習し、画像のシーケンスに変化を起こさせる能力を示す方法は、訓練信号として自己スーパービジョンのみを使用している。
カメラの構成や環境に関する事前情報を取り入れることで,センサの追加に頼ることなく,自己教師型定式化を用いて,スケールのあいまいさを排除し,深度を直接予測できることを示す。
論文 参考訳(メタデータ) (2020-09-16T14:35:45Z) - On the uncertainty of self-supervised monocular depth estimation [52.13311094743952]
単眼深度推定のための自己監督的パラダイムは、基礎的な真理アノテーションを全く必要としないため、非常に魅力的である。
我々は,このタスクの不確かさを推定する方法と,これが深さ精度にどのように影響するかを初めて検討する。
自己教師型アプローチに特化して設計された,斬新な手法を提案する。
論文 参考訳(メタデータ) (2020-05-13T09:00:55Z) - Self-supervised Monocular Trained Depth Estimation using Self-attention
and Discrete Disparity Volume [19.785343302320918]
本研究では,1)自己注意,2)離散的不一致予測という,自己教師付き単分子学習深度推定を改善するための2つの新しいアイデアを提案する。
これらの2つのアイデアにより、最先端の自己教師型単分子深度推定器 Monodepth2 の拡張により、KITTI 2015 と Make3D の分野で最高の結果を生み出すモデルを設計できることを示す。
論文 参考訳(メタデータ) (2020-03-31T04:48:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。