論文の概要: Residual-Guided Learning Representation for Self-Supervised Monocular
Depth Estimation
- arxiv url: http://arxiv.org/abs/2111.04310v1
- Date: Mon, 8 Nov 2021 07:44:31 GMT
- ステータス: 処理完了
- システム内更新日: 2021-11-09 15:50:31.306390
- Title: Residual-Guided Learning Representation for Self-Supervised Monocular
Depth Estimation
- Title(参考訳): 自己教師付き単眼深度推定のための残留誘導学習表現
- Authors: Byeongjun Park, Taekyung Kim, Hyojun Go, Changick Kim
- Abstract要約: 光度整合損失は、自己教師付き単眼深度推定によく用いられる代表的目的関数の1つである。
近年の自己教師型学習手法は,オートエンコーダから明示的に学習した特徴表現を活用することでこの問題に対処している。
自己符号化された特徴の識別性を伝達することにより、深度推定ネットワークが識別特徴を埋め込むことができる残留誘導損失を提案する。
- 参考スコア(独自算出の注目度): 33.18012120187014
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Photometric consistency loss is one of the representative objective functions
commonly used for self-supervised monocular depth estimation. However, this
loss often causes unstable depth predictions in textureless or occluded regions
due to incorrect guidance. Recent self-supervised learning approaches tackle
this issue by utilizing feature representations explicitly learned from
auto-encoders, expecting better discriminability than the input image. Despite
the use of auto-encoded features, we observe that the method does not embed
features as discriminative as auto-encoded features. In this paper, we propose
residual guidance loss that enables the depth estimation network to embed the
discriminative feature by transferring the discriminability of auto-encoded
features. We conducted experiments on the KITTI benchmark and verified our
method's superiority and orthogonality on other state-of-the-art methods.
- Abstract(参考訳): 測光一貫性損失は、自己教師付き単眼深度推定に一般的に用いられる主目的関数の1つである。
しかし、この損失は、しばしば不正確な誘導によって、テクスチャのない領域や目立たない領域で不安定な深さ予測を引き起こす。
近年の自己教師型学習手法では, 自動エンコーダから学習した特徴表現を利用して, 入力画像よりも識別性がよいことを期待している。
自動符号化機能の利用にもかかわらず,本手法は自動符号化機能ほど特徴を識別しない。
本稿では,自己符号化特徴の識別性を伝達することにより,深度推定ネットワークが識別特徴を埋め込むことのできる残留誘導損失を提案する。
本手法はkittiベンチマークを用いて実験を行い,他の最先端手法における精度と直交性を検証した。
関連論文リスト
- SINDER: Repairing the Singular Defects of DINOv2 [61.98878352956125]
大規模なデータセットでトレーニングされたビジョントランスフォーマーモデルは、抽出したパッチトークンにアーティファクトを表示することが多い。
本稿では,小さなデータセットのみを用いて構造欠陥を補正するスムーズなスムーズな正規化を提案する。
論文 参考訳(メタデータ) (2024-07-23T20:34:23Z) - Produce Once, Utilize Twice for Anomaly Detection [6.501323305130114]
我々は、再構成ネットワークにおける識別情報電位を再利用することにより、精度と効率を両立させるPOUTAを導出する。
POUTAは、特別な設計をせずに、最先端の数発の異常検出方法よりも優れた性能を実現している。
論文 参考訳(メタデータ) (2023-12-20T10:49:49Z) - Overhead Line Defect Recognition Based on Unsupervised Semantic
Segmentation [8.672676348736834]
オーバーヘッドラインインスペクションは、可視光画像を用いた欠陥認識の恩恵が大きい。
本稿では,Faster RCNNネットワーク上に構築された新しい欠陥認識フレームワークを提案する。
論文 参考訳(メタデータ) (2023-11-02T03:52:59Z) - Out-of-Distribution Detection for Monocular Depth Estimation [4.873593653200759]
異常検出により,エンコーダ・デコーダ深度推定モデルからOOD画像を検出することを提案する。
我々は,標準のNYU Depth V2とKITTIベンチマークを分散データとして構築した。
論文 参考訳(メタデータ) (2023-08-11T11:25:23Z) - Uncertainty Estimation by Fisher Information-based Evidential Deep
Learning [61.94125052118442]
不確実性推定は、ディープラーニングを実用アプリケーションで信頼できるものにする鍵となる要素である。
漁業情報に基づくエビデンシャルディープラーニング(mathcalI$-EDL)を提案する。
特に,各サンプルが有する証拠の情報量を測定するためにFisher Information Matrix (FIM)を導入し,目的的損失項を動的に重み付けし,不確実なクラスの表現学習に集中させる。
論文 参考訳(メタデータ) (2023-03-03T16:12:59Z) - Gradient-based Uncertainty for Monocular Depth Estimation [5.7575052885308455]
単眼深度推定では、移動物体や反射材料のような画像コンテキストの乱れは、容易に誤った予測につながる。
本稿では,すでに訓練済みで固定された深度推定モデルに対するポストホック不確実性推定手法を提案する。
提案手法は,ニューラルネットワークの再トレーニングを必要とせずに,KITTI と NYU Depth V2 ベンチマークにおける最先端の不確実性推定結果を実現する。
論文 参考訳(メタデータ) (2022-08-03T12:21:02Z) - Self-Supervised Training with Autoencoders for Visual Anomaly Detection [61.62861063776813]
我々は, 正規サンプルの分布を低次元多様体で支持する異常検出において, 特定のユースケースに焦点を当てた。
我々は、訓練中に識別情報を活用する自己指導型学習体制に適応するが、通常の例のサブ多様体に焦点をあてる。
製造領域における視覚異常検出のための挑戦的なベンチマークであるMVTec ADデータセットで、最先端の新たな結果を達成する。
論文 参考訳(メタデータ) (2022-06-23T14:16:30Z) - Self-Supervised Point Cloud Representation Learning with Occlusion
Auto-Encoder [63.77257588569852]
本稿では,3D Occlusion Auto-Encoder(3D-OAE)を提案する。
私たちのキーとなるアイデアは、入力ポイントクラウドのローカルパッチをランダムに排除し、隠されたパッチを復元することで監督を確立することです。
従来の手法とは対照的に、我々の3D-OAEは大量のパッチを除去し、少数の可視パッチでしか予測できない。
論文 参考訳(メタデータ) (2022-03-26T14:06:29Z) - Robust Depth Completion with Uncertainty-Driven Loss Functions [60.9237639890582]
本研究では,不確実性による損失関数を導入し,深度補修の堅牢性を改善し,深度補修の不確実性に対処する。
提案手法は,KITTI深度評価ベンチマークでテストされ,MAE, IMAE, IRMSEの計測値を用いて最先端のロバスト性性能を達成した。
論文 参考訳(メタデータ) (2021-12-15T05:22:34Z) - Exploring Robustness of Unsupervised Domain Adaptation in Semantic
Segmentation [74.05906222376608]
クリーンな画像とそれらの逆の例との一致を、出力空間における対照的な損失によって最大化する、逆向きの自己スーパービジョンUDA(ASSUDA)を提案する。
i) セマンティックセグメンテーションにおけるUDA手法のロバスト性は未解明のままであり, (ii) 一般的に自己スーパービジョン(回転やジグソーなど) は分類や認識などのイメージタスクに有効であるが, セグメンテーションタスクの識別的表現を学習する重要な監視信号の提供には失敗している。
論文 参考訳(メタデータ) (2021-05-23T01:50:44Z) - Improved Point Transformation Methods For Self-Supervised Depth
Prediction [4.103701929881022]
ステレオ画像対やエゴモーション画像対が与えられた場合、単眼深度推定の教師なし学習の一般的な成功方法は、学習した深度予測による画像再構成の品質を測定することである。
本稿では,変換後の点を新しい視点に正しく効率的に処理するzブッフィングアルゴリズムを提案する。
このアルゴリズムは、機械学習ライブラリの典型的なオペレーターによって実装されているため、差別化を自動サポートした既存の教師なし深度学習フレームワークに組み込むことができる。
論文 参考訳(メタデータ) (2021-02-18T03:42:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。