論文の概要: FG-Depth: Flow-Guided Unsupervised Monocular Depth Estimation
- arxiv url: http://arxiv.org/abs/2301.08414v1
- Date: Fri, 20 Jan 2023 04:02:13 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-23 13:47:25.379374
- Title: FG-Depth: Flow-Guided Unsupervised Monocular Depth Estimation
- Title(参考訳): FG深度:フローガイドによる教師なし単眼深度推定
- Authors: Junyu Zhu, Lina Liu, Yong Liu, Wanlong Li, Feng Wen and Hongbo Zhang
- Abstract要約: そこで本研究では,典型的な測光損失を代替する流量蒸留損失と,不適切な画素を除去するための前向きフローベースマスクを提案する。
提案手法は,KITTIとNYU-Depth-v2の両方のデータセットの最先端結果を実現する。
- 参考スコア(独自算出の注目度): 17.572459787107427
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The great potential of unsupervised monocular depth estimation has been
demonstrated by many works due to low annotation cost and impressive accuracy
comparable to supervised methods. To further improve the performance, recent
works mainly focus on designing more complex network structures and exploiting
extra supervised information, e.g., semantic segmentation. These methods
optimize the models by exploiting the reconstructed relationship between the
target and reference images in varying degrees. However, previous methods prove
that this image reconstruction optimization is prone to get trapped in local
minima. In this paper, our core idea is to guide the optimization with prior
knowledge from pretrained Flow-Net. And we show that the bottleneck of
unsupervised monocular depth estimation can be broken with our simple but
effective framework named FG-Depth. In particular, we propose (i) a flow
distillation loss to replace the typical photometric loss that limits the
capacity of the model and (ii) a prior flow based mask to remove invalid pixels
that bring the noise in training loss. Extensive experiments demonstrate the
effectiveness of each component, and our approach achieves state-of-the-art
results on both KITTI and NYU-Depth-v2 datasets.
- Abstract(参考訳): 教師なし単分子深度推定の大きなポテンシャルは、アノテーションのコストが低く、教師付き手法と同等の精度で証明されている。
パフォーマンスをさらに向上するために、最近の研究は主により複雑なネットワーク構造の設計と、セマンティックセグメンテーションのような追加の教師付き情報の利用に焦点を当てている。
これらの手法は、対象画像と参照画像との再構成された関係を様々な程度に利用してモデルを最適化する。
しかし、以前の手法では、この画像再構成最適化が局所的なミニマに閉じ込められやすいことが証明された。
本稿では,事前学習したflow-netによる事前知識を用いて最適化を指導する。
また,FG-Depth という単純なフレームワークを用いて,教師なし単分子深度推定のボトルネックを解消できることを示した。
特に,提案する
(i)モデルの容量を制限する典型的な測光損失を置き換えるための流れ蒸留損失
(i)トレーニング損失のノイズをもたらす無効な画素を削除するための事前フローベースのマスク。
提案手法は,KITTIとNYU-Depth-v2の両方のデータセットに対して,最先端の結果が得られることを示す。
関連論文リスト
- Efficient Diffusion as Low Light Enhancer [63.789138528062225]
RATR(Reflectance-Aware Trajectory Refinement)は、イメージの反射成分を用いて教師の軌跡を洗練するための、シンプルで効果的なモジュールである。
textbfReDDiT (textbfDistilled textbfTrajectory) は低照度画像強調(LLIE)に適した効率的で柔軟な蒸留フレームワークである。
論文 参考訳(メタデータ) (2024-10-16T08:07:18Z) - Fine-Tuning Image-Conditional Diffusion Models is Easier than You Think [53.2706196341054]
認識された非効率性は、これまで気付かれなかった推論パイプラインの欠陥によって引き起こされたことを示している。
タスク固有の損失を伴う単一ステップモデル上でエンドツーエンドの微調整を行い、他の拡散に基づく深さモデルや正規推定モデルよりも優れた決定論的モデルを得る。
論文 参考訳(メタデータ) (2024-09-17T16:58:52Z) - Unsupervised Monocular Depth Estimation Based on Hierarchical Feature-Guided Diffusion [21.939618694037108]
教師なし単分子深度推定は、地上の真実を示さずに訓練できるため、広く注目を集めている。
我々は、教師なし単眼深度推定のために、生成ネットワーク間でよく収束する拡散モデルを用いる。
このモデルは深度分布の学習と解釈の能力を大幅に向上させる。
論文 参考訳(メタデータ) (2024-06-14T07:31:20Z) - DepthFM: Fast Monocular Depth Estimation with Flow Matching [22.206355073676082]
この問題に対する現在の差別的アプローチは、ぼやけた人工物のために限られている。
最先端の生成法は、SDEの性質上、サンプリングが遅い。
解空間を通した直線軌道は効率と高品質を提供するので,フローマッチングを用いて効果的にフレーム化することができる。
論文 参考訳(メタデータ) (2024-03-20T17:51:53Z) - Unpaired Overwater Image Defogging Using Prior Map Guided CycleGAN [60.257791714663725]
オーバーウォーターシーンで画像をデフォグするための先行マップガイドサイクロン (PG-CycleGAN) を提案する。
提案手法は,最先端の教師付き,半教師付き,非教師付きデグジングアプローチより優れている。
論文 参考訳(メタデータ) (2022-12-23T03:00:28Z) - CbwLoss: Constrained Bidirectional Weighted Loss for Self-supervised
Learning of Depth and Pose [13.581694284209885]
光度差は、未ラベルのモノクロビデオから深度とカメラのポーズを推定するためにニューラルネットワークを訓練するために使用される。
本稿では,アフィン変換とビュー合成によって生じる流れ場と深さ構造の違いを利用して,移動物体とオクルージョンを取り扱う。
ネットワークを追加することなく、より意味的な情報と文脈的な情報を持つ特徴の差を測定することにより、テクスチャレス領域がモデル最適化に与える影響を緩和する。
論文 参考訳(メタデータ) (2022-12-12T12:18:24Z) - Image-specific Convolutional Kernel Modulation for Single Image
Super-resolution [85.09413241502209]
本稿では,新しい画像特異的畳み込み変調カーネル(IKM)を提案する。
我々は、画像や特徴のグローバルな文脈情報を利用して、畳み込みカーネルを適応的に調整するための注意重みを生成する。
単一画像超解像実験により,提案手法は最先端手法よりも優れた性能を示した。
論文 参考訳(メタデータ) (2021-11-16T11:05:10Z) - NerfingMVS: Guided Optimization of Neural Radiance Fields for Indoor
Multi-view Stereo [97.07453889070574]
本稿では,従来のSfM再構成と学習に基づく先行手法を併用した多視点深度推定手法を提案する。
提案手法は室内シーンにおける最先端手法を著しく上回ることを示す。
論文 参考訳(メタデータ) (2021-09-02T17:54:31Z) - SynDistNet: Self-Supervised Monocular Fisheye Camera Distance Estimation
Synergized with Semantic Segmentation for Autonomous Driving [37.50089104051591]
モノクル深度推定のための最先端の自己教師型学習アプローチは、通常、スケールの曖昧さに悩まされる。
本稿では,魚眼カメラ画像とピンホールカメラ画像の自己教師付き単眼距離推定を改善するための,新しいマルチタスク学習手法を提案する。
論文 参考訳(メタデータ) (2020-08-10T10:52:47Z) - What Matters in Unsupervised Optical Flow [51.45112526506455]
教師なし光流における鍵成分の集合を比較し解析する。
教師なしフローモデルに対する新しい改良点を多数構築する。
本稿では,従来の最先端技術よりもはるかに優れた非教師なしフロー技術を提案する。
論文 参考訳(メタデータ) (2020-06-08T19:36:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。