Fugu-MT 論文翻訳(概要): Unsupervised Monocular Depth Estimation Based on Hierarchical Feature-Guided Diffusion

論文の概要: Unsupervised Monocular Depth Estimation Based on Hierarchical Feature-Guided Diffusion

arxiv url: http://arxiv.org/abs/2406.09782v1
Date: Fri, 14 Jun 2024 07:31:20 GMT
ステータス: 翻訳完了
システム内更新日: 2024-06-17 14:44:14.237230
Title: Unsupervised Monocular Depth Estimation Based on Hierarchical Feature-Guided Diffusion
Title（参考訳）: 階層的特徴誘導拡散に基づく教師なし単分子深さ推定
Authors: Runze Liu, Dongchen Zhu, Guanghui Zhang, Yue Xu, Wenjun Shi, Xiaolin Zhang, Lei Wang, Jiamao Li,
Abstract要約: 教師なし単分子深度推定は、地上の真実を示さずに訓練できるため、広く注目を集めている。我々は、教師なし単眼深度推定のために、生成ネットワーク間でよく収束する拡散モデルを用いる。このモデルは深度分布の学習と解釈の能力を大幅に向上させる。
参考スコア（独自算出の注目度）: 21.939618694037108
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Unsupervised monocular depth estimation has received widespread attention because of its capability to train without ground truth. In real-world scenarios, the images may be blurry or noisy due to the influence of weather conditions and inherent limitations of the camera. Therefore, it is particularly important to develop a robust depth estimation model. Benefiting from the training strategies of generative networks, generative-based methods often exhibit enhanced robustness. In light of this, we employ a well-converging diffusion model among generative networks for unsupervised monocular depth estimation. Additionally, we propose a hierarchical feature-guided denoising module. This model significantly enriches the model's capacity for learning and interpreting depth distribution by fully leveraging image features to guide the denoising process. Furthermore, we explore the implicit depth within reprojection and design an implicit depth consistency loss. This loss function serves to enhance the performance of the model and ensure the scale consistency of depth within a video sequence. We conduct experiments on the KITTI, Make3D, and our self-collected SIMIT datasets. The results indicate that our approach stands out among generative-based models, while also showcasing remarkable robustness.
Abstract（参考訳）: 教師なし単分子深度推定は、地上の真実を示さずに訓練できるため、広く注目を集めている。現実のシナリオでは、気象条件の影響とカメラ固有の制限のために、画像はぼやけたりうる。したがって、特にロバストな深さ推定モデルを開発することが重要である。生成的ネットワークのトレーニング戦略から恩恵を受けるため、生成的手法はしばしば強化された堅牢性を示す。そこで我々は, 教師なし単眼深度推定のために, 生成ネットワーク間によく収束する拡散モデルを用いた。さらに,階層型特徴誘導型デノナイジングモジュールを提案する。このモデルは,画像特徴を十分に活用することで,学習能力と深度分布の解釈能力を大幅に向上させる。さらに,再計画における暗黙の深さを探索し,暗黙の深度一貫性損失を設計する。この損失関数は、モデルの性能を高め、ビデオシーケンス内の深さのスケール一貫性を確保するのに役立つ。我々は,KITTI,Make3D,および自作SIMITデータセットについて実験を行った。以上の結果から,本手法は生成モデルの中でも顕著であり,また顕著な堅牢性を示した。

関連論文リスト

BokehDiff: Neural Lens Blur with One-Step Diffusion [53.11429878683807]
ボケフディフ(BokehDiff)は、物理的に正確で視覚的に魅力的な結果が得られるレンズボウ描画法である。提案手法では, 画像形成プロセスと整合する自己認識モジュールを物理に着想を得た。付加雑音を導入することなく1ステップの推論方式に拡散モデルを適応させ,高品質で忠実な結果を得る。
論文参考訳（メタデータ） (2025-07-24T03:23:19Z)
Structure-Centric Robust Monocular Depth Estimation via Knowledge Distillation [9.032563775151074]
単眼深度推定はコンピュータビジョンにおける3次元知覚の重要な手法である。現実のシナリオでは、悪天候の変動、動きのぼやけ、夜間の照明条件の悪いシーンなど、大きな課題に直面している。我々は,局所的なテクスチャへの過度な依存を低減し,パターンの欠落や干渉に対する堅牢性を向上するための新しいアプローチを考案した。
論文参考訳（メタデータ） (2024-10-09T15:20:29Z)
Digging into contrastive learning for robust depth estimation with diffusion models [55.62276027922499]
そこで我々はD4RDと呼ばれる新しい頑健な深度推定法を提案する。複雑な環境での性能劣化を軽減するために、拡散モデルに適した独自のコントラスト学習モードを備えている。実験では、D4RDは合成汚職データセットや現実世界の気象条件に関する最先端のソリューションを超越している。
論文参考訳（メタデータ） (2024-04-15T14:29:47Z)
Adaptive Discrete Disparity Volume for Self-supervised Monocular Depth Estimation [0.0]
本稿では,学習可能なモジュールAdaptive Discrete Disparity Volume (ADDV)を提案する。 ADDVは異なるRGB画像の深さ分布を動的に感知し、適応的なビンを生成することができる。また、自己監督型条件下での正規化を実現するために、新しいトレーニング戦略(統一化と強化)も導入する。
論文参考訳（メタデータ） (2024-04-04T04:22:25Z)
Stealing Stable Diffusion Prior for Robust Monocular Depth Estimation [33.140210057065644]
本稿では, 単分子深度推定に先立って, ステアリング安定拡散 (SSD) という新しい手法を提案する。このアプローチは、安定拡散を利用して、挑戦的な条件を模倣した合成画像を生成することにより、この制限に対処する。このアプローチの有効性は、nuScenesとOxford RobotCarで評価されている。
論文参考訳（メタデータ） (2024-03-08T05:06:31Z)
Unveiling the Depths: A Multi-Modal Fusion Framework for Challenging Scenarios [103.72094710263656]
本稿では,学習に基づくフレームワークを用いて,支配的モダリティの奥行きを識別し,統合する手法を提案する。本稿では,信頼度予測ネットワークを操り,潜在電位深度領域を特定する信頼マップを作成する新しい信頼損失を提案する。得られた信頼度マップを用いて,最終深度をエンドツーエンドに融合するマルチモーダル融合ネットワークを提案する。
論文参考訳（メタデータ） (2024-02-19T04:39:16Z)
Depth-aware Volume Attention for Texture-less Stereo Matching [67.46404479356896]
実用的な屋外シナリオにおけるテクスチャ劣化に対処する軽量なボリューム改善手法を提案する。画像テクスチャの相対的階層を抽出し,地中深度マップによって教師される深度体積を導入する。局所的な微細構造と文脈は、体積凝集時のあいまいさと冗長性を緩和するために強調される。
論文参考訳（メタデータ） (2024-02-14T04:07:44Z)
The Surprising Effectiveness of Diffusion Models for Optical Flow and Monocular Depth Estimation [42.48819460873482]
拡散確率モデルは、その印象的な忠実さと多様性で画像生成を変換した。また,タスク固有のアーキテクチャや損失関数を使わずに,光学的フローと単眼深度の推定に優れることを示す。
論文参考訳（メタデータ） (2023-06-02T21:26:20Z)
DiffusionDepth: Diffusion Denoising Approach for Monocular Depth Estimation [23.22005119986485]
DiffusionDepthは、単分子深度推定をデノナイズ拡散過程として再構成する新しいアプローチである。ランダムな深度分布をモノラルな視覚条件のガイダンスで深度マップに分解する反復的復調過程を学習する。 KITTIとNYU-Depth-V2データセットの実験結果は、シンプルだが効率的な拡散アプローチが、許容可能な推論時間を持つ屋内および屋外の両方のシナリオで最先端のパフォーマンスに達することを示唆している。
論文参考訳（メタデータ） (2023-03-09T03:48:24Z)
Monocular Depth Estimation using Diffusion Models [39.27361388836347]
トレーニングデータにおけるノイズや不完全な深度マップに起因する問題に対処するイノベーションを導入する。教師付き訓練におけるデータの可用性の限界に対処するために,自己教師付き画像-画像間翻訳タスクの事前学習を利用する。我々のDepthGenモデルは、屋内のNYUデータセット上で、および屋外のKITTIデータセット上でのSOTA結果に近いSOTA性能を達成する。
論文参考訳（メタデータ） (2023-02-28T18:08:21Z)
SC-DepthV3: Robust Self-supervised Monocular Depth Estimation for Dynamic Scenes [58.89295356901823]
自己監督型単眼深度推定は静的な場面で顕著な結果を示した。トレーニングネットワークのマルチビュー整合性の仮定に依存するが、動的オブジェクト領域に違反する。単一画像の深度を事前に生成するための,外部トレーニング付き単眼深度推定モデルを提案する。我々のモデルは、高度にダイナミックなシーンのモノクロビデオからトレーニングしても、シャープで正確な深度マップを予測できる。
論文参考訳（メタデータ） (2022-11-07T16:17:47Z)
DepthFormer: Exploiting Long-Range Correlation and Local Information for Accurate Monocular Depth Estimation [50.08080424613603]
高精度な単分子深度推定には長距離相関が不可欠である。我々は,このグローバルコンテキストを効果的な注意機構でモデル化するためにTransformerを活用することを提案する。提案したモデルであるDepthFormerは、最先端のモノクル深度推定手法をはるかに超えている。
論文参考訳（メタデータ） (2022-03-27T05:03:56Z)
A high-precision self-supervised monocular visual odometry in foggy weather based on robust cycled generative adversarial networks and multi-task learning aided depth estimation [0.0]
本稿では,霧の天候下でのナビゲーションに特化して設計された,高精度な自己監督型単分子VOを提案する。サイクル生成対向ネットワークは、前と後ろの半サイクルに一貫した推定を強制することで、高品質な自己監督的損失を得るように設計されている。霧の天候における自己監督的損失に対する複雑な光度変化の干渉を取り除くため、勾配に基づく損失と知覚的損失が導入された。
論文参考訳（メタデータ） (2022-03-09T15:41:57Z)
Unsupervised Scale-consistent Depth Learning from Video [131.3074342883371]
本研究では,単眼深度推定器SC-Depthを提案する。スケール一貫性予測の能力により,我々の単分子学習深層ネットワークは簡単にORB-SLAM2システムに統合可能であることを示す。提案したハイブリッドPseudo-RGBD SLAMは、KITTIにおいて魅力的な結果を示し、追加のトレーニングなしでKAISTデータセットにうまく一般化する。
論文参考訳（メタデータ） (2021-05-25T02:17:56Z)
Adaptive confidence thresholding for monocular depth estimation [83.06265443599521]
本稿では,自己教師付ステレオマッチング法から生成されたステレオ画像の擬似地上真実深度マップを利用する新しい手法を提案する。擬似地底深度マップの信頼度マップを推定し、不正確な擬似地底深度マップによる性能劣化を緩和する。実験結果から, 最先端の単分子深度推定法よりも優れた性能を示した。
論文参考訳（メタデータ） (2020-09-27T13:26:16Z)
Calibrating Self-supervised Monocular Depth Estimation [77.77696851397539]
近年、ニューラルネットワークが深度を学習し、画像のシーケンスに変化を起こさせる能力を示す方法は、訓練信号として自己スーパービジョンのみを使用している。カメラの構成や環境に関する事前情報を取り入れることで,センサの追加に頼ることなく,自己教師型定式化を用いて,スケールのあいまいさを排除し,深度を直接予測できることを示す。
論文参考訳（メタデータ） (2020-09-16T14:35:45Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。