論文の概要: Towards Robust Time-of-Flight Depth Denoising with Confidence-Aware Diffusion Model
- arxiv url: http://arxiv.org/abs/2503.19448v1
- Date: Tue, 25 Mar 2025 08:39:14 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-26 16:54:09.584779
- Title: Towards Robust Time-of-Flight Depth Denoising with Confidence-Aware Diffusion Model
- Title(参考訳): 信頼度を考慮した拡散モデルによる飛行時間奥行きのロバスト化
- Authors: Changyong He, Jin Zeng, Jiawei Zhang, Jiajie Guo,
- Abstract要約: タイム・オブ・フライ(ToF)センサーはシーンの深度を効率よく捉えるが、非線形の深度構築手順は、しばしば非常に大きなノイズ分散や、さらには無効な領域をもたらす。
ディープニューラルネットワーク(DNN)に基づく最近の手法は、ToFデノナイジング精度の向上を実現しているが、ノイズの深刻な破損に悩まされる傾向にある。
安定拡散における豊富な事前知識を活用することで,グローバルな構造的滑らかさを保証する新しいToFデノベーション手法であるDepthCADを提案する。
- 参考スコア(独自算出の注目度): 7.099483760246544
- License:
- Abstract: Time-of-Flight (ToF) sensors efficiently capture scene depth, but the nonlinear depth construction procedure often results in extremely large noise variance or even invalid areas. Recent methods based on deep neural networks (DNNs) achieve enhanced ToF denoising accuracy but tend to struggle when presented with severe noise corruption due to limited prior knowledge of ToF data distribution. In this paper, we propose DepthCAD, a novel ToF denoising approach that ensures global structural smoothness by leveraging the rich prior knowledge in Stable Diffusion and maintains local metric accuracy by steering the diffusion process with confidence guidance. To adopt the pretrained image diffusion model to ToF depth denoising, we apply the diffusion on raw ToF correlation measurements with dynamic range normalization before converting to depth maps. Experimental results validate the state-of-the-art performance of the proposed scheme, and the evaluation on real data further verifies its robustness against real-world ToF noise.
- Abstract(参考訳): タイム・オブ・フライ(ToF)センサーはシーンの深度を効率よく捉えるが、非線形の深度構築手順は、しばしば非常に大きなノイズ分散や、さらには無効な領域をもたらす。
ディープニューラルネットワーク(DNN)に基づく最近の手法は、ToFの精度を向上するが、ToFデータ分布の事前知識が限られているため、ひどいノイズの破損に悩まされる傾向がある。
本稿では,DepthCADを提案する。DepthCADは,安定拡散における豊富な事前知識を活用することで,グローバルな構造的スムーズさを保証し,拡散過程を信頼性ガイダンスで操り,局所的計量精度を維持する手法である。
ToF深度推定に事前訓練した画像拡散モデルを適用するため, 深度マップに変換する前に, ダイナミックレンジ正規化による生のToF相関測定に拡散を適用した。
実験により提案手法の最先端性能を検証し,実データによる評価により実世界のToFノイズに対するロバスト性をさらに検証した。
関連論文リスト
- Robust Representation Consistency Model via Contrastive Denoising [83.47584074390842]
ランダムな平滑化は、敵の摂動に対する堅牢性を証明する理論的保証を提供する。
拡散モデルは、ノイズ摂動サンプルを浄化するためにランダムな平滑化に成功している。
我々は,画素空間における拡散軌跡に沿った生成的モデリングタスクを,潜在空間における識別的タスクとして再構成する。
論文 参考訳(メタデータ) (2025-01-22T18:52:06Z) - Diffusion Priors for Variational Likelihood Estimation and Image Denoising [10.548018200066858]
本稿では,現実の雑音に対処するために,逆拡散過程における適応的確率推定とMAP推定を提案する。
実世界の多様なデータセットの実験と分析により,本手法の有効性が示された。
論文 参考訳(メタデータ) (2024-10-23T02:52:53Z) - Digging into contrastive learning for robust depth estimation with diffusion models [55.62276027922499]
そこで我々はD4RDと呼ばれる新しい頑健な深度推定法を提案する。
複雑な環境での性能劣化を軽減するために、拡散モデルに適した独自のコントラスト学習モードを備えている。
実験では、D4RDは合成汚職データセットや現実世界の気象条件に関する最先端のソリューションを超越している。
論文 参考訳(メタデータ) (2024-04-15T14:29:47Z) - The Surprising Effectiveness of Diffusion Models for Optical Flow and
Monocular Depth Estimation [42.48819460873482]
拡散確率モデルは、その印象的な忠実さと多様性で画像生成を変換した。
また,タスク固有のアーキテクチャや損失関数を使わずに,光学的フローと単眼深度の推定に優れることを示す。
論文 参考訳(メタデータ) (2023-06-02T21:26:20Z) - Low-Light Image Enhancement with Wavelet-based Diffusion Models [50.632343822790006]
拡散モデルは画像復元作業において有望な結果を得たが、時間を要する、過剰な計算資源消費、不安定な復元に悩まされている。
本稿では,DiffLLと呼ばれる高能率かつ高能率な拡散型低光画像強調手法を提案する。
論文 参考訳(メタデータ) (2023-06-01T03:08:28Z) - Fully Self-Supervised Depth Estimation from Defocus Clue [79.63579768496159]
スパース焦点スタックから深度を純粋に推定する自己教師型フレームワークを提案する。
筆者らのフレームワークは,深度とAIF画像の接地構造の必要性を回避し,より優れた予測を得られることを示す。
論文 参考訳(メタデータ) (2023-03-19T19:59:48Z) - DiffusionDepth: Diffusion Denoising Approach for Monocular Depth
Estimation [23.22005119986485]
DiffusionDepthは、単分子深度推定をデノナイズ拡散過程として再構成する新しいアプローチである。
ランダムな深度分布をモノラルな視覚条件のガイダンスで深度マップに分解する反復的復調過程を学習する。
KITTIとNYU-Depth-V2データセットの実験結果は、シンプルだが効率的な拡散アプローチが、許容可能な推論時間を持つ屋内および屋外の両方のシナリオで最先端のパフォーマンスに達することを示唆している。
論文 参考訳(メタデータ) (2023-03-09T03:48:24Z) - A DNN based Normalized Time-frequency Weighted Criterion for Robust
Wideband DoA Estimation [24.175086158375464]
本稿では、T-F領域における候補ステアリングベクトルとフィルタスナップショットとの距離を最小化する正規化時間周波数重み付き基準を提案する。
本手法では固有分解を必要とせず,ノイズスナップショットによる最適化目標の誤認を防止するため,単純な正規化を用いる。
実験により,提案手法は,雑音および残響環境において広く用いられている部分空間法を含む,一般的なDNNに基づくDoA推定法よりも優れていた。
論文 参考訳(メタデータ) (2023-02-20T18:26:52Z) - Wild ToFu: Improving Range and Quality of Indirect Time-of-Flight Depth
with RGB Fusion in Challenging Environments [56.306567220448684]
本稿では,ノイズの多い生のI-ToF信号とRGB画像を用いた学習に基づくエンド・ツー・エンドの深度予測ネットワークを提案する。
最終深度マップでは,ベースラインアプローチと比較して40%以上のRMSE改善が見られた。
論文 参考訳(メタデータ) (2021-12-07T15:04:14Z) - Uncertainty Estimation Using a Single Deep Deterministic Neural Network [66.26231423824089]
本稿では,1回のフォワードパスで,テスト時に分布データポイントの発見と拒否が可能な決定論的ディープモデルを訓練する手法を提案する。
我々は,新しい損失関数とセントロイド更新方式を用いて,これらをスケールトレーニングし,ソフトマックスモデルの精度に適合させる。
論文 参考訳(メタデータ) (2020-03-04T12:27:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。