論文の概要: RPD-Diff: Region-Adaptive Physics-Guided Diffusion Model for Visibility Enhancement under Dense and Non-Uniform Haze
- arxiv url: http://arxiv.org/abs/2508.16956v1
- Date: Sat, 23 Aug 2025 09:12:26 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-26 18:43:45.271575
- Title: RPD-Diff: Region-Adaptive Physics-Guided Diffusion Model for Visibility Enhancement under Dense and Non-Uniform Haze
- Title(参考訳): RPD-Diff:DenseおよびNon-Uniform Haze下での可視性向上のための領域適応型物理誘導拡散モデル
- Authors: Ruicheng Zhang, Puxin Yan, Zeyu Zhang, Yicheng Chang, Hongyi Chen, Zhi Jin,
- Abstract要約: RPD-Diffは、複雑なヘイズシナリオにおける堅牢な可視性向上のための領域適応型物理誘導脱ハジング拡散モデルである。
物理的に先行して拡散マルコフ連鎖を変換し、ターゲット遷移を発生させ、密集したヘイズシナリオにおける条件付け不足の問題を緩和する。
密集した非均一なヘイズシナリオに挑戦して最先端のパフォーマンスを実現し、高品質で高精細な明快さと色忠実さを備えたヘイズフリーな画像を提供する。
- 参考スコア(独自算出の注目度): 36.974406098488565
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Single-image dehazing under dense and non-uniform haze conditions remains challenging due to severe information degradation and spatial heterogeneity. Traditional diffusion-based dehazing methods struggle with insufficient generation conditioning and lack of adaptability to spatially varying haze distributions, which leads to suboptimal restoration. To address these limitations, we propose RPD-Diff, a Region-adaptive Physics-guided Dehazing Diffusion Model for robust visibility enhancement in complex haze scenarios. RPD-Diff introduces a Physics-guided Intermediate State Targeting (PIST) strategy, which leverages physical priors to reformulate the diffusion Markov chain by generation target transitions, mitigating the issue of insufficient conditioning in dense haze scenarios. Additionally, the Haze-Aware Denoising Timestep Predictor (HADTP) dynamically adjusts patch-specific denoising timesteps employing a transmission map cross-attention mechanism, adeptly managing non-uniform haze distributions. Extensive experiments across four real-world datasets demonstrate that RPD-Diff achieves state-of-the-art performance in challenging dense and non-uniform haze scenarios, delivering high-quality, haze-free images with superior detail clarity and color fidelity.
- Abstract(参考訳): 濃密で一様でないヘイズ条件下での単一画像のデハージングは、深刻な情報劣化と空間的不均一性のため、依然として困難である。
従来の拡散型脱湿法は、生成条件の不足と空間的に異なるヘイズ分布への適応性の欠如に苦慮し、最適下地回復につながる。
これらの制約に対処するために、複雑なヘイズシナリオにおける堅牢な可視性向上のための領域適応型物理誘導脱ハジング拡散モデルであるPD-Diffを提案する。
RPD-Diffは物理誘導型中間状態ターゲティング(PIST)戦略を導入し、物理先例を活用し、ターゲット遷移の生成によって拡散マルコフ連鎖を再構成し、密集したヘイズシナリオにおける条件付け不足の問題を緩和する。
さらに、Haze-Aware Denoising Timestep Predictor (HADTP)は、送信マップのクロスアテンション機構を用いてパッチ固有のDenoising Timestepを動的に調整し、不均一なHaze分布を適切に管理する。
4つの実世界のデータセットにわたる大規模な実験により、RDD-Diffは、高画質で一様でないヘイズシナリオにおいて最先端のパフォーマンスを達成し、高品質で、より詳細な明快さと色忠実さを備えたヘイズフリーな画像を提供することを示した。
関連論文リスト
- Unifying Heterogeneous Degradations: Uncertainty-Aware Diffusion Bridge Model for All-in-One Image Restoration [39.5698877093219]
画像復元のための不確実性認識拡散ブリッジモデル(UDBM)を提案する。
UDBMは、AiOIRを画素ワイド不確実性による輸送問題として再構成する。
単一の推論ステップで、さまざまな復元タスクにまたがる最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2026-01-29T12:02:42Z) - Training-Free Generation of Diverse and High-Fidelity Images via Prompt Semantic Space Optimization [50.5332987313297]
本稿では,トレーニングフリーでモデルに依存しないモジュールであるToken-Prompt Embedding Space Optimization (TPSO)を提案する。
TPSOは、トークン埋め込み空間の未表現領域を探索するために学習可能なパラメータを導入し、学習された分布の強いモードからサンプルを繰り返し生成する傾向を減少させる。
MS-COCOと3つの拡散バックボーンの実験では、TPSOは画像品質を犠牲にすることなく、生成多様性を著しく向上し、ベースライン性能を1.10から4.18ポイントに改善した。
論文 参考訳(メタデータ) (2025-11-25T00:42:09Z) - Robust Posterior Diffusion-based Sampling via Adaptive Guidance Scale [39.27744518020771]
逆プロブレム定式化のための拡散過程を導出する適応的確率ステップサイズ戦略を提案する。
結果として得られたアプローチであるAdaptive Posterior diffusion Smpling (AdaPS)は、ハイパーフリーであり、多様な画像タスクにおける再構成品質を改善する。
論文 参考訳(メタデータ) (2025-11-23T14:37:59Z) - Boosting Fidelity for Pre-Trained-Diffusion-Based Low-Light Image Enhancement via Condition Refinement [63.54516423266521]
事前学習拡散ベース(PTDB)法は、しばしばコンテンツ忠実さを犠牲にして知覚的リアリズムを高める。
本稿では,事前学習した拡散モデルにおける条件付けのための新しい最適化手法を提案する。
我々のアプローチはプラグアンドプレイであり、より効率的な制御を提供するために既存の拡散ネットワークにシームレスに統合される。
論文 参考訳(メタデータ) (2025-10-20T02:40:06Z) - RainDiff: End-to-end Precipitation Nowcasting Via Token-wise Attention Diffusion [64.49056527678606]
本稿では,U-Net拡散モデルだけでなく,レーダ時間エンコーダにも統合されたトークンワイドアテンションを提案する。
従来の手法とは異なり,本手法は,画素空間拡散の典型的な高資源コストを発生させることなく,アーキテクチャに注意を集中させる。
実験と評価により,提案手法は複雑な降水予測シナリオにおいて,最先端の手法,ロバストネスの局所的忠実度,一般化,優位性を著しく上回ることを示した。
論文 参考訳(メタデータ) (2025-10-16T17:59:13Z) - Foggy Crowd Counting: Combining Physical Priors and KAN-Graph [19.690003059392893]
本稿では,大気散乱の物理的先行性を考慮した群衆計測手法を提案する。
濃霧のシナリオでは主流のアルゴリズムに比べて12.2%-27.5%のMAE測定値の削減が達成されている。
論文 参考訳(メタデータ) (2025-09-29T09:59:36Z) - Frequency Domain-Based Diffusion Model for Unpaired Image Dehazing [92.61216319417208]
そこで本稿では,未確認データにおける有益な知識を十分に活用するための,新しい周波数領域ベース拡散モデルを提案する。
拡散モデル(DM)が示す強い生成能力に着想を得て,周波数領域再構成の観点からデハージング課題に取り組む。
論文 参考訳(メタデータ) (2025-07-02T01:22:46Z) - Physics-Guided Image Dehazing Diffusion [35.93081248202844]
合成データセットでトレーニングされた現在のデータ駆動型デハージングアルゴリズムは、合成データでうまく機能するが、現実のシナリオに一般化するのに苦労する。
textbfImage textbfDehazing textbfDiffusion textbfModels (IDDM) を提案する。
論文 参考訳(メタデータ) (2025-04-30T07:36:10Z) - Diffusion Prior Interpolation for Flexibility Real-World Face Super-Resolution [48.34173818491552]
拡散事前補間(DPI)は、一貫性と多様性のバランスをとることができ、事前訓練されたモデルにシームレスに統合することができる。
合成および実データに対して行われた広範な実験において、DPIはSOTA FSR法よりも優れていることを示した。
論文 参考訳(メタデータ) (2024-12-21T09:28:44Z) - Improving Vector-Quantized Image Modeling with Latent Consistency-Matching Diffusion [55.185588994883226]
VQ-LCMDは、学習を安定させる埋め込み空間内の連続空間潜在拡散フレームワークである。
VQ-LCMDは、関節埋め込み拡散変動下界と整合整合性(CM)損失を組み合わせた新しいトレーニング目標を使用する。
実験により,提案したVQ-LCMDは離散状態潜伏拡散モデルと比較して,FFHQ,LSUN教会,LSUNベッドルームにおいて優れた結果が得られることが示された。
論文 参考訳(メタデータ) (2024-10-18T09:12:33Z) - Steerable Conditional Diffusion for Out-of-Distribution Adaptation in Medical Image Reconstruction [75.91471250967703]
我々は、ステアブル条件拡散と呼ばれる新しいサンプリングフレームワークを導入する。
このフレームワークは、利用可能な測定によって提供される情報のみに基づいて、画像再構成と並行して拡散モデルを適用する。
様々な画像モダリティにまたがるアウト・オブ・ディストリビューション性能の大幅な向上を実現した。
論文 参考訳(メタデータ) (2023-08-28T08:47:06Z) - Diffusion in Diffusion: Cyclic One-Way Diffusion for Text-Vision-Conditioned Generation [11.80682025950519]
本研究では,拡散(機械学習)特性の拡散(物理学)について検討する。
拡散現象の方向を制御するために,循環一流拡散法(COW)を提案する。
本手法は,タスクニーズを理解するための新しい視点を提供し,より広い範囲のカスタマイズシナリオに適用可能である。
論文 参考訳(メタデータ) (2023-06-14T05:25:06Z) - Low-Light Image Enhancement with Wavelet-based Diffusion Models [50.632343822790006]
拡散モデルは画像復元作業において有望な結果を得たが、時間を要する、過剰な計算資源消費、不安定な復元に悩まされている。
本稿では,DiffLLと呼ばれる高能率かつ高能率な拡散型低光画像強調手法を提案する。
論文 参考訳(メタデータ) (2023-06-01T03:08:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。