論文の概要: ZID-Net: Zero-Inference Diffusion Prior Decoupling Network for Single Image Dehazing
- arxiv url: http://arxiv.org/abs/2604.23709v1
- Date: Sun, 26 Apr 2026 13:44:25 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-28 17:12:07.513592
- Title: ZID-Net: Zero-Inference Diffusion Prior Decoupling Network for Single Image Dehazing
- Title(参考訳): ZID-Net: 単一画像デハジングのためのゼロ推論拡散前デカップリングネットワーク
- Authors: Xinheng Li, Minghao Chen, Mengqing Wu, Yan Liu, Guanying Huo,
- Abstract要約: 単一画像のデハージングは、回復品質と計算効率のトレードオフによって制約されることが多い。
ZID-Netは、フィードフォワード推論から拡散監視を明示的に分離する新しいフレームワークである。
ZID-Netは、合成RESIDEデータセット上で40.75dBのPSNRを達成し、実世界のデータセットで1.13dBのゲインで既存のメソッドを上回ります。
- 参考スコア(独自算出の注目度): 10.634107398163676
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Single image dehazing is often constrained by a trade-off between restoration quality and computational efficiency. While efficient, CNN networks struggle to learn robust priors for dense and non-homogeneous haze. Conversely, diffusion models provide strong generative priors but suffer from severe inference latency and sampling instability. To address these limitations, we propose ZID-Net, a novel framework that explicitly decouples diffusion supervision from feed-forward inference. For efficient inference, we design a frequency-spatial decoupled feed-forward backbone. Within this backbone, a Channel-Spatial Laplacian Mask (CSLM) filters haze-amplified noise to extract purified structural details, while Lightweight Global Context Blocks (LGCBs) establish long-range spatial dependencies to capture the global variations of haze. A Dynamic Feature Arbitration Block (DFAB) then adaptively fuses these semantic and structural features for robust reconstruction. To provide this backbone with physical priors without the inference cost, we introduce a Zero-Inference Prior Propagation Head (ZI-PPH) during training. ZI-PPH leverages a conditional diffusion process to predict residual noise, providing degradation-aware structural supervision to the backbone. By discarding the diffusion branch at test time, ZID-Net integrates diffusion priors into a pure feed-forward architecture for accurate and efficient restoration. ZID-Net achieves 40.75 dB PSNR on the synthetic RESIDE dataset and outperforms existing methods with a 1.13 dB gain on real-world datasets. Additionally, it yields a 3.06 dB PSNR gain on the StateHaze1k remote sensing dataset with an inference time of just 19.35 ms. The project code is available at: https://github.com/XoomitLXH/ZID-Net.
- Abstract(参考訳): 単一画像のデハージングは、回復品質と計算効率のトレードオフによって制約されることが多い。
効率的ではあるが、CNNネットワークは、密集した非均一なヘイズに対する堅牢な事前学習に苦慮している。
逆に拡散モデルは、強い生成前兆を提供するが、厳しい推論遅延とサンプリング不安定に悩まされる。
これらの制約に対処するために、フィードフォワード推論から拡散監視を明示的に分離する新しいフレームワークであるZID-Netを提案する。
効率的な推論のために、周波数空間分離フィードフォワードバックボーンを設計する。
このバックボーン内では、Channel-Spatial Laplacian Mask (CSLM) がヘイズ増幅ノイズをフィルタし、精製された構造の詳細を抽出する。
Dynamic Feature Arbitration Block (DFAB) は、ロバストな再構築のためにこれらの意味的特徴と構造的特徴を適応的に融合する。
このバックボーンを推論コストを伴わずに, トレーニング中にZI-PPH(Zero-Inference Prior Propagation Head)を導入する。
ZI-PPHは条件拡散過程を利用して残留雑音を予測する。
テスト時に拡散分岐を破棄することにより、ZID-Netは拡散先行を純粋なフィードフォワードアーキテクチャに統合し、正確かつ効率的な復元を行う。
ZID-Netは、合成RESIDEデータセット上で40.75dBのPSNRを達成し、実世界のデータセットで1.13dBのゲインで既存のメソッドを上回ります。
さらに、StateHaze1kリモートセンシングデータセットで3.06dBのPSNRゲインを発生し、推論時間はわずか19.35msである。プロジェクトコードはhttps://github.com/XoomitLXH/ZID-Netで利用可能である。
関連論文リスト
- DINO-SAE: DINO Spherical Autoencoder for High-Fidelity Image Reconstruction and Generation [47.409626500688866]
本稿では,DINO Spherical Autoencoder(DINO-SAE)について述べる。
提案手法は, 既修のVFMと強いセマンティックアライメントを維持しつつ, 0.37 rFID と 26.2 dB PSNR に到達し, 最先端の再現性を実現する。
論文 参考訳(メタデータ) (2026-01-30T12:25:34Z) - Causal Autoregressive Diffusion Language Model [70.7353007255797]
CARDは厳密な因果注意マスク内の拡散過程を再構成し、単一の前方通過で密集した1対1の監視を可能にする。
我々の結果は,CARDが並列生成のレイテンシの利点を解放しつつ,ARMレベルのデータ効率を実現することを示す。
論文 参考訳(メタデータ) (2026-01-29T17:38:29Z) - D3R-Net: Dual-Domain Denoising Reconstruction Network for Robust Industrial Anomaly Detection [0.0]
非教師付き異常検出(UAD)は、現代の製造において、自動視覚検査の鍵となる要素である。
本稿では、D3R-Netについて紹介する。D3R-Netは、自己教師型「癒し」タスクと周波数認識正規化を結合したデュアルドメイン・デノベーション・コンストラクションフレームワークである。
空間平均二乗誤差に加えて、周波数領域の整合性を促進するFast Fourier Transform (FFT) 等級損失を用いる。
論文 参考訳(メタデータ) (2026-01-27T23:21:59Z) - Task-Driven Prompt Learning: A Joint Framework for Multi-modal Cloud Removal and Segmentation [11.468907022707013]
TDP-CRはタスク駆動のフレームワークで、クラウド削除と土地被覆のセグメンテーションを共同で行う。
我々のアプローチの中心は、雲の厚さと空間の不確かさを符号化する学習可能な劣化プロンプトを利用するPrompt-Guided Fusionメカニズムである。
LuojiaSET-OSFCRデータセットの実験は、我々のフレームワークの優位性を実証している。
論文 参考訳(メタデータ) (2026-01-17T13:32:38Z) - SING: Semantic Image Communications using Null-Space and INN-Guided Diffusion Models [52.40011613324083]
近年, 無線画像伝送において, 共用音源チャネル符号化システム (DeepJSCC) が顕著な性能を発揮している。
既存の手法では、送信された画像とレシーバーの再構成されたバージョンとの間の歪みを最小限に抑えることに重点を置いており、しばしば知覚的品質を見落としている。
逆問題として,破損した再構成画像から高品質な画像の復元を定式化する新しいフレームワークであるSINGを提案する。
論文 参考訳(メタデータ) (2025-03-16T12:32:11Z) - Rethinking Video Tokenization: A Conditioned Diffusion-based Approach [58.164354605550194]
新しいトークン化ツールであるDiffusion Conditioned-based Gene Tokenizerは、GANベースのデコーダを条件付き拡散モデルで置き換える。
再建に基本的MSE拡散損失とKL項,LPIPSを併用した訓練を行った。
CDTのスケールダウン版(3$times inference speedup)でさえ、トップベースラインと互換性がある。
論文 参考訳(メタデータ) (2025-03-05T17:59:19Z) - Diffusion-Driven Semantic Communication for Generative Models with Bandwidth Constraints [66.63250537475973]
本稿では,帯域制限付き生成モデルのための,高度なVAEベースの圧縮を用いた拡散駆動型セマンティック通信フレームワークを提案する。
実験の結果,ピーク信号対雑音比 (PSNR) などの画素レベルの指標と,LPIPS (Learning Perceptual Image patch similarity) のような意味的指標が大幅に改善された。
論文 参考訳(メタデータ) (2024-07-26T02:34:25Z) - DiffusionAD: Norm-guided One-step Denoising Diffusion for Anomaly Detection [80.20339155618612]
DiffusionADは、再構成サブネットワークとセグメンテーションサブネットワークからなる、新しい異常検出パイプラインである。
高速なワンステップデノゲーションパラダイムは、同等の再現品質を維持しながら、数百倍の加速を達成する。
異常の出現の多様性を考慮し、複数のノイズスケールの利点を統合するためのノルム誘導パラダイムを提案する。
論文 参考訳(メタデータ) (2023-03-15T16:14:06Z) - ResDiff: Combining CNN and Diffusion Model for Image Super-Resolution [4.885537700693487]
ResDiffはSingle Image Super-Resolution (SISR)のための残差構造に基づく新しい拡散確率モデルである
MR画像を直接HR空間へ誘導する拡散に基づく一般的な手法とは対照的に、ResDiffはCNNの初期予測を利用してHR空間とCNN予測空間の間の残留空間へノイズを誘導する。
複数のベンチマークデータセットの実験により、ResDiffはモデル収束時間の短縮、生成品質の向上、より多様なサンプルの観点から、従来の拡散に基づく手法よりも優れていることが示された。
論文 参考訳(メタデータ) (2023-03-15T15:50:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。