論文の概要: The Diffusion Duet: Harmonizing Dual Channels with Wavelet Suppression for Image Separation
- arxiv url: http://arxiv.org/abs/2602.13361v1
- Date: Fri, 13 Feb 2026 11:48:07 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-17 14:17:27.944204
- Title: The Diffusion Duet: Harmonizing Dual Channels with Wavelet Suppression for Image Separation
- Title(参考訳): 拡散デュエット:画像分離のためのウェーブレット抑制によるデュアルチャネルの調和
- Authors: Jingwei Li, Wei Pu,
- Abstract要約: ブラインド画像分離(Blind Image separation, BIS)とは、複数の独立したソース画像の同時推定と復元の逆問題である。
統計的な独立性の仮定やCNN/GANの変種に依存する伝統的な手法は、実際のシーンにおける複雑な特徴分布を特徴づけるのに苦労する。
本稿では, 2チャネルBISへの拡散モデルを導入し, 効率の良いDual-Channel Diffusion separation Modelを提案する。
- 参考スコア(独自算出の注目度): 11.801698362346192
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Blind image separation (BIS) refers to the inverse problem of simultaneously estimating and restoring multiple independent source images from a single observation image under conditions of unknown mixing mode and without prior knowledge of the source images. Traditional methods relying on statistical independence assumptions or CNN/GAN variants struggle to characterize complex feature distributions in real scenes, leading to estimation bias, texture distortion, and artifact residue under strong noise and nonlinear mixing. This paper innovatively introduces diffusion models into dual-channel BIS, proposing an efficient Dual-Channel Diffusion Separation Model (DCDSM). DCDSM leverages diffusion models' powerful generative capability to learn source image feature distributions and reconstruct feature structures effectively. A novel Wavelet Suppression Module (WSM) is designed within the dual-branch reverse denoising process, forming an interactive separation network that enhances detail separation by exploiting the mutual coupling noise characteristic between source images. Extensive experiments on synthetic datasets containing rain/snow and complex mixtures demonstrate that DCDSM achieves state-of-the-art performance: 1) In image restoration tasks, it obtains PSNR/SSIM values of 35.0023 dB/0.9549 and 29.8108 dB/0.9243 for rain and snow removal respectively, outperforming Histoformer and LDRCNet by 1.2570 dB/0.9272 dB (PSNR) and 0.0262/0.0289 (SSIM) on average; 2) For complex mixture separation, the restored dual-source images achieve average PSNR and SSIM of 25.0049 dB and 0.7997, surpassing comparative methods by 4.1249 dB and 0.0926. Both subjective and objective evaluations confirm DCDSM's superiority in addressing rain/snow residue removal and detail preservation challenges.
- Abstract(参考訳): ブラインド画像分離(Blind Image separation, BIS)とは、未知の混合モード条件下で複数の独立したソースイメージを同時に推定・復元する逆問題である。
統計的独立仮定やCNN/GANの変種に依存する従来の手法は、実際のシーンにおける複雑な特徴分布を特徴づけるのに苦労し、推定バイアス、テクスチャ歪み、強いノイズと非線形混合の下でのアーティファクト残留をもたらす。
本稿では,効率の良いデュアルチャネル拡散分離モデル(DCDSM)を提案する。
DCDSMは拡散モデルの強力な生成能力を活用し、ソース画像の特徴分布を学習し、特徴構造を効率的に再構築する。
新たなWavelet Suppression Module (WSM) は、ソース画像間の相互結合ノイズ特性を利用して、詳細分離を強化する対話型分離ネットワークを形成する。
雨・雪・複雑な混合物を含む合成データセットの大規模な実験は、DCDSMが最先端の性能を達成することを実証している。
1) 画像復元作業では,降雪時のPSNR/SSIM値が35.0023 dB/0.9549,降雪時29.8108 dB/0.9243,降雪時LDRCNetが1.2570 dB/0.9272 dB(PSNR)と0.0262/0.0289(SSIM)を上回っている。
2) 複素混合分離の場合, 復元された2ソース画像は, 平均PSNRおよびSSIMが25.0049dBと0.7997であり, 比較法が4.1249dBと0.0926を上回っている。
主観的および客観的評価は,DCDSMが降雨・雪の残留物除去および詳細な保存課題に対処する上で優れていることを裏付けるものである。
関連論文リスト
- Residual-based Efficient Bidirectional Diffusion Model for Image Dehazing and Haze Generation [17.043633726365233]
現在のディープデヘイズ法は、ヘイズフリー画像とヘイズフリー画像の翻訳能力に欠け、ヘイズ画像からヘイズを除去することのみに焦点を当てている。
本研究では, 残差に基づく効率的な双方向拡散モデル (RBDM) を提案し, 脱ハジングとヘイズ生成の両方の条件分布をモデル化する。
RBDMは,15ステップのサンプリングで,ヘイズフリー画像とヘイズ画像の双方向化を実現することに成功した。
論文 参考訳(メタデータ) (2025-08-15T01:00:15Z) - Res-MoCoDiff: Residual-guided diffusion models for motion artifact correction in brain MRI [4.893666625661374]
脳MRIの動作アーティファクトは、主に硬直した頭部の動きから、画質を低下させ、下流の応用を妨げる。
本研究では,MRIの運動アーチファクト修正に特化して設計された効率的な拡散確率モデルであるRes-MoCoDiffを紹介する。
提案手法は, 微少, 中等度, 重歪レベルにわたる運動アーティファクトの除去において, 優れた性能を示した。
論文 参考訳(メタデータ) (2025-05-06T13:02:40Z) - SING: Semantic Image Communications using Null-Space and INN-Guided Diffusion Models [52.40011613324083]
近年, 無線画像伝送において, 共用音源チャネル符号化システム (DeepJSCC) が顕著な性能を発揮している。
既存の手法では、送信された画像とレシーバーの再構成されたバージョンとの間の歪みを最小限に抑えることに重点を置いており、しばしば知覚的品質を見落としている。
逆問題として,破損した再構成画像から高品質な画像の復元を定式化する新しいフレームワークであるSINGを提案する。
論文 参考訳(メタデータ) (2025-03-16T12:32:11Z) - Diffusion-Aided Joint Source Channel Coding For High Realism Wireless Image Transmission [24.372996233209854]
DiffJSCCは条件拡散復調法により高現実性画像を生成する新しいフレームワークである。
768x512ピクセルのコダック画像を3072のシンボルで再現できる。
論文 参考訳(メタデータ) (2024-04-27T00:12:13Z) - Residual Denoising Diffusion Models [12.698791701225499]
本稿では,従来の単音化拡散過程を残差拡散と雑音拡散に分解する新しい二重拡散過程を提案する。
この二重拡散フレームワークは、デノナイジングに基づく拡散モデルを拡張し、画像生成と復元の両方のための統一的で解釈可能なモデルへと拡張する。
革新的なフレームワークのさらなる探索、応用、開発を促進するために、コードと事前訓練されたモデルを提供しています。
論文 参考訳(メタデータ) (2023-08-25T23:54:15Z) - Low-Light Image Enhancement with Wavelet-based Diffusion Models [50.632343822790006]
拡散モデルは画像復元作業において有望な結果を得たが、時間を要する、過剰な計算資源消費、不安定な復元に悩まされている。
本稿では,DiffLLと呼ばれる高能率かつ高能率な拡散型低光画像強調手法を提案する。
論文 参考訳(メタデータ) (2023-06-01T03:08:28Z) - Denoising Diffusion Models for Plug-and-Play Image Restoration [135.6359475784627]
本稿では,従来のプラグアンドプレイ方式を拡散サンプリングフレームワークに統合したDiffPIRを提案する。
DiffPIRは、差別的なガウスのデノイザーに依存するプラグアンドプレイIR法と比較して、拡散モデルの生成能力を継承することが期待されている。
論文 参考訳(メタデータ) (2023-05-15T20:24:38Z) - DDS2M: Self-Supervised Denoising Diffusion Spatio-Spectral Model for
Hyperspectral Image Restoration [103.79030498369319]
ハイパースペクトル画像復元のための自己教師付き拡散モデルを提案する。
textttDDS2Mは、既存の拡散法と比較して、より強力な一般化能力を持っている。
HSIのノイズ除去、ノイズ除去、様々なHSIの超解像実験は、既存のタスク固有状態よりもtextttDDS2Mの方が優れていることを示した。
論文 参考訳(メタデータ) (2023-03-12T14:57:04Z) - SinDiffusion: Learning a Diffusion Model from a Single Natural Image [159.4285444680301]
SinDiffusionは1つの自然な画像からパッチの内部分布を捉えるためにデノナイズ拡散モデルを利用する。
SinDiffusionは、2つのコア設計に基づいている。まず、SinDiffusionは、段階的にスケールが成長する複数のモデルではなく、1つのスケールで1つのモデルで訓練されている。
第2に,拡散ネットワークのパッチレベルの受容領域は,画像のパッチ統計を捉える上で重要かつ効果的であることを示す。
論文 参考訳(メタデータ) (2022-11-22T18:00:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。