論文の概要: Learning Deblurring Texture Prior from Unpaired Data with Diffusion Model
- arxiv url: http://arxiv.org/abs/2507.13599v1
- Date: Fri, 18 Jul 2025 01:50:31 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-21 20:43:26.164567
- Title: Learning Deblurring Texture Prior from Unpaired Data with Diffusion Model
- Title(参考訳): 拡散モデルによる不適切なデータから先立ってテクスチャの劣化を学習する
- Authors: Chengxu Liu, Lu Qi, Jinshan Pan, Xueming Qian, Ming-Hsuan Yang,
- Abstract要約: 画像の劣化に対する新しい拡散モデル(DM)に基づくフレームワークを提案する。
我々の研究は、ぼやけた画像のテクスチャを回復するのに役立つ事前知識を生成するために、DMを実行する。
生成したテクスチャをフル活用するために,テクスチャ転送変換層(TTformer)を提案する。
- 参考スコア(独自算出の注目度): 92.61216319417208
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Since acquiring large amounts of realistic blurry-sharp image pairs is difficult and expensive, learning blind image deblurring from unpaired data is a more practical and promising solution. Unfortunately, dominant approaches rely heavily on adversarial learning to bridge the gap from blurry domains to sharp domains, ignoring the complex and unpredictable nature of real-world blur patterns. In this paper, we propose a novel diffusion model (DM)-based framework, dubbed \ours, for image deblurring by learning spatially varying texture prior from unpaired data. In particular, \ours performs DM to generate the prior knowledge that aids in recovering the textures of blurry images. To implement this, we propose a Texture Prior Encoder (TPE) that introduces a memory mechanism to represent the image textures and provides supervision for DM training. To fully exploit the generated texture priors, we present the Texture Transfer Transformer layer (TTformer), in which a novel Filter-Modulated Multi-head Self-Attention (FM-MSA) efficiently removes spatially varying blurring through adaptive filtering. Furthermore, we implement a wavelet-based adversarial loss to preserve high-frequency texture details. Extensive evaluations show that \ours provides a promising unsupervised deblurring solution and outperforms SOTA methods in widely-used benchmarks.
- Abstract(参考訳): 大量のリアルなぼやけたシャープ画像の取得は困難で費用がかかるため、未確認データからブラインド画像の学習はより実用的で有望なソリューションである。
残念ながら、支配的なアプローチは、曖昧なドメインから鋭いドメインへのギャップを埋めるために、現実のぼやけたパターンの複雑で予測不可能な性質を無視して、敵対的な学習に大きく依存している。
本稿では,未経験データから空間的に異なるテクスチャを学習することで,画像の劣化を解消する,新しい拡散モデル(DM)ベースのフレームワークを提案する。
特に、Shaoursは、ぼやけた画像のテクスチャを回復するのに役立つ事前知識を生成するためにDMを実行する。
これを実現するために,画像テクスチャを表現するメモリ機構を導入し,DMトレーニングの監督を行うテクスチャ優先エンコーダ(TPE)を提案する。
生成したテクスチャをフル活用するために,新しいフィルタ変調マルチヘッド自己認識層(FM-MSA)が適応フィルタにより空間的に変化するぼかしを効率的に除去するテクスチャ転送トランスフォーマ層(TTformer)を提案する。
さらに、ウェーブレットによる逆方向の損失を発生させ、高周波テクスチャの詳細を保存する。
広範囲な評価により、Shaoursは有望な教師なしのデブロアリングソリューションを提供し、広く使用されているベンチマークでSOTAメソッドより優れていることが示された。
関連論文リスト
- DiffUHaul: A Training-Free Method for Object Dragging in Images [78.93531472479202]
DiffUHaulと呼ばれるオブジェクトドラッグタスクのためのトレーニング不要な手法を提案する。
まず、各認知段階に注意マスキングを適用して、各生成を異なるオブジェクトにまたがってよりゆがみやすくする。
初期のデノナイジングステップでは、ソース画像とターゲット画像の注意特徴を補間して、新しいレイアウトを元の外観とスムーズに融合させる。
論文 参考訳(メタデータ) (2024-06-03T17:59:53Z) - Robust CLIP-Based Detector for Exposing Diffusion Model-Generated Images [13.089550724738436]
拡散モデル(DM)は画像生成に革命をもたらし、様々な分野にまたがる高品質な画像を生成する。
超現実的画像を作成する能力は、現実的コンテンツと合成的コンテンツを区別する上で大きな課題となる。
この研究は、CLIPモデルによって抽出された画像とテキストの特徴をMLP(Multilayer Perceptron)分類器と統合する堅牢な検出フレームワークを導入する。
論文 参考訳(メタデータ) (2024-04-19T14:30:41Z) - A Multi-scale Generalized Shrinkage Threshold Network for Image Blind
Deblurring in Remote Sensing [5.957520165711732]
縮小しきい値の反復を交互に利用するブラインドデブロアリング学習フレームワークを提案する。
また、画像領域における深部近位写像モジュールを提案し、一般化された縮小しきい値とマルチスケールの先行特徴抽出ブロックを組み合わせた。
論文 参考訳(メタデータ) (2023-09-14T08:48:44Z) - Person Image Synthesis via Denoising Diffusion Model [116.34633988927429]
本研究では,高忠実度人物画像合成に拡散モデルをいかに応用できるかを示す。
2つの大規模ベンチマークとユーザスタディの結果は、挑戦的なシナリオ下で提案したアプローチのフォトリアリズムを実証している。
論文 参考訳(メタデータ) (2022-11-22T18:59:50Z) - Controllable Person Image Synthesis with Spatially-Adaptive Warped
Normalization [72.65828901909708]
制御可能な人物画像生成は、望ましい属性を持つ現実的な人間の画像を作成することを目的としている。
本稿では,学習フロー場とワープ変調パラメータを統合した空間適応型ワープ正規化(SAWN)を提案する。
本稿では,テクスチャ・トランスファータスクの事前学習モデルを洗練するための,新たな自己学習部分置換戦略を提案する。
論文 参考訳(メタデータ) (2021-05-31T07:07:44Z) - Towards Enhancing Fine-grained Details for Image Matting [40.17208660790402]
微視的詳細の復元は低レベルだが高精細なテクスチャの特徴に依存していると論じている。
本モデルは,従来のエンコーダデコーダセマンティックパスと,独立したダウンサンプリングフリーテクスチャ補償パスから構成される。
本手法は,Compposition-1kデータセットの以前の開始方法よりも優れている。
論文 参考訳(メタデータ) (2021-01-22T13:20:23Z) - Self-Adaptively Learning to Demoire from Focused and Defocused Image
Pairs [97.67638106818613]
モアレアーティファクトはデジタル写真では一般的であり、高周波シーンコンテンツとカメラのカラーフィルタアレイとの干渉によるものである。
大規模反復で訓練された既存のディープラーニングに基づく復習手法は、様々な複雑なモアレパターンを扱う場合に限られる。
本稿では,高頻度画像の復調のための自己適応学習手法を提案する。
論文 参考訳(メタデータ) (2020-11-03T23:09:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。