論文の概要: Enhancing Diffusion Model Stability for Image Restoration via Gradient Management
- arxiv url: http://arxiv.org/abs/2507.06656v1
- Date: Wed, 09 Jul 2025 08:40:46 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-10 17:37:43.530628
- Title: Enhancing Diffusion Model Stability for Image Restoration via Gradient Management
- Title(参考訳): 勾配管理による画像復元のための拡散モデルの安定性向上
- Authors: Hongjie Wu, Mingqin Zhang, Linchao He, Ji-Zhe Zhou, Jiancheng Lv,
- Abstract要約: これらの成分の基礎となる勾配のダイナミクスを解析し、重要な不安定性を同定する。
これらの不安定さが生成過程を阻害し,復元性能を損なうことを示す。
本稿では,新しい勾配管理手法である安定化進行勾配拡散法を提案する。
- 参考スコア(独自算出の注目度): 13.810537509640874
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Diffusion models have shown remarkable promise for image restoration by leveraging powerful priors. Prominent methods typically frame the restoration problem within a Bayesian inference framework, which iteratively combines a denoising step with a likelihood guidance step. However, the interactions between these two components in the generation process remain underexplored. In this paper, we analyze the underlying gradient dynamics of these components and identify significant instabilities. Specifically, we demonstrate conflicts between the prior and likelihood gradient directions, alongside temporal fluctuations in the likelihood gradient itself. We show that these instabilities disrupt the generative process and compromise restoration performance. To address these issues, we propose Stabilized Progressive Gradient Diffusion (SPGD), a novel gradient management technique. SPGD integrates two synergistic components: (1) a progressive likelihood warm-up strategy to mitigate gradient conflicts; and (2) adaptive directional momentum (ADM) smoothing to reduce fluctuations in the likelihood gradient. Extensive experiments across diverse restoration tasks demonstrate that SPGD significantly enhances generation stability, leading to state-of-the-art performance in quantitative metrics and visually superior results. Code is available at \href{https://github.com/74587887/SPGD}{here}.
- Abstract(参考訳): 拡散モデルは、強力な先行技術を活用することで、画像復元に顕著な可能性を示してきた。
代表的な手法は、典型的にはベイズ推論フレームワーク内の復元問題をフレーム化している。
しかし、生成過程におけるこれらの2つのコンポーネント間の相互作用は未解明のままである。
本稿では,これらの成分の基礎となる勾配力学を解析し,重要な不安定性を同定する。
具体的には,確率勾配自体の時間的ゆらぎとともに,事前勾配方向と確率勾配方向の衝突を示す。
これらの不安定さが生成過程を阻害し,復元性能を損なうことを示す。
これらの問題に対処するため、我々は新しい勾配管理手法である安定化進行勾配拡散(SPGD)を提案する。
SPGDは次の2つの相乗的成分を統合する: (1) 勾配の対立を緩和するための漸進的至適なウォームアップ戦略、(2) 勾配のゆらぎを軽減するための適応方向運動量(ADM)。
多様な復元タスクにわたる広範囲な実験により、SPGDは生成安定性を著しく向上させ、定量測定における最先端のパフォーマンスと視覚的に優れた結果をもたらすことが示されている。
コードは \href{https://github.com/74587887/SPGD}{here} で公開されている。
関連論文リスト
- DCI: Dual-Conditional Inversion for Boosting Diffusion-Based Image Editing [73.12011187146481]
Diffusionモデル内のインバージョンは、実または生成された画像の潜時雑音表現を復元することを目的としている。
ほとんどの反転アプローチは、復元精度と編集の柔軟性の間の本質的にのトレードオフに悩まされている。
本稿ではDCI(Dual-Conditional Inversion)について紹介する。
論文 参考訳(メタデータ) (2025-06-03T07:46:44Z) - Harmonizing Intra-coherence and Inter-divergence in Ensemble Attacks for Adversarial Transferability [29.69932132116216]
逆変換性(HEAT)のためのハーモナイズド・アンサンブル法を提案する。
Heated Ensemble for Adversarial Transferabilityは、ドメインの一般化を初めて逆例生成に導入する。
実験の結果、HEATはさまざまなデータセットや設定で既存のメソッドを著しく上回ります。
論文 参考訳(メタデータ) (2025-05-02T10:17:33Z) - Aligning Foundation Model Priors and Diffusion-Based Hand Interactions for Occlusion-Resistant Two-Hand Reconstruction [50.952228546326516]
単眼画像からの両手再建は、複雑でダイナミックな手の位置や閉塞が原因で、永続的な課題に直面している。
既存のアプローチはそのようなアライメントの問題に悩まされ、しばしば不整合と侵入の成果物をもたらす。
本研究では,基礎モデルに基づく2次元先行モデルと拡散に基づく相互作用改善を組み込むことにより,手振りとインタラクションを正確に整合させる新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2025-03-22T14:42:27Z) - Mjolnir: Breaking the Shield of Perturbation-Protected Gradients via Adaptive Diffusion [13.764770382623812]
フェデレートラーニングにおける勾配摂動保護のシールドを破ろうとする試みについて紹介する。
摂動抵抗性勾配漏洩攻撃であるMjolnirを導入する。
Mjolnirは、オリジナルのモデル構造や外部データへのアクセスを必要とせずに、勾配から摂動を取り除くことができる。
論文 参考訳(メタデータ) (2024-07-07T07:06:49Z) - Boosting Visual Recognition in Real-world Degradations via Unsupervised Feature Enhancement Module with Deep Channel Prior [22.323789227447755]
霧、低照度、動きのぼかしは画像の品質を低下させ、自動運転の安全性を脅かす。
本研究は、劣化した視覚認識のための新しいDeep Channel Prior (DCP)を提案する。
これに基づいて、教師なし特徴補正を実現するために、新しいプラグアンドプレイunsupervised Feature Enhancement Module (UFEM)を提案する。
論文 参考訳(メタデータ) (2024-04-02T07:16:56Z) - Reti-Diff: Illumination Degradation Image Restoration with Retinex-based
Latent Diffusion Model [59.08821399652483]
照明劣化画像復元(IDIR)技術は、劣化した画像の視認性を改善し、劣化した照明の悪影響を軽減することを目的としている。
これらのアルゴリズムのうち、拡散モデル(DM)に基づく手法は期待できる性能を示しているが、画像レベルの分布を予測する際に、重い計算要求や画素の不一致の問題に悩まされることが多い。
我々は、コンパクトな潜在空間内でDMを活用して、簡潔な指導先を生成することを提案し、IDIRタスクのためのReti-Diffと呼ばれる新しいソリューションを提案する。
Reti-Diff は Retinex-based Latent DM (RLDM) と Retinex-Guided Transformer (RG) の2つの鍵成分からなる。
論文 参考訳(メタデータ) (2023-11-20T09:55:06Z) - PGDiff: Guiding Diffusion Models for Versatile Face Restoration via
Partial Guidance [65.5618804029422]
これまでの研究は、明示的な劣化モデルを用いて解空間を制限することで、注目すべき成功を収めてきた。
実世界の劣化に適応可能な新しい視点である部分的ガイダンスを導入することでPGDiffを提案する。
提案手法は,既存の拡散優先手法に勝るだけでなく,タスク固有モデルと良好に競合する。
論文 参考訳(メタデータ) (2023-09-19T17:51:33Z) - Cogradient Descent for Bilinear Optimization [124.45816011848096]
双線形問題に対処するために、CoGDアルゴリズム(Cogradient Descent Algorithm)を導入する。
一方の変数は、他方の変数との結合関係を考慮し、同期勾配降下をもたらす。
本アルゴリズムは,空間的制約下での1変数の問題を解くために応用される。
論文 参考訳(メタデータ) (2020-06-16T13:41:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。