論文の概要: Integrating Intermediate Layer Optimization and Projected Gradient Descent for Solving Inverse Problems with Diffusion Models
- arxiv url: http://arxiv.org/abs/2505.20789v1
- Date: Tue, 27 May 2025 06:49:02 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-28 17:05:58.456986
- Title: Integrating Intermediate Layer Optimization and Projected Gradient Descent for Solving Inverse Problems with Diffusion Models
- Title(参考訳): 拡散モデルを用いた逆問題解法における中間層最適化と予測勾配差の統合
- Authors: Yang Zheng, Wen Li, Zhaoqiang Liu,
- Abstract要約: 逆問題(IP)はノイズの観測から信号を再構成する。
これらの課題に対処するために,DMILOとDMILO-PGDという2つの新しい手法を提案する。
その結果,最先端手法よりも高い性能を示した。
- 参考スコア(独自算出の注目度): 24.745502021162878
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Inverse problems (IPs) involve reconstructing signals from noisy observations. Traditional approaches often rely on handcrafted priors, which can fail to capture the complexity of real-world data. The advent of pre-trained generative models has introduced new paradigms, offering improved reconstructions by learning rich priors from data. Among these, diffusion models (DMs) have emerged as a powerful framework, achieving remarkable reconstruction performance across numerous IPs. However, existing DM-based methods frequently encounter issues such as heavy computational demands and suboptimal convergence. In this work, building upon the idea of the recent work DMPlug~\cite{wang2024dmplug}, we propose two novel methods, DMILO and DMILO-PGD, to address these challenges. Our first method, DMILO, employs intermediate layer optimization (ILO) to alleviate the memory burden inherent in DMPlug. Additionally, by introducing sparse deviations, we expand the range of DMs, enabling the exploration of underlying signals that may lie outside the range of the diffusion model. We further propose DMILO-PGD, which integrates ILO with projected gradient descent (PGD), thereby reducing the risk of suboptimal convergence. We provide an intuitive theoretical analysis of our approach under appropriate conditions and validate its superiority through extensive experiments on diverse image datasets, encompassing both linear and nonlinear IPs. Our results demonstrate significant performance gains over state-of-the-art methods, highlighting the effectiveness of DMILO and DMILO-PGD in addressing common challenges in DM-based IP solvers.
- Abstract(参考訳): 逆問題(IP)はノイズの観測から信号を再構成する。
従来のアプローチは、しばしば手作りの先行技術に依存しており、実際のデータの複雑さを捉えるのに失敗する可能性がある。
事前学習された生成モデルの出現は新たなパラダイムを導入し、データからリッチな事前学習による再構築を改善した。
これらのうち、拡散モデル(DM)は強力なフレームワークとして登場し、多数のIP間での大幅な再構成性能を実現している。
しかし、既存のDMベースの手法では、重い計算要求や準最適収束といった問題に頻繁に遭遇する。
本研究では,近年のDMPlug~\cite{wang2024dmplug}のアイデアに基づいて,DMILOとDMILO-PGDという2つの新しい手法を提案する。
最初の方法であるDMILOでは、中間層最適化(ILO)を用いて、DMPlug固有のメモリ負荷を軽減する。
さらに、疎偏差を導入することにより、DMの範囲を広げ、拡散モデルの範囲外にある可能性のある基礎信号の探索を可能にする。
さらに, ILO と PGD を統合した DMILO-PGD を提案する。
線形IPと非線形IPの両方を包含する多種多様な画像データセットの広範な実験により、適切な条件下でのアプローチの直観的な理論的解析を行い、その優位性を検証する。
本研究は,DMILOとDMILO-PGDがDMベースIP解決器の共通課題に対処する上で有効であることを示すものである。
関連論文リスト
- Diffusion Models as Network Optimizers: Explorations and Analysis [71.69869025878856]
生成拡散モデル(GDM)は,ネットワーク最適化の新しいアプローチとして期待されている。
本研究ではまず,生成モデルの本質的な特徴について考察する。
本稿では,識別的ネットワーク最適化よりも生成モデルの利点を簡潔かつ直感的に示す。
論文 参考訳(メタデータ) (2024-11-01T09:05:47Z) - CoSIGN: Few-Step Guidance of ConSIstency Model to Solve General INverse Problems [3.3969056208620128]
我々は, 高い復元品質を維持しつつ, 推論ステップの境界を1-2 NFEに推し進めることを提案する。
本手法は拡散型逆問題解法における新しい最先端技術を実現する。
論文 参考訳(メタデータ) (2024-07-17T15:57:50Z) - Blind Inversion using Latent Diffusion Priors [10.427971517259316]
LatentDEMは、潜伏拡散先行法を用いて視覚的逆問題に対処する革新的な技術である。
一般的なフレームワークとして、LatentDEMは線形および非線形逆問題の両方をサポートする。
本研究では,LatentDEMの2次元ブラインド劣化と3次元スパースビュー再構成作業に対する性能評価を行った。
論文 参考訳(メタデータ) (2024-07-01T07:23:28Z) - PracticalDG: Perturbation Distillation on Vision-Language Models for Hybrid Domain Generalization [24.413415998529754]
本稿では,Hybrid Domain Generalization (HDG) と,アルゴリズムのロバスト性を評価するために,様々な分割を構成する新しい指標である$H2$-CVを提案する。
提案手法は,複数のデータセット上での最先端アルゴリズムよりも優れており,特にデータ不足に直面する場合のロバスト性の向上に寄与する。
論文 参考訳(メタデータ) (2024-04-13T13:41:13Z) - DiffClass: Diffusion-Based Class Incremental Learning [30.514281721324853]
クラスインクリメンタルラーニング(CIL)は破滅的な忘れが原因で困難である。
最近の例のないCIL手法は、過去のタスクデータを合成することによって破滅的な忘れを軽減しようとする。
そこで本研究では,これらの問題を克服するために,新しい非定型CIL法を提案する。
論文 参考訳(メタデータ) (2024-03-08T03:34:18Z) - Hierarchical Integration Diffusion Model for Realistic Image Deblurring [71.76410266003917]
拡散モデル (DM) は画像劣化に導入され, 有望な性能を示した。
本稿では,階層型統合拡散モデル(HI-Diff)を提案する。
人工的および実世界のぼかしデータセットの実験は、HI-Diffが最先端の手法より優れていることを示した。
論文 参考訳(メタデータ) (2023-05-22T12:18:20Z) - Boundary Guided Learning-Free Semantic Control with Diffusion Models [44.37803942479853]
凍結事前学習DDMを用いた効率的,効果的,軽量な意味制御のための境界拡散法を提案する。
我々はDPMアーキテクチャ(DDPM, iDDPM)とデータセット(CelebA, CelebA-HQ, LSUN-church, LSUN-bedroom, AFHQ-dog)を異なる解像度(64, 256)で広範な実験を行った。
論文 参考訳(メタデータ) (2023-02-16T15:21:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。