論文の概要: LatentINDIGO: An INN-Guided Latent Diffusion Algorithm for Image Restoration
- arxiv url: http://arxiv.org/abs/2505.12935v1
- Date: Mon, 19 May 2025 10:17:16 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-20 14:57:11.533184
- Title: LatentINDIGO: An INN-Guided Latent Diffusion Algorithm for Image Restoration
- Title(参考訳): LatentINDIGO:画像復元のためのNN誘導遅延拡散アルゴリズム
- Authors: Di You, Daniel Siromani, Pier Luigi Dragotti,
- Abstract要約: 本研究では,ウェーブレットにインスパイアされたインバータブルニューラルネットワーク(INN)を導入し,フォワード変換により劣化をシミュレートし,逆変換により失われた詳細を再構成する。
提案アルゴリズムは, 合成および実世界の低画質画像に対して, 最先端の性能を達成し, 任意の出力サイズに容易に適応できる。
- 参考スコア(独自算出の注目度): 19.74964267336191
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: There is a growing interest in the use of latent diffusion models (LDMs) for image restoration (IR) tasks due to their ability to model effectively the distribution of natural images. While significant progress has been made, there are still key challenges that need to be addressed. First, many approaches depend on a predefined degradation operator, making them ill-suited for complex or unknown degradations that deviate from standard analytical models. Second, many methods struggle to provide a stable guidance in the latent space and finally most methods convert latent representations back to the pixel domain for guidance at every sampling iteration, which significantly increases computational and memory overhead. To overcome these limitations, we introduce a wavelet-inspired invertible neural network (INN) that simulates degradations through a forward transform and reconstructs lost details via the inverse transform. We further integrate this design into a latent diffusion pipeline through two proposed approaches: LatentINDIGO-PixelINN, which operates in the pixel domain, and LatentINDIGO-LatentINN, which stays fully in the latent space to reduce complexity. Both approaches alternate between updating intermediate latent variables under the guidance of our INN and refining the INN forward model to handle unknown degradations. In addition, a regularization step preserves the proximity of latent variables to the natural image manifold. Experiments demonstrate that our algorithm achieves state-of-the-art performance on synthetic and real-world low-quality images, and can be readily adapted to arbitrary output sizes.
- Abstract(参考訳): 自然画像の分布を効果的にモデル化する能力により、画像復元(IR)タスクに潜時拡散モデル(LDM)を使用することへの関心が高まっている。
かなりの進展があったが、対処すべき重要な課題がまだ残っている。
第一に、多くのアプローチは事前に定義された分解作用素に依存しており、標準的な解析モデルから逸脱する複素あるいは未知の分解に不適である。
第二に、多くのメソッドは遅延空間で安定したガイダンスを提供するのに苦労し、最終的にほとんどのメソッドは、遅延表現をサンプリングイテレーション毎に画素領域に変換し、計算とメモリのオーバーヘッドを大幅に増加させる。
これらの制限を克服するために、ウェーブレットにインスパイアされたインバータブルニューラルネットワーク(INN)を導入し、フォワード変換によって劣化をシミュレートし、逆変換によって失われた詳細を再構築する。
さらに、この設計を、ピクセルドメインで動作するLatntINDIGO-PixelINNと、複雑性を低減するために潜在空間に完全に留まるLatntINDIGO-LatentINNの2つのアプローチにより、潜在拡散パイプラインに統合する。
どちらのアプローチも、我々の INN の指導の下で中間潜伏変数を更新することと、未知の劣化を処理するために INN のフォワードモデルを洗練することとを交互に行う。
さらに、正規化ステップは、自然像多様体への潜伏変数の近接を保存する。
実験により, 合成および実世界の低画質画像に対して, 最先端の性能を達成し, 任意の出力サイズに容易に適応できることが実証された。
関連論文リスト
- INDIGO+: A Unified INN-Guided Probabilistic Diffusion Algorithm for Blind and Non-Blind Image Restoration [22.19661915697775]
非盲点画像復元のための新しい INN 誘導確率拡散アルゴリズムを提案する。
INDIGOとBlindINDIGOは、非可逆ニューラルネットワーク(INN)の完全な再構成特性と、事前訓練された拡散モデルの強力な生成能力の利点を組み合わせている。
論文 参考訳(メタデータ) (2025-01-23T18:51:52Z) - Effective Diffusion Transformer Architecture for Image Super-Resolution [63.254644431016345]
画像超解像のための効果的な拡散変換器(DiT-SR)を設計する。
実際には、DiT-SRは全体のU字型アーキテクチャを活用し、すべての変圧器ブロックに対して均一な等方性設計を採用する。
我々は、広く使われているAdaLNの制限を分析し、周波数適応型時間-ステップ条件付けモジュールを提案する。
論文 参考訳(メタデータ) (2024-09-29T07:14:16Z) - Bidirectional Consistency Models [1.486435467709869]
拡散モデル(DM)は、ランダムなベクトルを反復的に認知することで、驚くほど高品質なサンプルを生成することができる。
DMはまた、確率フロー常微分方程式(PF ODE)に沿って後方に移動することにより、入力画像から雑音への逆変換も可能である。
論文 参考訳(メタデータ) (2024-03-26T18:40:36Z) - Distance Weighted Trans Network for Image Completion [52.318730994423106]
本稿では,DWT(Distance-based Weighted Transformer)を利用した画像コンポーネント間の関係をよりよく理解するためのアーキテクチャを提案する。
CNNは、粗い事前の局所的なテクスチャ情報を強化するために使用される。
DWTブロックは、特定の粗いテクスチャやコヒーレントな視覚構造を復元するために使用される。
論文 参考訳(メタデータ) (2023-10-11T12:46:11Z) - INDigo: An INN-Guided Probabilistic Diffusion Algorithm for Inverse
Problems [31.693710075183844]
一般逆問題に対する非可逆ニューラルネットワーク(INN)と拡散モデルを組み合わせた手法を提案する。
具体的には、任意の劣化過程をシミュレートするためにINNの前方処理を訓練し、逆処理を再構成プロセスとして使用する。
本アルゴリズムは, 劣化過程で失われる詳細を効果的に推定し, 劣化モデルのクローズドフォーム表現を知る必要により, もはや制限されない。
論文 参考訳(メタデータ) (2023-06-05T15:14:47Z) - Deep network series for large-scale high-dynamic range imaging [2.3759432635713895]
本稿では,大規模高ダイナミックレンジイメージングのための新しい手法を提案する。
ディープニューラルネットワーク(DNN)で訓練されたエンドツーエンドは、ほぼ瞬時に線形逆イメージング問題を解くことができる。
代替のPlug-and-Playアプローチは、高ダイナミックレンジの課題に対処する上で有効であるが、高度に反復的なアルゴリズムに依存している。
論文 参考訳(メタデータ) (2022-10-28T11:13:41Z) - Deep Variational Network Toward Blind Image Restoration [60.45350399661175]
ブラインド画像復元はコンピュータビジョンでは一般的だが難しい問題である。
両利点を両立させることを目的として,新しいブラインド画像復元手法を提案する。
画像デノイングと超解像という2つの典型的なブラインド赤外線タスクの実験により,提案手法が現状よりも優れた性能を達成できることが実証された。
論文 参考訳(メタデータ) (2020-08-25T03:30:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。