論文の概要: Extreme Blind Image Restoration via Prompt-Conditioned Information Bottleneck
- arxiv url: http://arxiv.org/abs/2510.00728v1
- Date: Wed, 01 Oct 2025 10:13:27 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-03 16:59:20.505554
- Title: Extreme Blind Image Restoration via Prompt-Conditioned Information Bottleneck
- Title(参考訳): Prompt-Conditioned Information Bottleneckによる極端ブラインド画像復元
- Authors: Hongeun Kim, Bryan Sangwoo Kim, Jong Chul Ye,
- Abstract要約: ブラインド画像復元法(BIR)は目覚ましい成果を上げたが, EBIR(Extreme Blind Image Restoration)に直面するとフェールした。
本稿では,難解なELQ-to-HQ復元プロセスを分解する新しいフレームワークを提案する。
- 参考スコア(独自算出の注目度): 47.027290803102666
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Blind Image Restoration (BIR) methods have achieved remarkable success but falter when faced with Extreme Blind Image Restoration (EBIR), where inputs suffer from severe, compounded degradations beyond their training scope. Directly learning a mapping from extremely low-quality (ELQ) to high-quality (HQ) images is challenging due to the massive domain gap, often leading to unnatural artifacts and loss of detail. To address this, we propose a novel framework that decomposes the intractable ELQ-to-HQ restoration process. We first learn a projector that maps an ELQ image onto an intermediate, less-degraded LQ manifold. This intermediate image is then restored to HQ using a frozen, off-the-shelf BIR model. Our approach is grounded in information theory; we provide a novel perspective of image restoration as an Information Bottleneck problem and derive a theoretically-driven objective to train our projector. This loss function effectively stabilizes training by balancing a low-quality reconstruction term with a high-quality prior-matching term. Our framework enables Look Forward Once (LFO) for inference-time prompt refinement, and supports plug-and-play strengthening of existing image restoration models without need for finetuning. Extensive experiments under severe degradation regimes provide a thorough analysis of the effectiveness of our work.
- Abstract(参考訳): ブラインド画像復元法(Blind Image Restoration, BIR)は, トレーニング範囲を超えて重度の複合劣化に苦しむEBIR(Extreme Blind Image Restoration, EBIR)に直面すると, 目覚ましい成功を収めた。
極めて低品質(ELQ)から高品質(HQ)イメージへのマッピングを直接学習することは、ドメインのギャップが大きいため、しばしば不自然なアーティファクトや詳細の喪失につながるため、難しい。
そこで本研究では,難解なELQ-to-HQ復元プロセスを分解する新しいフレームワークを提案する。
まず、ELQ画像を中間劣化の少ないLQ多様体にマッピングするプロジェクタを学習する。
この中間画像は、凍結した市販のBIRモデルを使用して本社に復元される。
提案手法は情報理論に基づいており,情報ボトルネック問題としての画像復元の新たな視点を提供し,プロジェクタを訓練する理論的目的を導出する。
この損失関数は、高品質の事前マッチング項と低品質の再構成項のバランスをとることにより、トレーニングを効果的に安定化させる。
我々のフレームワークは、推測時即時改善のためのLook Forward Once(LFO)を可能にし、微調整を必要とせずに既存の画像復元モデルのプラグアンドプレイ強化をサポートする。
過酷な劣化体制下での大規模な実験は、我々の研究の有効性を徹底的に分析する。
関連論文リスト
- Diff-Restorer: Unleashing Visual Prompts for Diffusion-based Universal Image Restoration [19.87693298262894]
拡散モデルに基づく普遍的な画像復元手法であるDiff-Restorerを提案する。
我々は、事前学習された視覚言語モデルを用いて、劣化した画像から視覚的プロンプトを抽出する。
また、デグレーション対応デコーダを設計し、構造的補正を行い、潜在コードをピクセル領域に変換する。
論文 参考訳(メタデータ) (2024-07-04T05:01:10Z) - SSP-IR: Semantic and Structure Priors for Diffusion-based Realistic Image Restoration [20.873676111265656]
SSP-IRは、低画質の画像からセマンティックと構造をフル活用することを目的としている。
提案手法は,合成および実世界のデータセットにおいて,他の最先端手法よりも優れる。
論文 参考訳(メタデータ) (2024-07-04T04:55:14Z) - Photo-Realistic Image Restoration in the Wild with Controlled Vision-Language Models [14.25759541950917]
この研究は、能動的視覚言語モデルと合成分解パイプラインを活用して、野生(ワイルドIR)における画像復元を学習する。
我々の基底拡散モデルは画像復元SDE(IR-SDE)である。
論文 参考訳(メタデータ) (2024-04-15T12:34:21Z) - LIR: A Lightweight Baseline for Image Restoration [4.187190284830909]
画像復元作業の本質的な特徴は、多くの作品で見落とされがちである。
LIRと呼ばれる画像復元のための軽量ベースラインネットワークを提案し、画像の効率よく復元し、劣化を除去する。
我々のLIRは、Pak Signal-to-Noise Ratio (PSNR)における最先端構造類似度指標(SSIM)および最先端モデルに匹敵する性能を達成する。
論文 参考訳(メタデータ) (2024-02-02T12:39:47Z) - InstructIR: High-Quality Image Restoration Following Human Instructions [61.1546287323136]
本稿では,人間の手書きによる画像復元モデルを導出する手法を提案する。
InstructIRという手法は、いくつかの修復作業において最先端の結果を得る。
論文 参考訳(メタデータ) (2024-01-29T18:53:33Z) - All-in-one Multi-degradation Image Restoration Network via Hierarchical
Degradation Representation [47.00239809958627]
我々は新しいオールインワン・マルチデグレーション画像復元ネットワーク(AMIRNet)を提案する。
AMIRNetは、クラスタリングによって木構造を段階的に構築することで、未知の劣化画像の劣化表現を学習する。
この木構造表現は、様々な歪みの一貫性と不一致を明示的に反映しており、画像復元の具体的な手がかりとなっている。
論文 参考訳(メタデータ) (2023-08-06T04:51:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。