論文の概要: FAPE-IR: Frequency-Aware Planning and Execution Framework for All-in-One Image Restoration
- arxiv url: http://arxiv.org/abs/2511.14099v1
- Date: Tue, 18 Nov 2025 03:33:10 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-19 16:23:52.910612
- Title: FAPE-IR: Frequency-Aware Planning and Execution Framework for All-in-One Image Restoration
- Title(参考訳): FAPE-IR:オールインワン画像復元のための周波数対応計画・実行フレームワーク
- Authors: Jingren Liu, Shuning Xu, Qirui Yang, Yun Wang, Xiangyu Chen, Zhong Ji,
- Abstract要約: 画像復元のための周波数対応計画・実行フレームワークであるFAPE-IRを提案する。
凍結したMultimodal Large Language Model (MLLM) をプランナーとして使用し、劣化した画像を解析し、簡潔で周波数対応の復元計画を生成する。
FAPE-IRは、セマンティックプランニングと周波数ベースの復元を結合することにより、オールインワン画像復元のための統一的で解釈可能なソリューションを提供する。
- 参考スコア(独自算出の注目度): 29.26604058624955
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: All-in-One Image Restoration (AIO-IR) aims to develop a unified model that can handle multiple degradations under complex conditions. However, existing methods often rely on task-specific designs or latent routing strategies, making it hard to adapt to real-world scenarios with various degradations. We propose FAPE-IR, a Frequency-Aware Planning and Execution framework for image restoration. It uses a frozen Multimodal Large Language Model (MLLM) as a planner to analyze degraded images and generate concise, frequency-aware restoration plans. These plans guide a LoRA-based Mixture-of-Experts (LoRA-MoE) module within a diffusion-based executor, which dynamically selects high- or low-frequency experts, complemented by frequency features of the input image. To further improve restoration quality and reduce artifacts, we introduce adversarial training and a frequency regularization loss. By coupling semantic planning with frequency-based restoration, FAPE-IR offers a unified and interpretable solution for all-in-one image restoration. Extensive experiments show that FAPE-IR achieves state-of-the-art performance across seven restoration tasks and exhibits strong zero-shot generalization under mixed degradations.
- Abstract(参考訳): All-in-One Image Restoration (AIO-IR) は複雑な条件下で複数の劣化を処理できる統一モデルを開発することを目的としている。
しかし、既存の手法はしばしばタスク固有の設計や潜時ルーティング戦略に依存しており、様々な劣化を伴う現実のシナリオに適応することが困難である。
画像復元のための周波数対応計画・実行フレームワークであるFAPE-IRを提案する。
凍結したMultimodal Large Language Model (MLLM) をプランナーとして使用し、劣化した画像を解析し、簡潔で周波数対応の復元計画を生成する。
これらの計画は、拡散ベースのエグゼキュータ内でLoRAベースのMixture-of-Experts (LoRA-MoE)モジュールをガイドし、入力画像の周波数特徴によって補完される高頻度または低周波の専門家を動的に選択する。
修復品質をさらに向上させ, 工芸品の削減を図るため, 対向訓練と周波数正規化損失を導入する。
FAPE-IRは、セマンティックプランニングと周波数ベースの復元を結合することにより、オールインワン画像復元のための統一的で解釈可能なソリューションを提供する。
大規模な実験により,FAPE-IRは7つの修復作業にまたがって最先端の性能を達成し,混合劣化下では強いゼロショット一般化を示すことが示された。
関連論文リスト
- Learning to Restore Multi-Degraded Images via Ingredient Decoupling and Task-Aware Path Adaptation [51.10017611491389]
現実のイメージは、雨、騒音、ヘイズのような複数の共存する劣化に悩まされることが多い。
本稿では, 劣化成分の分解表現を利用して, 画像の再構成を行う適応型多重劣化画像復元ネットワークを提案する。
その結果、IMDNetと呼ばれる密に統合されたアーキテクチャは、実験を通じて広範囲に検証されている。
論文 参考訳(メタデータ) (2025-11-07T01:50:36Z) - UniLDiff: Unlocking the Power of Diffusion Priors for All-in-One Image Restoration [16.493990086330985]
UniLDiffは、デグレッションとディテールを意識したメカニズムで強化された統合フレームワークである。
劣化認識機能融合(DAFF:Degradation-Aware Feature Fusion)を導入し,低品質機能を各段階に動的に注入する。
また,Detail-Aware Expert Module (DAEM) をデコーダ内に設計し,テクスチャと微細構造の回復性を高める。
論文 参考訳(メタデータ) (2025-07-31T16:02:00Z) - UniRes: Universal Image Restoration for Complex Degradations [53.74404005987783]
実世界のイメージ復元は、様々なキャプチャ条件、キャプチャデバイス、後処理パイプラインから生じるさまざまな劣化によって妨げられている。
UniResという名前の、シンプルで柔軟な拡散ベースのフレームワークは、このような劣化をエンドツーエンドで解決するために提案されている。
提案手法は, 複合劣化画像復元データセットと単分解画像復元データセットの両方を用いて評価する。
論文 参考訳(メタデータ) (2025-06-05T21:25:39Z) - DPMambaIR: All-in-One Image Restoration via Degradation-Aware Prompt State Space Model [52.44931846016603]
DPMambaIRは新しいオールインワン画像復元フレームワークで、微細な分解抽出器と劣化を意識した状態空間モデルを導入している。
DPMambaIRは、PSNRとSSIMでそれぞれ27.69dBと0.893の最高性能を達成している。
論文 参考訳(メタデータ) (2025-04-24T16:46:32Z) - Mixed Degradation Image Restoration via Local Dynamic Optimization and Conditional Embedding [67.57487747508179]
マルチインワン画像復元 (IR) は, 一つのモデルで全ての種類の劣化画像復元を処理し, 大幅な進歩を遂げている。
本稿では,単一と混合の分解で画像を効果的に復元できる新しいマルチインワンIRモデルを提案する。
論文 参考訳(メタデータ) (2024-11-25T09:26:34Z) - LoRA-IR: Taming Low-Rank Experts for Efficient All-in-One Image Restoration [62.3751291442432]
高速なオールインワン画像復元を実現するために,コンパクトな低ランクの専門家を動的に活用する,フレキシブルなフレームワークであるLoRA-IRを提案する。
LoRA-IRは、劣化誘導前訓練とパラメータ効率の良い微調整の2つの訓練段階で構成されている。
実験により、LoRA-IRは計算効率を維持しつつ、14のIRタスクと29のベンチマークでSOTA性能を達成することが示された。
論文 参考訳(メタデータ) (2024-10-20T13:00:24Z) - UIR-LoRA: Achieving Universal Image Restoration through Multiple Low-Rank Adaptation [50.27688690379488]
既存の統合手法は、マルチタスク学習問題として、多重劣化画像復元を扱う。
本稿では,複数のローランクアダプタ(LoRA)をベースとした汎用画像復元フレームワークを提案する。
本フレームワークは, 学習前の生成モデルを多段劣化復元のための共有コンポーネントとして利用し, 特定の劣化画像復元タスクに転送する。
論文 参考訳(メタデータ) (2024-09-30T11:16:56Z) - Photo-Realistic Image Restoration in the Wild with Controlled Vision-Language Models [14.25759541950917]
この研究は、能動的視覚言語モデルと合成分解パイプラインを活用して、野生(ワイルドIR)における画像復元を学習する。
我々の基底拡散モデルは画像復元SDE(IR-SDE)である。
論文 参考訳(メタデータ) (2024-04-15T12:34:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。