Fugu-MT 論文翻訳(概要): Unified Image Restoration and Enhancement: Degradation Calibrated Cycle Reconstruction Diffusion Model

論文の概要: Unified Image Restoration and Enhancement: Degradation Calibrated Cycle Reconstruction Diffusion Model

arxiv url: http://arxiv.org/abs/2412.14630v1
Date: Thu, 19 Dec 2024 08:33:33 GMT
ステータス: 翻訳完了
システム内更新日: 2024-12-20 18:44:16.058632
Title: Unified Image Restoration and Enhancement: Degradation Calibrated Cycle Reconstruction Diffusion Model
Title（参考訳）: 統一画像復元と拡張:劣化校正サイクル再構成拡散モデル
Authors: Minglong Xue, Jinhong He, Shivakumara Palaiahnakote, Mingliang Zhou,
Abstract要約: CycleRDMは、復元および拡張タスクを統合するために設計された新しいフレームワークである。分解された領域、粗い正規領域、および正規領域の間の写像関係を学習する。復元品質を向上させるため,分解ウェーブレット高周波領域の特徴ゲインモジュールを設計した。
参考スコア（独自算出の注目度）: 8.713784455593778
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Image restoration and enhancement are pivotal for numerous computer vision applications, yet unifying these tasks efficiently remains a significant challenge. Inspired by the iterative refinement capabilities of diffusion models, we propose CycleRDM, a novel framework designed to unify restoration and enhancement tasks while achieving high-quality mapping. Specifically, CycleRDM first learns the mapping relationships among the degraded domain, the rough normal domain, and the normal domain through a two-stage diffusion inference process. Subsequently, we transfer the final calibration process to the wavelet low-frequency domain using discrete wavelet transform, performing fine-grained calibration from a frequency domain perspective by leveraging task-specific frequency spaces. To improve restoration quality, we design a feature gain module for the decomposed wavelet high-frequency domain to eliminate redundant features. Additionally, we employ multimodal textual prompts and Fourier transform to drive stable denoising and reduce randomness during the inference process. After extensive validation, CycleRDM can be effectively generalized to a wide range of image restoration and enhancement tasks while requiring only a small number of training samples to be significantly superior on various benchmarks of reconstruction quality and perceptual quality. The source code will be available at https://github.com/hejh8/CycleRDM.
Abstract（参考訳）: 画像の復元と強化は多くのコンピュータビジョンアプリケーションにおいて重要な役割を担っているが、これらのタスクを効率的に統合することは大きな課題である。拡散モデルの反復改善能力に触発されて,高品質なマッピングを実現するとともに,復元・拡張タスクを統一する新しいフレームワークであるCycleRDMを提案する。具体的には、CycleRDMは2段階拡散推論プロセスを通じて、劣化した領域、荒れた正規領域、および正常領域間のマッピング関係を学習する。その後、離散ウェーブレット変換を用いて、最終的なキャリブレーション処理をウェーブレット低周波領域に転送し、タスク固有の周波数空間を利用して、周波数領域の観点からきめ細かいキャリブレーションを行う。復元品質を向上させるため,分解ウェーブレット高周波領域の機能ゲインモジュールを設計し,冗長な特徴を排除した。さらに,マルチモーダルテキストプロンプトとフーリエ変換を用いて,安定な復調と推論過程におけるランダムさの低減を図る。広範囲の検証を経て、CycleRDMは画像復元および拡張タスクに効果的に一般化でき、少数のトレーニングサンプルだけで、再構成品質と知覚品質の様々なベンチマークよりも大幅に優れている。ソースコードはhttps://github.com/hejh8/CycleRDMで入手できる。

関連論文リスト

SFP: Real-World Scene Recovery Using Spatial and Frequency Priors [84.27251794411673]
シーンリカバリは様々なコンピュータビジョンアプリケーションにとって重要なタスクである。本研究では,現実のシーンを再現するための空間的・周波数的優先度(SFP)を提案する。
論文参考訳（メタデータ） (2025-12-09T05:24:25Z)
High-Frequency First: A Two-Stage Approach for Improving Image INR [13.070432644808806]
Implicit Neural Representations (INR) は、従来のピクセルベースのフォーマットに代わる強力な代替手段として登場した。重要な課題は、ニューラルネットワークのスペクトルバイアスであり、高周波の詳細を捉えるのに苦労しながら、低周波成分を好む傾向がある。隣接するソフトマスクは,局所的な変化が強い画素に対して,高い重みを適応的に割り当てる2段階のトレーニング戦略を導入する。
論文参考訳（メタデータ） (2025-08-21T13:56:36Z)
Global Modeling Matters: A Fast, Lightweight and Effective Baseline for Efficient Image Restoration [9.2933763571933]
Pyramid Wavelet-Fourier Network (PW-FNet)は、画像復元のための効率的な修復ベースラインである。 PW-FNetはマルチ・インプット・マルチ出力構造を備え、マルチスケール・マルチ周波数帯域分解を実現する。画像劣化, 雨滴除去, 画像超解像, モーションデブリ, 水中/低照度化などの課題の実験により, PW-FNetは修復品質の最先端の手法を超越するだけでなく, 優れた効率性が得られることが示された。
論文参考訳（メタデータ） (2025-07-18T05:15:04Z)
Image Restoration via Multi-domain Learning [8.909636477353695]
マルチドメイン学習をTransformerに統合する新しい復元フレームワークを提案する。具体的には、Token Mixerにおいて、局所領域-グローバル多受容場モデリングを容易にするSpatial-Wavelet-Fourierマルチドメイン構造を提案する。フィードフォワードネットワークでは,異なる解像度でマルチドメイン機能を融合するために,マルチスケール学習を取り入れている。
論文参考訳（メタデータ） (2025-05-07T04:14:51Z)
Wavelet-Driven Masked Image Modeling: A Path to Efficient Visual Representation [27.576174611043367]
Masked Image Modeling (MIM)は、下流タスクに適したスケーラブルな視覚表現を学習する能力のおかげで、自己教師付き学習において大きな注目を集めている。しかし、画像は本質的に冗長な情報を含んでいるため、画素ベースのMIM再構成プロセスはテクスチャなどの細部に過度に集中し、不要なトレーニング時間を延ばすことになる。本研究では,MIMの学習過程を高速化するために,ウェーブレット変換を効率的な表現学習のツールとして活用する。
論文参考訳（メタデータ） (2025-03-02T08:11:26Z)
AdaIR: Adaptive All-in-One Image Restoration via Frequency Mining and Modulation [99.57024606542416]
周波数マイニングと変調に基づく適応的なオールインワン画像復元ネットワークを提案する。我々のアプローチは、異なる周波数サブバンド上の画像内容に異なる劣化タイプが影響を及ぼすという観察によって動機付けられている。提案モデルでは,入力劣化に応じて情報周波数サブバンドをアクセントすることで適応的再構成を実現する。
論文参考訳（メタデータ） (2024-03-21T17:58:14Z)
Deep Equilibrium Diffusion Restoration with Parallel Sampling [120.15039525209106]
拡散モデルに基づく画像復元(IR)は、拡散モデルを用いて劣化した画像から高品質な(本社)画像を復元し、有望な性能を達成することを目的としている。既存のほとんどの手法では、HQイメージをステップバイステップで復元するために長いシリアルサンプリングチェーンが必要であるため、高価なサンプリング時間と高い計算コストがかかる。本研究では,拡散モデルに基づくIRモデルを異なる視点,すなわちDeqIRと呼ばれるDeQ(Deep equilibrium)固定点系で再考することを目的とする。
論文参考訳（メタデータ） (2023-11-20T08:27:56Z)
Holistic Dynamic Frequency Transformer for Image Fusion and Exposure Correction [18.014481087171657]
露出関連問題の修正は、画像の品質向上における重要な要素である。本稿では、周波数領域を利用して露出補正タスクの処理を改善し、統一する新しい手法を提案する。提案手法は, 露光補正においてより高度で統一された解を実現する方法である。
論文参考訳（メタデータ） (2023-09-03T14:09:14Z)
Gated Multi-Resolution Transfer Network for Burst Restoration and Enhancement [75.25451566988565]
低画質の原画像のバーストから空間的精度の高い高画質画像を再構成する新しいGated Multi-Resolution Transfer Network (GMTNet)を提案する。 5つのデータセットに関する詳細な実験分析は、我々のアプローチを検証し、バースト超解像、バーストデノイング、低照度バーストエンハンスメントのための最先端技術を設定する。
論文参考訳（メタデータ） (2023-04-13T17:54:00Z)
Residual Multiplicative Filter Networks for Multiscale Reconstruction [24.962697695403037]
我々は,学習した再構成の周波数サポートをきめ細かな制御で粗大な最適化を可能にする,新しい座標ネットワークアーキテクチャとトレーニング手法を提案する。これらの修正によって、自然画像への粗大なフィッティングのマルチスケール最適化が実現されることを示す。次に, 単粒子Creo-EM再構成問題に対する合成データセットのモデル評価を行った。
論文参考訳（メタデータ） (2022-06-01T20:16:28Z)
Denoising Diffusion Restoration Models [110.1244240726802]
Denoising Diffusion Restoration Models (DDRM) は効率的で教師なしの後方サンプリング手法である。 DDRMの汎用性を、超高解像度、デブロアリング、インペイント、カラー化のためにいくつかの画像データセットに示す。
論文参考訳（メタデータ） (2022-01-27T20:19:07Z)
FreqNet: A Frequency-domain Image Super-Resolution Network with Dicrete Cosine Transform [16.439669339293747]
単一画像超解像(SISR)は低分解能(LR)入力から高分解能(HR)出力を得ることを目的とした不適切な問題である。高ピーク信号-雑音比(PSNR)の結果にもかかわらず、モデルが望まれる高周波の詳細を正しく付加するかどうかを判断することは困難である。本稿では、周波数領域の観点から直感的なパイプラインであるFreqNetを提案し、この問題を解決する。
論文参考訳（メタデータ） (2021-11-21T11:49:12Z)
Fourier Space Losses for Efficient Perceptual Image Super-Resolution [131.50099891772598]
提案した損失関数の適用のみで,最近導入された効率的なジェネレータアーキテクチャの性能向上が可能であることを示す。フーリエ空間における周波数に対する損失の直接的強調は知覚的画質を著しく向上させることを示す。訓練されたジェネレータは、最先端の知覚的SR法である RankSRGAN と SRFlow よりも2.4倍、48倍高速である。
論文参考訳（メタデータ） (2021-06-01T20:34:52Z)
Focal Frequency Loss for Image Reconstruction and Synthesis [125.7135706352493]
周波数領域の狭さが画像再構成と合成品質をさらに改善できることを示す。本稿では,合成が難しい周波数成分に適応的に焦点を合わせることのできる,新しい焦点周波数損失を提案する。
論文参考訳（メタデータ） (2020-12-23T17:32:04Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。