論文の概要: Holistic Dynamic Frequency Transformer for Image Fusion and Exposure Correction
- arxiv url: http://arxiv.org/abs/2309.01183v2
- Date: Sat, 3 Aug 2024 06:18:23 GMT
- ステータス: 処理完了
- システム内更新日: 2024-08-07 00:25:32.784299
- Title: Holistic Dynamic Frequency Transformer for Image Fusion and Exposure Correction
- Title(参考訳): 画像融合・露光補正のためのホロスティックダイナミック周波数変換器
- Authors: Xiaoke Shang, Gehui Li, Zhiying Jiang, Shaomin Zhang, Nai Ding, Jinyuan Liu,
- Abstract要約: 露出関連問題の修正は、画像の品質向上における重要な要素である。
本稿では、周波数領域を利用して露出補正タスクの処理を改善し、統一する新しい手法を提案する。
提案手法は, 露光補正においてより高度で統一された解を実現する方法である。
- 参考スコア(独自算出の注目度): 18.014481087171657
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The correction of exposure-related issues is a pivotal component in enhancing the quality of images, offering substantial implications for various computer vision tasks. Historically, most methodologies have predominantly utilized spatial domain recovery, offering limited consideration to the potentialities of the frequency domain. Additionally, there has been a lack of a unified perspective towards low-light enhancement, exposure correction, and multi-exposure fusion, complicating and impeding the optimization of image processing. In response to these challenges, this paper proposes a novel methodology that leverages the frequency domain to improve and unify the handling of exposure correction tasks. Our method introduces Holistic Frequency Attention and Dynamic Frequency Feed-Forward Network, which replace conventional correlation computation in the spatial-domain. They form a foundational building block that facilitates a U-shaped Holistic Dynamic Frequency Transformer as a filter to extract global information and dynamically select important frequency bands for image restoration. Complementing this, we employ a Laplacian pyramid to decompose images into distinct frequency bands, followed by multiple restorers, each tuned to recover specific frequency-band information. The pyramid fusion allows a more detailed and nuanced image restoration process. Ultimately, our structure unifies the three tasks of low-light enhancement, exposure correction, and multi-exposure fusion, enabling comprehensive treatment of all classical exposure errors. Benchmarking on mainstream datasets for these tasks, our proposed method achieves state-of-the-art results, paving the way for more sophisticated and unified solutions in exposure correction.
- Abstract(参考訳): 露出に関連する問題の修正は、画像の品質を高める上で重要な要素であり、様々なコンピュータビジョンタスクに重大な影響を及ぼす。
歴史的に、ほとんどの方法論は空間領域の回復を主に利用しており、周波数領域の可能性について限定的な考察がなされている。
さらに、低照度化、露光補正、マルチ露光融合に対する統一的な視点が欠如しており、画像処理の最適化を複雑にし妨げている。
本稿では,これらの課題に対応するために,周波数領域を利用して露出補正タスクの処理を改善し,統一する手法を提案する。
本手法では,空間領域における従来の相関計算に代えて,ホロスティック周波数注意と動的周波数フィードフォワードネットワークを導入する。
彼らはU字型のホロスティックダイナミック周波数変換器をフィルタとして構成し、グローバル情報を抽出し、画像復元のために重要な周波数帯域を動的に選択する。
補足することで、ラプラシアンピラミッドを用いて、画像を異なる周波数帯域に分解し、次いで複数の復調器を用いて特定の周波数帯域情報を復元する。
ピラミッド融合により、より詳細で微妙な画像復元プロセスが可能になる。
最終的に、我々の構造は、低照度化、露光補正、マルチ露光融合の3つのタスクを統一し、すべての古典的な露光誤差の包括的処理を可能にした。
これらのタスクの主流データセットをベンチマークし、提案手法は最先端の結果を達成し、露光補正におけるより高度で統一された解の道を開く。
関連論文リスト
- Unified Image Restoration and Enhancement: Degradation Calibrated Cycle Reconstruction Diffusion Model [8.713784455593778]
CycleRDMは、復元および拡張タスクを統合するために設計された新しいフレームワークである。
分解された領域、粗い正規領域、および正規領域の間の写像関係を学習する。
復元品質を向上させるため,分解ウェーブレット高周波領域の特徴ゲインモジュールを設計した。
論文 参考訳(メタデータ) (2024-12-19T08:33:33Z) - Multi-view Image Diffusion via Coordinate Noise and Fourier Attention [5.251293630298169]
本稿では,新しい注意機構と横断的注意損失を有する特徴の時間依存性空間周波数に対応する拡散過程を提案する。
本手法は,多視点整合性に対する他の最先端手法と比較して,定性的に優れた結果が得られる数種類の定量的指標を用いてSOTAを改良する。
論文 参考訳(メタデータ) (2024-12-04T22:49:40Z) - Multi-Scale Representation Learning for Image Restoration with State-Space Model [13.622411683295686]
効率的な画像復元のためのマルチスケール状態空間モデル(MS-Mamba)を提案する。
提案手法は,計算複雑性を低く保ちながら,新しい最先端性能を実現する。
論文 参考訳(メタデータ) (2024-08-19T16:42:58Z) - AdaIR: Adaptive All-in-One Image Restoration via Frequency Mining and Modulation [99.57024606542416]
周波数マイニングと変調に基づく適応的なオールインワン画像復元ネットワークを提案する。
我々のアプローチは、異なる周波数サブバンド上の画像内容に異なる劣化タイプが影響を及ぼすという観察によって動機付けられている。
提案モデルでは,入力劣化に応じて情報周波数サブバンドをアクセントすることで適応的再構成を実現する。
論文 参考訳(メタデータ) (2024-03-21T17:58:14Z) - Misalignment-Robust Frequency Distribution Loss for Image Transformation [51.0462138717502]
本稿では,画像強調や超解像といった深層学習に基づく画像変換手法における共通の課題に対処することを目的とする。
本稿では、周波数領域内における分布距離を計算するための、新しいシンプルな周波数分布損失(FDL)を提案する。
本手法は,周波数領域におけるグローバル情報の思慮深い活用により,トレーニング制約として実証的に有効であることが実証された。
論文 参考訳(メタデータ) (2024-02-28T09:27:41Z) - A Dual Domain Multi-exposure Image Fusion Network based on the
Spatial-Frequency Integration [57.14745782076976]
マルチ露光画像融合は、異なる露光で画像を統合することにより、単一の高ダイナミック画像を生成することを目的としている。
本稿では,MEF-SFI と呼ばれる空間周波数統合フレームワークによるマルチ露光画像融合の新たな視点を提案する。
提案手法は,最先端のマルチ露光画像融合手法に対する視覚的近似核融合結果を実現する。
論文 参考訳(メタデータ) (2023-12-17T04:45:15Z) - Mutual Information-driven Triple Interaction Network for Efficient Image
Dehazing [54.168567276280505]
画像デハージングのための相互情報駆動型トリプルインタラクションネットワーク(MITNet)を提案する。
振幅誘導ヘイズ除去と呼ばれる第1段階は、ヘイズ除去のためのヘイズ画像の振幅スペクトルを復元することを目的としている。
第2段階は位相誘導構造が洗練され、位相スペクトルの変換と微細化を学ぶことに尽力した。
論文 参考訳(メタデータ) (2023-08-14T08:23:58Z) - Gated Multi-Resolution Transfer Network for Burst Restoration and
Enhancement [75.25451566988565]
低画質の原画像のバーストから空間的精度の高い高画質画像を再構成する新しいGated Multi-Resolution Transfer Network (GMTNet)を提案する。
5つのデータセットに関する詳細な実験分析は、我々のアプローチを検証し、バースト超解像、バーストデノイング、低照度バーストエンハンスメントのための最先端技術を設定する。
論文 参考訳(メタデータ) (2023-04-13T17:54:00Z) - Focal Frequency Loss for Image Reconstruction and Synthesis [125.7135706352493]
周波数領域の狭さが画像再構成と合成品質をさらに改善できることを示す。
本稿では,合成が難しい周波数成分に適応的に焦点を合わせることのできる,新しい焦点周波数損失を提案する。
論文 参考訳(メタデータ) (2020-12-23T17:32:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。