論文の概要: Holistic Dynamic Frequency Transformer for Image Fusion and Exposure
Correction
- arxiv url: http://arxiv.org/abs/2309.01183v1
- Date: Sun, 3 Sep 2023 14:09:14 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-06 20:51:54.608597
- Title: Holistic Dynamic Frequency Transformer for Image Fusion and Exposure
Correction
- Title(参考訳): 画像融合・露光補正のためのホロスティックダイナミック周波数変換器
- Authors: Xiaoke Shang, Gehui Li, Zhiying Jiang, Shaomin Zhang, Nai Ding,
Jinyuan Liu
- Abstract要約: 露出関連問題の修正は、画像の品質向上における重要な要素である。
本稿では、周波数領域を利用して露出補正タスクの処理を改善し、統一する新しい手法を提案する。
提案手法は, 露光補正においてより高度で統一された解を実現する方法である。
- 参考スコア(独自算出の注目度): 19.088429172840428
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The correction of exposure-related issues is a pivotal component in enhancing
the quality of images, offering substantial implications for various computer
vision tasks. Historically, most methodologies have predominantly utilized
spatial domain recovery, offering limited consideration to the potentialities
of the frequency domain. Additionally, there has been a lack of a unified
perspective towards low-light enhancement, exposure correction, and
multi-exposure fusion, complicating and impeding the optimization of image
processing. In response to these challenges, this paper proposes a novel
methodology that leverages the frequency domain to improve and unify the
handling of exposure correction tasks. Our method introduces Holistic Frequency
Attention and Dynamic Frequency Feed-Forward Network, which replace
conventional correlation computation in the spatial-domain. They form a
foundational building block that facilitates a U-shaped Holistic Dynamic
Frequency Transformer as a filter to extract global information and dynamically
select important frequency bands for image restoration. Complementing this, we
employ a Laplacian pyramid to decompose images into distinct frequency bands,
followed by multiple restorers, each tuned to recover specific frequency-band
information. The pyramid fusion allows a more detailed and nuanced image
restoration process. Ultimately, our structure unifies the three tasks of
low-light enhancement, exposure correction, and multi-exposure fusion, enabling
comprehensive treatment of all classical exposure errors. Benchmarking on
mainstream datasets for these tasks, our proposed method achieves
state-of-the-art results, paving the way for more sophisticated and unified
solutions in exposure correction.
- Abstract(参考訳): 露出に関連する問題の修正は、画像の品質を高める上で重要な要素であり、様々なコンピュータビジョンタスクに重大な影響を及ぼす。
歴史的に、ほとんどの方法論は空間領域の回復を主に活用しており、周波数領域の可能性を限定的に考慮している。
さらに、低光度強調、露光補正、マルチ露光融合に対する統一的な視点が欠如しており、画像処理の最適化を複雑化し妨げている。
これらの課題に対応するために,周波数領域を利用して露出補正タスクの処理を改善し,統一する手法を提案する。
本手法では,空間領域における従来の相関計算に取って代わるホロスティック周波数注意と動的周波数フィードフォワードネットワークを導入する。
U字型ホロスティックダイナミック周波数変換器をフィルタとして構成し、グローバル情報を抽出し、画像復元のための重要な周波数帯域を動的に選択する。
これを補完するため、ラプラシアピラミッドを用いて異なる周波数帯域に画像分解を行い、その後に複数の復元器を用いて特定の周波数帯域情報を復元する。
ピラミッド融合により、より詳細な画像復元プロセスが可能になる。
最終的には、低光度強調、露光補正、マルチ露光融合の3つのタスクを統合し、すべての古典的な露光エラーを包括的に処理できるようにする。
これらのタスクの主流データセットをベンチマークし、提案手法は最先端の結果を達成し、露出補正におけるより高度で統一された解の道を開く。
関連論文リスト
- Unified Image Restoration and Enhancement: Degradation Calibrated Cycle Reconstruction Diffusion Model [8.713784455593778]
CycleRDMは、復元および拡張タスクを統合するために設計された新しいフレームワークである。
分解された領域、粗い正規領域、および正規領域の間の写像関係を学習する。
復元品質を向上させるため,分解ウェーブレット高周波領域の特徴ゲインモジュールを設計した。
論文 参考訳(メタデータ) (2024-12-19T08:33:33Z) - Multi-view Image Diffusion via Coordinate Noise and Fourier Attention [5.251293630298169]
本稿では,新しい注意機構と横断的注意損失を有する特徴の時間依存性空間周波数に対応する拡散過程を提案する。
本手法は,多視点整合性に対する他の最先端手法と比較して,定性的に優れた結果が得られる数種類の定量的指標を用いてSOTAを改良する。
論文 参考訳(メタデータ) (2024-12-04T22:49:40Z) - Multi-Scale Representation Learning for Image Restoration with State-Space Model [13.622411683295686]
効率的な画像復元のためのマルチスケール状態空間モデル(MS-Mamba)を提案する。
提案手法は,計算複雑性を低く保ちながら,新しい最先端性能を実現する。
論文 参考訳(メタデータ) (2024-08-19T16:42:58Z) - AdaIR: Adaptive All-in-One Image Restoration via Frequency Mining and Modulation [99.57024606542416]
周波数マイニングと変調に基づく適応的なオールインワン画像復元ネットワークを提案する。
我々のアプローチは、異なる周波数サブバンド上の画像内容に異なる劣化タイプが影響を及ぼすという観察によって動機付けられている。
提案モデルでは,入力劣化に応じて情報周波数サブバンドをアクセントすることで適応的再構成を実現する。
論文 参考訳(メタデータ) (2024-03-21T17:58:14Z) - Misalignment-Robust Frequency Distribution Loss for Image Transformation [51.0462138717502]
本稿では,画像強調や超解像といった深層学習に基づく画像変換手法における共通の課題に対処することを目的とする。
本稿では、周波数領域内における分布距離を計算するための、新しいシンプルな周波数分布損失(FDL)を提案する。
本手法は,周波数領域におけるグローバル情報の思慮深い活用により,トレーニング制約として実証的に有効であることが実証された。
論文 参考訳(メタデータ) (2024-02-28T09:27:41Z) - A Dual Domain Multi-exposure Image Fusion Network based on the
Spatial-Frequency Integration [57.14745782076976]
マルチ露光画像融合は、異なる露光で画像を統合することにより、単一の高ダイナミック画像を生成することを目的としている。
本稿では,MEF-SFI と呼ばれる空間周波数統合フレームワークによるマルチ露光画像融合の新たな視点を提案する。
提案手法は,最先端のマルチ露光画像融合手法に対する視覚的近似核融合結果を実現する。
論文 参考訳(メタデータ) (2023-12-17T04:45:15Z) - Mutual Information-driven Triple Interaction Network for Efficient Image
Dehazing [54.168567276280505]
画像デハージングのための相互情報駆動型トリプルインタラクションネットワーク(MITNet)を提案する。
振幅誘導ヘイズ除去と呼ばれる第1段階は、ヘイズ除去のためのヘイズ画像の振幅スペクトルを復元することを目的としている。
第2段階は位相誘導構造が洗練され、位相スペクトルの変換と微細化を学ぶことに尽力した。
論文 参考訳(メタデータ) (2023-08-14T08:23:58Z) - Gated Multi-Resolution Transfer Network for Burst Restoration and
Enhancement [75.25451566988565]
低画質の原画像のバーストから空間的精度の高い高画質画像を再構成する新しいGated Multi-Resolution Transfer Network (GMTNet)を提案する。
5つのデータセットに関する詳細な実験分析は、我々のアプローチを検証し、バースト超解像、バーストデノイング、低照度バーストエンハンスメントのための最先端技術を設定する。
論文 参考訳(メタデータ) (2023-04-13T17:54:00Z) - Focal Frequency Loss for Image Reconstruction and Synthesis [125.7135706352493]
周波数領域の狭さが画像再構成と合成品質をさらに改善できることを示す。
本稿では,合成が難しい周波数成分に適応的に焦点を合わせることのできる,新しい焦点周波数損失を提案する。
論文 参考訳(メタデータ) (2020-12-23T17:32:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。