論文の概要: CNN Injected Transformer for Image Exposure Correction
- arxiv url: http://arxiv.org/abs/2309.04366v1
- Date: Fri, 8 Sep 2023 14:53:00 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-11 13:13:36.576912
- Title: CNN Injected Transformer for Image Exposure Correction
- Title(参考訳): 画像露光補正用cnn注入変圧器
- Authors: Shuning Xu, Xiangyu Chen, Binbin Song, Jiantao Zhou
- Abstract要約: 畳み込みに基づく以前の露光補正法は、しばしば画像の露光偏差を生じさせる。
本稿では,CNN と Transformer の個々の強度を同時に活用する CNN インジェクトトランス (CIT) を提案する。
露光補正のためのハイブリッドアーキテクチャ設計に加えて、空間コヒーレンスを改善し、潜在的な色偏差を補正するために、慎重に定式化された損失関数のセットを適用する。
- 参考スコア(独自算出の注目度): 20.282217209520006
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Capturing images with incorrect exposure settings fails to deliver a
satisfactory visual experience. Only when the exposure is properly set, can the
color and details of the images be appropriately preserved. Previous exposure
correction methods based on convolutions often produce exposure deviation in
images as a consequence of the restricted receptive field of convolutional
kernels. This issue arises because convolutions are not capable of capturing
long-range dependencies in images accurately. To overcome this challenge, we
can apply the Transformer to address the exposure correction problem,
leveraging its capability in modeling long-range dependencies to capture global
representation. However, solely relying on the window-based Transformer leads
to visually disturbing blocking artifacts due to the application of
self-attention in small patches. In this paper, we propose a CNN Injected
Transformer (CIT) to harness the individual strengths of CNN and Transformer
simultaneously. Specifically, we construct the CIT by utilizing a window-based
Transformer to exploit the long-range interactions among different regions in
the entire image. Within each CIT block, we incorporate a channel attention
block (CAB) and a half-instance normalization block (HINB) to assist the
window-based self-attention to acquire the global statistics and refine local
features. In addition to the hybrid architecture design for exposure
correction, we apply a set of carefully formulated loss functions to improve
the spatial coherence and rectify potential color deviations. Extensive
experiments demonstrate that our image exposure correction method outperforms
state-of-the-art approaches in terms of both quantitative and qualitative
metrics.
- Abstract(参考訳): 不正確な露出設定で画像をキャプチャしても、満足のいくビジュアルエクスペリエンスを提供できない。
露光が適切に設定されたときのみ、画像の色や詳細を適切に保存することができる。
畳み込みに基づく以前の露光補正法は、畳み込み核の制限された受容場の結果、画像の露光偏差を生じることが多い。
この問題は、畳み込みが画像の長距離依存関係を正確にキャプチャできないために生じる。
この課題を克服するために、Transformerを露光補正問題に適用し、長距離依存関係をモデル化してグローバル表現をキャプチャする能力を活用する。
しかし、ウィンドウベースのTransformerのみに依存すると、小さなパッチに自己注意を適用するため、視覚的にブロッキングアーティファクトが乱される。
本稿では,CNN と Transformer の個々の強度を同時に活用する CNN Injected Transformer (CIT) を提案する。
具体的には、ウィンドウベースのトランスフォーマーを用いて、画像全体の異なる領域間の長距離相互作用を利用するCITを構築する。
各CITブロックには、チャネルアテンションブロック(CAB)とハーフインスタンス正規化ブロック(HINB)が組み込まれ、ウィンドウベースの自己アテンションをサポートし、グローバルな統計情報を取得し、局所的な特徴を洗練する。
露出補正のためのハイブリッドアーキテクチャ設計に加えて,空間コヒーレンスを改善し,電位色偏差を補正するために,注意深く定式化した損失関数を適用した。
広範な実験により, 画像露光補正手法が, 定量的および質的指標の両面で最先端の手法よりも優れていることが示された。
関連論文リスト
- Look-Around Before You Leap: High-Frequency Injected Transformer for Image Restoration [46.96362010335177]
本稿では,画像復元のための簡易かつ効果的な高周波インジェクト変換器HITを提案する。
具体的には,機能マップに高頻度の詳細を組み込んだウィンドウワイドインジェクションモジュール(WIM)を設計し,高品質な画像の復元のための信頼性の高い参照を提供する。
さらに,BIMにおけるチャネル次元の計算によって失われる可能性のある空間的関係を維持するために,空間拡張ユニット(SEU)を導入する。
論文 参考訳(メタデータ) (2024-03-30T08:05:00Z) - A Non-Uniform Low-Light Image Enhancement Method with Multi-Scale
Attention Transformer and Luminance Consistency Loss [11.585269110131659]
低照度画像強調は、薄暗い環境で収集された画像の知覚を改善することを目的としている。
既存の方法では、識別された輝度情報を適応的に抽出することができず、露光過多や露光過多を容易に引き起こすことができる。
MSATrというマルチスケールアテンション変換器を提案し,光バランスの局所的・グローバル的特徴を十分に抽出し,視覚的品質を向上させる。
論文 参考訳(メタデータ) (2023-12-27T10:07:11Z) - Distance Weighted Trans Network for Image Completion [52.318730994423106]
本稿では,DWT(Distance-based Weighted Transformer)を利用した画像コンポーネント間の関係をよりよく理解するためのアーキテクチャを提案する。
CNNは、粗い事前の局所的なテクスチャ情報を強化するために使用される。
DWTブロックは、特定の粗いテクスチャやコヒーレントな視覚構造を復元するために使用される。
論文 参考訳(メタデータ) (2023-10-11T12:46:11Z) - Fearless Luminance Adaptation: A Macro-Micro-Hierarchical Transformer
for Exposure Correction [65.5397271106534]
単一のニューラルネットワークは、すべての露光問題に対処することが難しい。
特に、コンボリューションは、極端に過度に露出した領域における忠実な色や詳細を復元する能力を妨げる。
本稿では,マクロマイクロ階層変換器を提案する。マクロマイクロ階層変換器は,長距離依存を捉えるマクロアテンション,局所特徴を抽出するマイクロアテンション,粗大な修正のための階層構造を提案する。
論文 参考訳(メタデータ) (2023-09-02T09:07:36Z) - Image Deblurring by Exploring In-depth Properties of Transformer [86.7039249037193]
我々は、事前訓練された視覚変換器(ViT)から抽出した深い特徴を活用し、定量的な測定値によって測定された性能を犠牲にすることなく、回復した画像のシャープ化を促進する。
得られた画像と対象画像の変換器特徴を比較することにより、事前学習された変換器は、高解像度のぼやけた意味情報を提供する。
特徴をベクトルとみなし、抽出された画像から抽出された表現とユークリッド空間における対象表現との差を計算する。
論文 参考訳(メタデータ) (2023-03-24T14:14:25Z) - CSformer: Bridging Convolution and Transformer for Compressive Sensing [65.22377493627687]
本稿では,CNNからの詳細な空間情報を活用するためのハイブリッドフレームワークと,表現学習の強化を目的としたトランスフォーマーが提供するグローバルコンテキストを統合することを提案する。
提案手法は、適応的なサンプリングとリカバリからなるエンドツーエンドの圧縮画像センシング手法である。
実験により, 圧縮センシングにおける専用トランスアーキテクチャの有効性が示された。
論文 参考訳(メタデータ) (2021-12-31T04:37:11Z) - Diverse Image Inpainting with Bidirectional and Autoregressive
Transformers [55.21000775547243]
新規な双方向自己回帰トランス(BAT)を用いた画像インペインティングフレームワークBAT-Fillを提案する。
BAT-Fillは変換器とCNNの利点を2段階的に継承し、変換器の注意の二次的複雑さに制約されることなく高解像度のコンテンツを生成する。
論文 参考訳(メタデータ) (2021-04-26T03:52:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。