論文の概要: Gabor-guided transformer for single image deraining
- arxiv url: http://arxiv.org/abs/2403.07380v1
- Date: Tue, 12 Mar 2024 07:41:51 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-13 22:33:25.974102
- Title: Gabor-guided transformer for single image deraining
- Title(参考訳): 単一画像消去用ガバー誘導変圧器
- Authors: Sijin He, Guangfeng Lin
- Abstract要約: 単一画像デライニングのためのGabor-Guided tranformer(Gabformer)を提案する。
Gaborフィルタによって処理された情報をクエリベクトルに組み込むことにより、ローカルテクスチャ機能へのフォーカスが強化される。
我々の手法は最先端の手法より優れている。
- 参考スコア(独自算出の注目度): 2.330361251490783
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Image deraining have have gained a great deal of attention in order to
address the challenges posed by the effects of harsh weather conditions on
visual tasks. While convolutional neural networks (CNNs) are popular, their
limitations in capturing global information may result in ineffective rain
removal. Transformer-based methods with self-attention mechanisms have
improved, but they tend to distort high-frequency details that are crucial for
image fidelity. To solve this problem, we propose the Gabor-guided tranformer
(Gabformer) for single image deraining. The focus on local texture features is
enhanced by incorporating the information processed by the Gabor filter into
the query vector, which also improves the robustness of the model to noise due
to the properties of the filter. Extensive experiments on the benchmarks
demonstrate that our method outperforms state-of-the-art approaches.
- Abstract(参考訳): 過酷な気象条件が視覚タスクに与える影響によって生じる課題に対処するため、画像のデレーニングには多くの注意が払われている。
畳み込みニューラルネットワーク(CNN)は人気があるが、グローバル情報を取得する際の制限は雨の除去に効果がない可能性がある。
自己注意機構を持つトランスフォーマーベースの手法は改善されているが、画像の忠実性に不可欠な高周波の詳細を歪ませる傾向がある。
この問題を解決するため,単一画像デライニングのためのGabor-Guided tranformer(Gabformer)を提案する。
局所的なテクスチャ特徴に着目し,Gaborフィルタによって処理された情報をクエリベクトルに組み込むことで,フィルタの特性によるノイズに対するモデルの堅牢性を向上させる。
ベンチマーク実験により,本手法が最先端手法より優れていることが示された。
関連論文リスト
- Improving Image De-raining Using Reference-Guided Transformers [9.867364371892693]
本稿では,参照クリーンイメージをガイダンスとして,デレーニング結果を向上するトランスフォーマネットワークであるレファレンス誘導型デレーニングフィルタを提案する。
提案手法を3つのデータセット上で検証し,既存の事前ベース,CNNベース,トランスフォーマーベースのアプローチにより,モジュールの性能を向上できることを示す。
論文 参考訳(メタデータ) (2024-08-01T03:31:45Z) - Training Transformer Models by Wavelet Losses Improves Quantitative and Visual Performance in Single Image Super-Resolution [6.367865391518726]
トランスフォーマーベースモデルは、画像超解像(SR)を含む低レベル視覚タスクにおいて顕著な結果を得た
グローバルにより多くの入力ピクセルを活性化するために、ハイブリッドアテンションモデルが提案されている。
ウェーブレット損失を利用してTransformerモデルをトレーニングし、定量的および主観的性能を向上させる。
論文 参考訳(メタデータ) (2024-04-17T11:25:19Z) - Exploiting Regional Information Transformer for Single Image Deraining [40.96287901893822]
Region Transformer Block (RTB) は Region Masked Attention (RMA) 機構と Mixed Gate Forward Block (MGFB) を統合している
我々のモデルは最先端の性能に到達し、画像劣化の品質を著しく向上させる。
論文 参考訳(メタデータ) (2024-02-25T09:09:30Z) - WaveletFormerNet: A Transformer-based Wavelet Network for Real-world
Non-homogeneous and Dense Fog Removal [11.757602977709517]
本稿では,現実の霧画像回復のためのトランスフォーマーベースのウェーブレットネットワーク(WaveletFormerNet)を提案する。
トランスフォーマーブロックに並列畳み込みを導入し、軽量な機構で多周波情報のキャプチャを可能にする。
我々の実験は、WaveletFormerNetが最先端の手法よりも優れていることを示した。
論文 参考訳(メタデータ) (2024-01-09T13:42:21Z) - DGNet: Dynamic Gradient-Guided Network for Water-Related Optics Image
Enhancement [77.0360085530701]
水中画像強調(UIE)は、水中環境によって引き起こされる複雑な劣化のために難しい課題である。
従来の手法では、劣化過程を理想化し、中音や物体の動きが画像の特徴の分布に与える影響を無視することが多い。
提案手法では,予測画像を用いて疑似ラベルを動的に更新し,動的勾配を加えてネットワークの勾配空間を最適化する。
論文 参考訳(メタデータ) (2023-12-12T06:07:21Z) - Learning Heavily-Degraded Prior for Underwater Object Detection [59.5084433933765]
本稿では、検出器フレンドリーな画像から、転送可能な事前知識を求める。
これは、検出器フレンドリー(DFUI)と水中画像の高度に劣化した領域が、特徴分布のギャップがあることを統計的に観察したものである。
高速かつパラメータの少ない本手法は変圧器型検出器よりも優れた性能を保っている。
論文 参考訳(メタデータ) (2023-08-24T12:32:46Z) - Single Image Deraining via Feature-based Deep Convolutional Neural
Network [13.39233717329633]
データ駆動型アプローチとモデルベースアプローチを組み合わせた,単一画像デラミニングアルゴリズムを提案する。
実験の結果,提案アルゴリズムは質的,定量的両面で最先端の手法よりも優れていることがわかった。
論文 参考訳(メタデータ) (2023-05-03T13:12:51Z) - Image Deblurring by Exploring In-depth Properties of Transformer [86.7039249037193]
我々は、事前訓練された視覚変換器(ViT)から抽出した深い特徴を活用し、定量的な測定値によって測定された性能を犠牲にすることなく、回復した画像のシャープ化を促進する。
得られた画像と対象画像の変換器特徴を比較することにより、事前学習された変換器は、高解像度のぼやけた意味情報を提供する。
特徴をベクトルとみなし、抽出された画像から抽出された表現とユークリッド空間における対象表現との差を計算する。
論文 参考訳(メタデータ) (2023-03-24T14:14:25Z) - Improving robustness against common corruptions with frequency biased
models [112.65717928060195]
目に見えない画像の腐敗は 驚くほど大きなパフォーマンス低下を引き起こします
画像の破損タイプは周波数スペクトルで異なる特性を持ち、ターゲットタイプのデータ拡張の恩恵を受けます。
畳み込み特徴マップの総変動(TV)を最小限に抑え、高周波堅牢性を高める新しい正規化方式を提案する。
論文 参考訳(メタデータ) (2021-03-30T10:44:50Z) - Invertible Image Rescaling [118.2653765756915]
Invertible Rescaling Net (IRN) を開発した。
我々は、ダウンスケーリングプロセスにおいて、指定された分布に従う潜在変数を用いて、失われた情報の分布をキャプチャする。
論文 参考訳(メタデータ) (2020-05-12T09:55:53Z) - Blur, Noise, and Compression Robust Generative Adversarial Networks [85.68632778835253]
劣化画像から直接クリーンな画像生成装置を学習するために, ぼかし, ノイズ, 圧縮堅牢なGAN(BNCR-GAN)を提案する。
NR-GANにインスパイアされたBNCR-GANは、画像、ぼやけたカーネル、ノイズ、品質要素ジェネレータで構成される多重ジェネレータモデルを使用する。
CIFAR-10の大規模比較とFFHQの一般性解析によるBNCR-GANの有効性を実証する。
論文 参考訳(メタデータ) (2020-03-17T17:56:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。