論文の概要: Dual-Path Coupled Image Deraining Network via Spatial-Frequency
Interaction
- arxiv url: http://arxiv.org/abs/2402.04855v1
- Date: Wed, 7 Feb 2024 13:54:15 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-08 15:15:33.864365
- Title: Dual-Path Coupled Image Deraining Network via Spatial-Frequency
Interaction
- Title(参考訳): 空間周波数相互作用によるデュアルパス結合画像復調ネットワーク
- Authors: Yuhong He, Aiwen Jiang, Lingfang Jiang, Zhifeng Wang, Lu Wang
- Abstract要約: 既存の画像デアライニング手法は、臨界周波数情報を無視する傾向がある。
我々は空間領域と周波数領域の情報を統合したDPCNet(Dual-Path Coupled Deraining Network)を開発した。
提案手法は,既存の最先端デラリニング法よりも,下流視力に優れたロバスト性を有する視覚的満足度を実現する。
- 参考スコア(独自算出の注目度): 7.682978264249712
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Transformers have recently emerged as a significant force in the field of
image deraining. Existing image deraining methods utilize extensive research on
self-attention. Though showcasing impressive results, they tend to neglect
critical frequency information, as self-attention is generally less adept at
capturing high-frequency details. To overcome this shortcoming, we have
developed an innovative Dual-Path Coupled Deraining Network (DPCNet) that
integrates information from both spatial and frequency domains through Spatial
Feature Extraction Block (SFEBlock) and Frequency Feature Extraction Block
(FFEBlock). We have further introduced an effective Adaptive Fusion Module
(AFM) for the dual-path feature aggregation. Extensive experiments on six
public deraining benchmarks and downstream vision tasks have demonstrated that
our proposed method not only outperforms the existing state-of-the-art
deraining method but also achieves visually pleasuring results with excellent
robustness on downstream vision tasks.
- Abstract(参考訳): 近年,トランスフォーマーは画像デライニングの分野で重要な役割を担っている。
既存の画像デラリニング手法は、自己注意に関する広範な研究を利用している。
印象的な結果を示すが、彼らは重要な周波数情報を無視する傾向がある。
そこで我々は,空間的特徴抽出ブロック (SFEBlock) と周波数的特徴抽出ブロック (FFEBlock) を通じて空間的・周波数的領域からの情報を統合するDPCNet(Dual-Path Coupled Deraining Network)を開発した。
さらに,デュアルパス機能アグリゲーションのための効果的な適応核融合モジュール (AFM) も導入した。
提案手法は,既存のデライニング手法に勝るだけでなく,下流視覚タスクに優れたロバスト性を有する視覚的満足度を達成できることを実証した。
関連論文リスト
- Adaptive Frequency Enhancement Network for Single Image Deraining [10.64622976628013]
本稿では,単一画像のデライニングに特化して,新しいエンドツーエンド適応周波数拡張ネットワーク(AFENet)を提案する。
我々は、異なるスケールの畳み込みを用いて、画像周波数帯域を適応的に分解し、特徴拡張モジュールを導入し、新しい相互作用モジュールを示す。
このアプローチにより,多様で複雑な降雨パターンを排除し,画像の細部を正確に再構築することが可能になる。
論文 参考訳(メタデータ) (2024-07-19T13:24:05Z) - Gabor-guided transformer for single image deraining [2.330361251490783]
単一画像デライニングのためのGabor-Guided tranformer(Gabformer)を提案する。
Gaborフィルタによって処理された情報をクエリベクトルに組み込むことにより、ローカルテクスチャ機能へのフォーカスが強化される。
我々の手法は最先端の手法より優れている。
論文 参考訳(メタデータ) (2024-03-12T07:41:51Z) - Multi-dimension Queried and Interacting Network for Stereo Image
Deraining [13.759978932686519]
マルチ次元クエリと対話によるステレオ画像のデライニングを実現するMQINetを考案した。
このモジュールは入力機能に依存しない次元的なクエリを利用する。
降雨画像の逆物理モデルに基づく視界内物理認識注意(IPA)を導入する。
論文 参考訳(メタデータ) (2023-09-19T05:04:06Z) - Unified Frequency-Assisted Transformer Framework for Detecting and
Grounding Multi-Modal Manipulation [109.1912721224697]
本稿では、DGM4問題に対処するため、UFAFormerという名前のUnified Frequency-Assisted TransFormerフレームワークを提案する。
離散ウェーブレット変換を利用して、画像を複数の周波数サブバンドに分解し、リッチな顔偽造品をキャプチャする。
提案する周波数エンコーダは、帯域内およびバンド間自己アテンションを組み込んだもので、多種多様なサブバンド内および多種多様なフォージェリー特徴を明示的に集約する。
論文 参考訳(メタデータ) (2023-09-18T11:06:42Z) - Mutual Information-driven Triple Interaction Network for Efficient Image
Dehazing [54.168567276280505]
画像デハージングのための相互情報駆動型トリプルインタラクションネットワーク(MITNet)を提案する。
振幅誘導ヘイズ除去と呼ばれる第1段階は、ヘイズ除去のためのヘイズ画像の振幅スペクトルを復元することを目的としている。
第2段階は位相誘導構造が洗練され、位相スペクトルの変換と微細化を学ぶことに尽力した。
論文 参考訳(メタデータ) (2023-08-14T08:23:58Z) - Both Spatial and Frequency Cues Contribute to High-Fidelity Image
Inpainting [9.080472817672263]
深部生成的アプローチは、近年、画像の塗布において大きな成功を収めている。
ほとんどの生成的塗布ネットワークは、過度に滑らかな結果か、アーティファクトのエイリアスに悩まされている。
本研究では、空間領域と周波数領域の両方において、リッチな意味情報を活用することで、周波数空間補間ネットワーク(FSCN)を提案する。
論文 参考訳(メタデータ) (2023-07-15T01:52:06Z) - DADFNet: Dual Attention and Dual Frequency-Guided Dehazing Network for
Video-Empowered Intelligent Transportation [79.18450119567315]
逆の気象条件は、ビデオベースの交通監視に深刻な課題をもたらす。
本稿では,リアルタイム視認性向上のための2つの注意と2つの周波数誘導型脱ハージングネットワーク(DADFNet)を提案する。
論文 参考訳(メタデータ) (2023-04-19T11:55:30Z) - Spatial-Temporal Frequency Forgery Clue for Video Forgery Detection in
VIS and NIR Scenario [87.72258480670627]
既存の周波数領域に基づく顔偽造検出手法では、GAN鍛造画像は、実際の画像と比較して、周波数スペクトルに明らかな格子状の視覚的アーチファクトを持つ。
本稿では,コサイン変換に基づくフォージェリークリュー拡張ネットワーク(FCAN-DCT)を提案し,より包括的な時空間特徴表現を実現する。
論文 参考訳(メタデータ) (2022-07-05T09:27:53Z) - Adaptive Frequency Learning in Two-branch Face Forgery Detection [66.91715092251258]
本稿では、AFDと呼ばれる2分岐検出フレームワークにおいて、周波数情報を適応的に学習する手法を提案する。
我々は、固定周波数変換からネットワークを解放し、データおよびタスク依存の変換層でより良いパフォーマンスを達成する。
論文 参考訳(メタデータ) (2022-03-27T14:25:52Z) - Enhanced Spatio-Temporal Interaction Learning for Video Deraining: A
Faster and Better Framework [93.37833982180538]
不要な雨がビデオの可視性を阻害し、ほとんどの屋外ビジョンシステムの堅牢性を低下させるため、ビデオ排水はコンピュータビジョンの重要なタスクです。
拡張時空間相互作用ネットワーク(ESTINet)と呼ばれる新しいエンドツーエンドのデラミニングフレームワークを提案する。
ESTINetは、現在の最先端ビデオの画質とスピードを大幅に向上させる。
論文 参考訳(メタデータ) (2021-03-23T05:19:35Z) - Deep Frequent Spatial Temporal Learning for Face Anti-Spoofing [9.435020319411311]
対面防止は, 提示攻撃による侵入を避けることにより, 顔認識システムのセキュリティに不可欠である。
従来の研究は、この課題に深度と時間的監督を用いることの有効性を示した。
本稿では, 頻繁, 空間的, 時間的情報を同時に活用する顔アンチスプーフィングのための新しい2つのストリームFreqSaptialTemporalNetを提案する。
論文 参考訳(メタデータ) (2020-01-20T06:02:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。