論文の概要: Learning Dual-Domain Multi-Scale Representations for Single Image Deraining
- arxiv url: http://arxiv.org/abs/2503.12014v1
- Date: Sat, 15 Mar 2025 06:45:33 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-18 12:31:37.675430
- Title: Learning Dual-Domain Multi-Scale Representations for Single Image Deraining
- Title(参考訳): デュアルドメイン・マルチスケール表現の学習
- Authors: Shun Zou, Yi Zou, Mingya Zhang, Shipeng Luo, Guangwei Gao, Guojun Qi,
- Abstract要約: DMSR(Dual-Domain Multi-Scale Representation Network)を提案する。
鍵となる考え方は、外部ドメインと内部ドメインの両方から並列に多重スケールの表現を活用することである。
本モデルでは,6つのベンチマークデータセットにまたがって最先端のパフォーマンスを実現する。
- 参考スコア(独自算出の注目度): 35.20686215525666
- License:
- Abstract: Existing image deraining methods typically rely on single-input, single-output, and single-scale architectures, which overlook the joint multi-scale information between external and internal features. Furthermore, single-domain representations are often too restrictive, limiting their ability to handle the complexities of real-world rain scenarios. To address these challenges, we propose a novel Dual-Domain Multi-Scale Representation Network (DMSR). The key idea is to exploit joint multi-scale representations from both external and internal domains in parallel while leveraging the strengths of both spatial and frequency domains to capture more comprehensive properties. Specifically, our method consists of two main components: the Multi-Scale Progressive Spatial Refinement Module (MPSRM) and the Frequency Domain Scale Mixer (FDSM). The MPSRM enables the interaction and coupling of multi-scale expert information within the internal domain using a hierarchical modulation and fusion strategy. The FDSM extracts multi-scale local information in the spatial domain, while also modeling global dependencies in the frequency domain. Extensive experiments show that our model achieves state-of-the-art performance across six benchmark datasets.
- Abstract(参考訳): 既存の画像デラリニング手法は、通常、単一インプット、単一アウトプット、単一スケールアーキテクチャに依存している。
さらに、単一ドメイン表現は、しばしば制限的であり、現実世界の雨シナリオの複雑さを扱う能力を制限する。
これらの課題に対処するため、我々は新しいDual-Domain Multi-Scale Representation Network (DMSR)を提案する。
鍵となる考え方は、空間領域と周波数領域の両方の強みを活用しながら、外部領域と内部領域の両方から平行に多重スケールの表現を活用することである。
具体的には,MPSRM(Multi-Scale Progressive Spatial Refinement Module)とFDSM(Fandquency Domain Scale Mixer)の2つのコンポーネントから構成される。
MPSRMは階層的な変調と融合戦略を用いて、内部領域内のマルチスケールの専門家情報の相互作用と結合を可能にする。
FDSMは、空間領域におけるマルチスケールなローカル情報を抽出し、周波数領域におけるグローバルな依存関係をモデル化する。
大規模な実験により、我々のモデルは6つのベンチマークデータセットにまたがって最先端のパフォーマンスを達成することが示された。
関連論文リスト
- Learning with Alignments: Tackling the Inter- and Intra-domain Shifts for Cross-multidomain Facial Expression Recognition [16.864390181629044]
本稿では、ドメイン間のシフトとドメイン内シフトの両方を扱うための、LA-CMFERという新しいラーニング・ウィズ・アライメント・CMFERフレームワークを提案する。
これに基づいて、LA-CMFERは、知識伝達におけるハード・トゥ・アライメント・サンプルの優先順位付けをモデルに強制する二重レベル領域間アライメント法を提案する。
ドメイン内シフトに対処するため、LA-CMFERは複数ビューの整合性制約を持つ複数ビューのドメイン内アライメント手法を導入した。
論文 参考訳(メタデータ) (2024-07-08T07:43:06Z) - Role Prompting Guided Domain Adaptation with General Capability Preserve
for Large Language Models [55.51408151807268]
特定のドメインに合わせると、LLM(Large Language Models)は破滅的な忘れを経験する傾向がある。
同時に複数のドメインのための汎用モデルを構築することで、全体的なパフォーマンスが低下することが多い。
RolE Prompting Guided Multi-Domain Adaptation (REGA) 戦略を提案する。
論文 参考訳(メタデータ) (2024-03-05T08:22:41Z) - Virtual Classification: Modulating Domain-Specific Knowledge for
Multidomain Crowd Counting [67.38137379297717]
マルチドメインのクラウドカウントは、複数の多様なデータセットの一般的なモデルを学ぶことを目的としている。
ディープネットワークは、ドメインバイアスとして知られるすべてのドメインではなく、支配的なドメインの分布をモデル化することを好む。
マルチドメイン群カウントにおけるドメインバイアス問題を処理するために,MDKNet(Modulating Domain-specific Knowledge Network)を提案する。
論文 参考訳(メタデータ) (2024-02-06T06:49:04Z) - A Dual Domain Multi-exposure Image Fusion Network based on the
Spatial-Frequency Integration [57.14745782076976]
マルチ露光画像融合は、異なる露光で画像を統合することにより、単一の高ダイナミック画像を生成することを目的としている。
本稿では,MEF-SFI と呼ばれる空間周波数統合フレームワークによるマルチ露光画像融合の新たな視点を提案する。
提案手法は,最先端のマルチ露光画像融合手法に対する視覚的近似核融合結果を実現する。
論文 参考訳(メタデータ) (2023-12-17T04:45:15Z) - Unified Frequency-Assisted Transformer Framework for Detecting and
Grounding Multi-Modal Manipulation [109.1912721224697]
本稿では、DGM4問題に対処するため、UFAFormerという名前のUnified Frequency-Assisted TransFormerフレームワークを提案する。
離散ウェーブレット変換を利用して、画像を複数の周波数サブバンドに分解し、リッチな顔偽造品をキャプチャする。
提案する周波数エンコーダは、帯域内およびバンド間自己アテンションを組み込んだもので、多種多様なサブバンド内および多種多様なフォージェリー特徴を明示的に集約する。
論文 参考訳(メタデータ) (2023-09-18T11:06:42Z) - Adapting Self-Supervised Representations to Multi-Domain Setups [47.03992469282679]
現在の最先端の自己教師型アプローチは、個々のドメインで訓練するときに有効であるが、目に見えないドメインでは限定的な一般化を示す。
本稿では,汎用的で軽量なドメイン・ディスタングル・モジュールを提案する。
論文 参考訳(メタデータ) (2023-09-07T20:05:39Z) - Learning multi-domain feature relation for visible and Long-wave
Infrared image patch matching [39.88037892637296]
我々は、VL-CMIMと呼ばれる最大の可視・長波長赤外線画像パッチマッチングデータセットを提示する。
さらに,マルチドメイン特徴関連学習ネットワーク(MD-FRN)を提案する。
論文 参考訳(メタデータ) (2023-08-09T11:23:32Z) - Multi-Domain Learning From Insufficient Annotations [26.83058974786833]
マルチドメイン学習とは、異なるドメインから収集されたデータセット上にモデルまたはモデルのセットを同時に構築することを指す。
本稿では,アノテーション不足の影響を軽減するために,マルチドメインコントラスト学習という新しい手法を提案する。
5つのデータセットにわたる実験結果から、MDCLは様々なSPモデルに対して顕著な改善をもたらすことが示された。
論文 参考訳(メタデータ) (2023-05-04T11:50:19Z) - Exploiting Graph Structured Cross-Domain Representation for Multi-Domain
Recommendation [71.45854187886088]
マルチドメインレコメンデータシステムは、クロスドメイン表現学習とポジティブな知識伝達の恩恵を受ける。
我々はMAGRecと呼ばれる手法のコンテキスト情報として時間的ドメイン内相互作用とドメイン間相互作用を用いる。
我々は、MAGRecが最先端の手法を一貫して上回る様々なシナリオで、公開データセットで実験を行う。
論文 参考訳(メタデータ) (2023-02-12T19:51:32Z) - Latent Normalizing Flows for Many-to-Many Cross-Domain Mappings [76.85673049332428]
画像とテキストの合同表現の学習は、画像キャプションのようないくつかの重要なドメイン横断タスクのバックボーンを形成する。
ドメイン間の共有情報とドメイン固有の情報を個別にモデル化する,新しい半教師付きフレームワークを提案する。
画像キャプションやテキスト・ツー・イメージ合成など,様々なタスクにおけるモデルの有効性を示す。
論文 参考訳(メタデータ) (2020-02-16T19:49:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。