論文の概要: Dual-Path Multi-Scale Transformer for High-Quality Image Deraining
- arxiv url: http://arxiv.org/abs/2405.18124v1
- Date: Tue, 28 May 2024 12:31:23 GMT
- ステータス: 処理完了
- システム内更新日: 2024-05-29 18:39:08.021080
- Title: Dual-Path Multi-Scale Transformer for High-Quality Image Deraining
- Title(参考訳): 高画質画像復調用デュアルパスマルチスケール変圧器
- Authors: Huiling Zhou, Xianhao Wu, Hongming Chen,
- Abstract要約: 高品質な画像再構成のためのデュアルパスマルチスケールトランス (DPMformer) を提案する。
この方法は、2つの異なるマルチスケールアプローチからのバックボーンパスと2つの分岐パスから構成される。
提案手法は,他の最先端手法と比較して有望な性能を実現する。
- 参考スコア(独自算出の注目度): 1.7104836047593197
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Despite the superiority of convolutional neural networks (CNNs) and Transformers in single-image rain removal, current multi-scale models still face significant challenges due to their reliance on single-scale feature pyramid patterns. In this paper, we propose an effective rain removal method, the dual-path multi-scale Transformer (DPMformer) for high-quality image reconstruction by leveraging rich multi-scale information. This method consists of a backbone path and two branch paths from two different multi-scale approaches. Specifically, one path adopts the coarse-to-fine strategy, progressively downsampling the image to 1/2 and 1/4 scales, which helps capture fine-scale potential rain information fusion. Simultaneously, we employ the multi-patch stacked model (non-overlapping blocks of size 2 and 4) to enrich the feature information of the deep network in the other path. To learn a richer blend of features, the backbone path fully utilizes the multi-scale information to achieve high-quality rain removal image reconstruction. Extensive experiments on benchmark datasets demonstrate that our method achieves promising performance compared to other state-of-the-art methods.
- Abstract(参考訳): 畳み込みニューラルネットワーク(CNN)とトランスフォーマーが単一イメージの雨除去に優れているにもかかわらず、現在のマルチスケールモデルは単一スケールの特徴ピラミッドパターンに依存しているため、依然として重大な課題に直面している。
本稿では,リッチなマルチスケール情報を活用した高画質画像再構成のための効果的な雨除去手法であるデュアルパスマルチスケールトランス (DPMformer) を提案する。
この方法は、2つの異なるマルチスケールアプローチからのバックボーンパスと2つの分岐パスから構成される。
具体的には、1つの経路が粗大な戦略を採用し、画像を1/2スケールと1/4スケールに段階的にダウンサンプリングすることで、小規模の降雨情報融合を捉えるのに役立つ。
同時に、マルチパッチ重畳モデル(サイズ2と4の重複しないブロック)を用いて、他の経路におけるディープネットワークの特徴情報を強化する。
バックボーンパスは,よりリッチな特徴のブレンドを学習するために,マルチスケール情報を完全に活用し,高品質な降雨除去画像再構成を実現する。
ベンチマークデータセットの大規模な実験により,本手法が他の最先端手法と比較して有望な性能を達成することを示す。
関連論文リスト
- Learning Efficient and Effective Trajectories for Differential Equation-based Image Restoration [59.744840744491945]
我々は, この手法の軌道最適化を再構築し, 復元品質と効率の両立に焦点をあてる。
本稿では,複雑な経路を適応可能なサイズで複数の管理可能なステップに合理化するためのコスト対応トラジェクトリー蒸留法を提案する。
実験では提案手法の有意な優位性を示し, 最先端手法よりも最大2.1dBのPSNR改善を実現した。
論文 参考訳(メタデータ) (2024-10-07T07:46:08Z) - Lightweight single-image super-resolution network based on dual paths [0.552480439325792]
ディープラーニングのシングルイメージ超解像(SISR)アルゴリズムには,畳み込みニューラルネットワークとTransformerに基づく2つのモデルがある。
本稿では,2方向相補的畳み込みとトランスフォーマーに基づく,軽量なマルチスケール機能融合ネットワークモデルを提案する。
論文 参考訳(メタデータ) (2024-09-10T15:31:37Z) - Bidirectional Multi-Scale Implicit Neural Representations for Image Deraining [47.15857899099733]
高品質な画像再構成を実現するために,エンド・ツー・エンドのマルチスケールトランスを開発した。
クローズドループ設計において、劣化した入力を持つ画素座標に基づいて、スケール内の暗黙的ニューラル表現を組み込む。
我々のアプローチはNeRD-Rainと呼ばれ、合成および実世界のベンチマークデータセットにおいて最先端のアプローチに対して好意的に実行されます。
論文 参考訳(メタデータ) (2024-04-02T01:18:16Z) - Online-updated High-order Collaborative Networks for Single Image
Deraining [51.22694467126883]
単一画像のデライン化は、ビデオ監視や自動運転システムなど、下流の人工知能アプリケーションにとって重要なタスクである。
マルチスケールのコンパクトな制約と双方向のスケール・コンテント類似性マイニングモジュールを備えた高階協調ネットワークを提案する。
提案手法は,5つの公開合成と1つの実世界のデータセットに対して,11の最先端手法に対して好意的に機能する。
論文 参考訳(メタデータ) (2022-02-14T09:09:08Z) - Multi-Scale Hourglass Hierarchical Fusion Network for Single Image
Deraining [8.964751500091005]
雨のひもはサイズ、方向および密度で頻繁に変わる深刻なぼやけおよび視覚質の低下をもたらします。
現在のCNN方式は, 降雨特性の描写や, 可視性に乏しい環境下でのイメージの復元に限られている。
本稿では,マルチスケール抽出,階層蒸留,情報集約による雨天の特徴を正確に把握するために,マルチスケールのHH2F-Netを提案する。
論文 参考訳(メタデータ) (2021-04-25T08:27:01Z) - M2TR: Multi-modal Multi-scale Transformers for Deepfake Detection [74.19291916812921]
Deepfake技術によって生成された鍛造画像は、デジタル情報の信頼性に深刻な脅威をもたらします。
本稿では,Deepfake検出のための微妙な操作アーチファクトを異なるスケールで捉えることを目的とする。
最先端の顔スワッピングと顔の再現方法によって生成された4000のDeepFakeビデオで構成される高品質のDeepFakeデータセットSR-DFを紹介します。
論文 参考訳(メタデータ) (2021-04-20T05:43:44Z) - Adaptive Context-Aware Multi-Modal Network for Depth Completion [107.15344488719322]
我々は,観測された空間コンテキストを捉えるために,グラフ伝搬を採用することを提案する。
次に、注意機構を伝搬に適用し、ネットワークが文脈情報を適応的にモデル化することを奨励する。
最後に、抽出したマルチモーダル特徴を効果的に活用するための対称ゲート融合戦略を導入する。
本稿では,Adaptive Context-Aware Multi-Modal Network (ACMNet) を2つのベンチマークで評価した。
論文 参考訳(メタデータ) (2020-08-25T06:00:06Z) - Multi-Scale Progressive Fusion Network for Single Image Deraining [84.0466298828417]
空気中の雨のストリークは、位置からカメラまでの距離が異なるため、様々なぼやけた度合いや解像度で現れる。
同様の降雨パターンは、雨像やマルチスケール(またはマルチレゾリューション)バージョンで見ることができる。
本研究では,入力画像のスケールと階層的な深部特徴の観点から,雨天のマルチスケール協調表現について検討する。
論文 参考訳(メタデータ) (2020-03-24T17:22:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。