論文の概要: A Mountain-Shaped Single-Stage Network for Accurate Image Restoration
- arxiv url: http://arxiv.org/abs/2305.05146v1
- Date: Tue, 9 May 2023 03:18:35 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-10 14:05:52.030839
- Title: A Mountain-Shaped Single-Stage Network for Accurate Image Restoration
- Title(参考訳): 高精度画像復元のための山型単段ネットワーク
- Authors: Hu Gao and Jing Yang and Ying Zhang and Ning Wang and Jingfan Yang and
Depeng Dang
- Abstract要約: 画像復元においては、通常、空間的詳細と文脈情報の複雑なバランスを維持する必要がある。
不要な非線形活性化関数を除去または置換する,単純なU-Netアーキテクチャに基づく単一ステージ設計ベースを提案する。
我々のアプローチはM3SNetと呼ばれ、従来の最先端モデルよりも性能が優れており、計算コストの半分以下である。
- 参考スコア(独自算出の注目度): 9.431709365739462
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Image restoration is the task of aiming to obtain a high-quality image from a
corrupt input image, such as deblurring and deraining. In image restoration, it
is typically necessary to maintain a complex balance between spatial details
and contextual information. Although a multi-stage network can optimally
balance these competing goals and achieve significant performance, this also
increases the system's complexity. In this paper, we propose a mountain-shaped
single-stage design base on a simple U-Net architecture, which removes or
replaces unnecessary nonlinear activation functions to achieve the above
balance with low system complexity. Specifically, we propose a feature fusion
middleware (FFM) mechanism as an information exchange component between the
encoder-decoder architectural levels. It seamlessly integrates upper-layer
information into the adjacent lower layer, sequentially down to the lowest
layer. Finally, all information is fused into the original image resolution
manipulation level. This preserves spatial details and integrates contextual
information, ensuring high-quality image restoration. In addition, we propose a
multi-head attention middle block (MHAMB) as a bridge between the encoder and
decoder to capture more global information and surpass the limitations of the
receptive field of CNNs. Extensive experiments demonstrate that our approach,
named as M3SNet, outperforms previous state-of-the-art models while using less
than half the computational costs, for several image restoration tasks, such as
image deraining and deblurring.
- Abstract(参考訳): 画像復元は, 劣化や劣化などの劣化した入力画像から高品質な画像を得るためのタスクである。
画像復元では,空間的詳細と文脈情報との複雑なバランスを維持する必要がある。
マルチステージネットワークは、これらの競合する目標を最適にバランスさせ、大きなパフォーマンスを達成することができるが、システムの複雑さも増す。
本稿では,不必要な非線形アクティベーション関数を除去あるいは置き換える,単純なU-Netアーキテクチャに基づく山型単一ステージ設計ベースを提案する。
具体的には,エンコーダ・デコーダアーキテクチャレベル間の情報交換コンポーネントとして機能融合ミドルウェア(ffm)機構を提案する。
上層情報を隣接する下層にシームレスに統合し、次々に下層へと下降する。
最後に、全ての情報は元の画像解像度操作レベルに融合される。
これは空間的詳細を保存し、文脈情報を統合し、高品質な画像復元を保証する。
さらに,エンコーダとデコーダの間のブリッジとしてマルチヘッドアテンションミドルブロック(MHAMB)を提案する。
M3SNetと名づけられた我々の手法は,画像のデアライニングやデブロアリングといった画像修復作業において,計算コストの半分以下で従来の最先端モデルよりも優れていることを示す。
関連論文リスト
- Multi-Scale Representation Learning for Image Restoration with State-Space Model [13.622411683295686]
効率的な画像復元のためのマルチスケール状態空間モデル(MS-Mamba)を提案する。
提案手法は,計算複雑性を低く保ちながら,新しい最先端性能を実現する。
論文 参考訳(メタデータ) (2024-08-19T16:42:58Z) - Unified-Width Adaptive Dynamic Network for All-In-One Image Restoration [50.81374327480445]
本稿では, 複雑な画像劣化を基本劣化の観点で表現できる, という新しい概念を提案する。
We propose the Unified-Width Adaptive Dynamic Network (U-WADN) which consist of two pivotal components: a Width Adaptive Backbone (WAB) and a Width Selector (WS)。
提案したU-WADNは、最大32.3%のFLOPを同時に削減し、約15.7%のリアルタイム加速を実現している。
論文 参考訳(メタデータ) (2024-01-24T04:25:12Z) - CoSeR: Bridging Image and Language for Cognitive Super-Resolution [74.24752388179992]
本稿では,低解像度画像の理解能力を備えたSRモデルを実現するCoSeR(Cognitive Super-Resolution)フレームワークを提案する。
画像の外観と言語理解を組み合わせることで、認知的な埋め込みを生成する。
画像の忠実度をさらに向上させるため、「オール・イン・アテンション」と呼ばれる新しい条件注入方式を提案する。
論文 参考訳(メタデータ) (2023-11-27T16:33:29Z) - Prompt-based Ingredient-Oriented All-in-One Image Restoration [0.0]
複数の画像劣化課題に対処する新しいデータ成分指向手法を提案する。
具体的には、エンコーダを用いて特徴をキャプチャし、デコーダを誘導するための劣化情報を含むプロンプトを導入する。
我々の手法は最先端技術と競争的に機能する。
論文 参考訳(メタデータ) (2023-09-06T15:05:04Z) - Mixed Hierarchy Network for Image Restoration [0.0]
画像復元における品質とシステムの複雑さのバランスをとることができる混合階層ネットワークを提案する。
我々のモデルはまずエンコーダ・デコーダアーキテクチャを用いて文脈情報を学習し,次に空間的詳細を保存する高分解能分岐と組み合わせる。
その結果、MHNetという名前の密接な相互接続階層アーキテクチャは、いくつかのイメージ復元タスクにおいて、強力なパフォーマンス向上をもたらす。
論文 参考訳(メタデータ) (2023-02-19T12:18:45Z) - Learning Enriched Features for Fast Image Restoration and Enhancement [166.17296369600774]
本稿では,ネットワーク全体を通して空間的精度の高い高解像度表現を維持することを目的とする。
我々は、高解像度の空間的詳細を同時に保存しながら、複数のスケールからの文脈情報を組み合わせた豊富な特徴集合を学習する。
提案手法は,デフォーカス・デブロアリング,画像デノイング,超解像,画像強調など,さまざまな画像処理タスクに対して,最先端の処理結果を実現する。
論文 参考訳(メタデータ) (2022-04-19T17:59:45Z) - Multi-Stage Progressive Image Restoration [167.6852235432918]
本稿では、これらの競合する目標を最適にバランスできる新しい相乗的設計を提案する。
本提案では, 劣化した入力の復元関数を段階的に学習する多段階アーキテクチャを提案する。
MPRNetという名前の密接な相互接続型マルチステージアーキテクチャは、10のデータセットに対して強力なパフォーマンス向上を実現している。
論文 参考訳(メタデータ) (2021-02-04T18:57:07Z) - Deep Burst Super-Resolution [165.90445859851448]
バースト超解像タスクのための新しいアーキテクチャを提案する。
我々のネットワークは複数のノイズRAW画像を入力として取り出し、出力として分解された超解像RGB画像を生成する。
実世界のデータのトレーニングと評価を可能にするため,BurstSRデータセットも導入する。
論文 参考訳(メタデータ) (2021-01-26T18:57:21Z) - Learning Enriched Features for Real Image Restoration and Enhancement [166.17296369600774]
畳み込みニューラルネットワーク(CNN)は、画像復元作業における従来のアプローチよりも劇的に改善されている。
ネットワーク全体を通して空間的精度の高い高解像度表現を維持することを目的とした,新しいアーキテクチャを提案する。
提案手法は,高解像度の空間的詳細を同時に保存しながら,複数のスケールからの文脈情報を組み合わせた豊富な特徴集合を学習する。
論文 参考訳(メタデータ) (2020-03-15T11:04:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。