論文の概要: DnSwin: Toward Real-World Denoising via Continuous Wavelet
Sliding-Transformer
- arxiv url: http://arxiv.org/abs/2207.13861v1
- Date: Thu, 28 Jul 2022 02:33:57 GMT
- ステータス: 処理完了
- システム内更新日: 2022-07-29 12:29:57.361607
- Title: DnSwin: Toward Real-World Denoising via Continuous Wavelet
Sliding-Transformer
- Title(参考訳): dnswin: 連続ウェーブレットスライディング変換による実世界のデノーミングに向けて
- Authors: Hao Li, Zhijing Yang, Xiaobin Hong, Ziying Zhao, Junyang Chen, Yukai
Shi, Jinshan Pan
- Abstract要約: 本研究では,実環境下での周波数対応を実現する連続ウェーブレットスライディング変換器を提案する。
具体的には、まず、CNNエンコーダを用いてノイズの多い入力画像からボトム特徴を抽出する。
我々は、CNNデコーダを用いて、深い特徴を復号化画像に再構成する。
- 参考スコア(独自算出の注目度): 40.21145302686399
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Real-world image denoising is a practical image restoration problem that aims
to obtain clean images from in-the-wild noisy input. Recently, Vision
Transformer (ViT) exhibits a strong ability to capture long-range dependencies
and many researchers attempt to apply ViT to image denoising tasks. However,
real-world image is an isolated frame that makes the ViT build the long-range
dependencies on the internal patches, which divides images into patches and
disarranges the noise pattern and gradient continuity. In this article, we
propose to resolve this issue by using a continuous Wavelet Sliding-Transformer
that builds frequency correspondence under real-world scenes, called DnSwin.
Specifically, we first extract the bottom features from noisy input images by
using a CNN encoder. The key to DnSwin is to separate high-frequency and
low-frequency information from the features and build frequency dependencies.
To this end, we propose Wavelet Sliding-Window Transformer that utilizes
discrete wavelet transform, self-attention and inverse discrete wavelet
transform to extract deep features. Finally, we reconstruct the deep features
into denoised images using a CNN decoder. Both quantitative and qualitative
evaluations on real-world denoising benchmarks demonstrate that the proposed
DnSwin performs favorably against the state-of-the-art methods.
- Abstract(参考訳): 実世界の画像復号化は,Wild ノイズ入力からクリーンな画像を得るための実用的な画像復元問題である。
近年、視覚トランスフォーマー(vit)は長距離の依存関係を捉える能力が強く、多くの研究者がvitを画像表示タスクに適用しようと試みている。
しかし、現実のイメージは、ViTが内部のパッチに長距離依存するように分離されたフレームであり、イメージをパッチに分割し、ノイズパターンと勾配の連続性を乱す。
本稿では,実世界の場面で周波数対応を構築する連続ウェーブレットスライディング変換器dnswinを用いて,この問題を解決することを提案する。
具体的には,まずcnnエンコーダを用いてノイズ入力画像からボトム特徴を抽出する。
DnSwinの鍵は、高周波および低周波情報を特徴から分離し、周波数依存性を構築することである。
そこで本研究では,離散ウェーブレット変換,自己アテンション,逆離散ウェーブレット変換を用いて深い特徴を抽出するウェーブレットスライディングウィンドウトランスを提案する。
最後に,cnnデコーダを用いて深部特徴をデノ化画像に再構成する。
実世界のdenoisingベンチマークにおける定量的および定性的な評価は、提案したDnSwinが最先端の手法に対して好適に機能することを示す。
関連論文リスト
- Image Denoising Using Green Channel Prior [3.8541941705185114]
Green channel pre-based image denoising (GCP-ID)メソッドは、GCPを古典的なパッチベースのdenoisingフレームワークに統合する。
GCP-IDの様々な画像コンテンツへの適応性を高めるため、ノイズ推定問題を分類タスクにキャストし、畳み込みニューラルネットワーク(CNN)に基づく効果的な推定器を訓練する。
論文 参考訳(メタデータ) (2024-08-12T05:07:12Z) - Complex Image Generation SwinTransformer Network for Audio Denoising [20.11487887319951]
本稿では,音声の雑音化問題を画像生成タスクに変換する。
まず、複雑なフーリエ領域からより多くの情報を取得するための複雑な画像生成SwinTransformerネットワークを開発する。
そこで我々は,高品質な画像を生成するために構造類似性と詳細な損失関数を課し,識別音声とクリーンオーディオの差を最小限に抑えるためにSDR損失を開発する。
論文 参考訳(メタデータ) (2023-10-24T18:21:03Z) - A cross Transformer for image denoising [83.68175077524111]
直列ブロック(SB)、並列ブロック(PB)、残留ブロック(RB)を備えたクロストランスフォーマー(CTNet)を提案する。
CTNetは、実画像や合成画像のデノナイジングにおいて、一般的なデノナイジング法よりも優れている。
論文 参考訳(メタデータ) (2023-10-16T13:53:19Z) - Self-Supervised Image Denoising for Real-World Images with Context-aware
Transformer [3.767629593484917]
実世界の画像デノイングのための新しいデノワーズ変換器を提案する。
主に、CADT(Context-aware Denoise Transformer)ユニットとSNE(セカンダリノイズエクストラクタ)ブロックで構築されている。
実世界のSIDDベンチマークの実験はPSNR/SSIMの50.62/0.990を達成している。
論文 参考訳(メタデータ) (2023-04-04T08:30:50Z) - Multi-stage image denoising with the wavelet transform [125.2251438120701]
深部畳み込みニューラルネットワーク(Deep Convolutional Neural Network, CNN)は、正確な構造情報を自動マイニングすることで、画像の復調に使用される。
動的畳み込みブロック(DCB)、2つのカスケードウェーブレット変換および拡張ブロック(WEB)、残留ブロック(RB)の3段階を経由した、MWDCNNによるCNNの多段階化を提案する。
論文 参考訳(メタデータ) (2022-09-26T03:28:23Z) - Wavelet Integrated CNNs for Noise-Robust Image Classification [51.18193090255933]
我々は、離散ウェーブレット変換(DWT)により、最大プール、ストライド畳み込み、平均プールを置き換えることでCNNを強化する。
VGG、ResNets、DenseNetのウェーブレット統合バージョンであるWaveCNetsは、バニラバージョンよりも精度が高く、ノイズ・ロバスト性も向上している。
論文 参考訳(メタデータ) (2020-05-07T09:10:41Z) - Reconstructing the Noise Manifold for Image Denoising [56.562855317536396]
本稿では,画像ノイズ空間の構造を明示的に活用するcGANを提案する。
画像ノイズの低次元多様体を直接学習することにより、この多様体にまたがる情報のみをノイズ画像から除去する。
我々の実験に基づいて、我々のモデルは既存の最先端アーキテクチャを大幅に上回っている。
論文 参考訳(メタデータ) (2020-02-11T00:31:31Z) - Variational Denoising Network: Toward Blind Noise Modeling and Removal [59.36166491196973]
ブラインド画像のデノイングはコンピュータビジョンにおいて重要な問題であるが、非常に難しい問題である。
本稿では,ノイズ推定と画像デノーミングを併用した新しい変分推論手法を提案する。
論文 参考訳(メタデータ) (2019-08-29T15:54:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。