論文の概要: Residual Transformer Fusion Network for Salt and Pepper Image Denoising
- arxiv url: http://arxiv.org/abs/2502.09000v1
- Date: Thu, 13 Feb 2025 06:32:19 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-14 13:49:39.766412
- Title: Residual Transformer Fusion Network for Salt and Pepper Image Denoising
- Title(参考訳): 塩・ペッパー画像復調のための残留変圧器核融合ネットワーク
- Authors: Bintang Pradana Erlangga Putra, Heri Prasetyo, Esti Suryani,
- Abstract要約: 画像の雑音化は、ノイズの多い画像から発生する余分なノイズを様々な戦略で低減することを目的としている。
この問題を解決するために、Convolutional Vision Transformer(CvT)とResidual Networks(ResNet)を組み合わせたアーキテクチャが使用されている。
このモデルは、DIV2Kトレーニングセットデータセットを使用してトレーニングされ、DIV2K検証セットを使用して検証された。
- 参考スコア(独自算出の注目度): 1.0923877073891441
- License:
- Abstract: Convolutional Neural Network (CNN) has been widely used in unstructured datasets, one of which is image denoising. Image denoising is a noisy image reconstruction process that aims to reduce additional noise that occurs from the noisy image with various strategies. Image denoising has a problem, namely that some image denoising methods require some prior knowledge of information about noise. To overcome this problem, a combined architecture of Convolutional Vision Transformer (CvT) and Residual Networks (ResNet) is used which is called the Residual Transformer Fusion Network (RTF-Net). In general, the process in this architecture can be divided into two parts, Noise Suppression Network (NSN) and Structure Enhancement Network (SEN). Residual Block is used in the Noise Suppression Network and is used to learn the noise map in the image, while the CvT is used in the Structure Enhancement Network and is used to learn the details that need to be added to the image processed by the Noise Suppression Network. The model was trained using the DIV2K Training Set dataset, and validation using the DIV2K Validation Set. After doing the training, the model was tested using Lena, Bridge, Pepper, and BSD300 images with noise levels ranging from 30%, 50%, and 70% and the PSNR results were compared with the DBA, NASNLM, PARIGI, NLSF, NLSF-MLP and NLSF-CNN methods. The test results show that the proposed method is superior in all cases except for Pepper's image with a noise level of 30%, where NLSF-CNN is superior with a PSNR value of 32.99 dB, while the proposed method gets a PSNR value of 31.70 dB.
- Abstract(参考訳): 畳み込みニューラルネットワーク(CNN)は、非構造化データセットで広く使われている。
画像復号化は,様々な戦略でノイズ画像から発生する余分なノイズを低減することを目的とした,ノイズの多い画像再構成プロセスである。
画像の復調には問題があり、画像の復調にはノイズに関する情報の事前の知識が必要である。
この問題を解決するために、Residual Transformer Fusion Network (RTF-Net)と呼ばれるConvolutional Vision Transformer (CvT) とResidual Networks (Residual Networks) を組み合わせたアーキテクチャが使用されている。
一般に、このアーキテクチャのプロセスは、ノイズ抑制ネットワーク(NSN)と構造強化ネットワーク(SEN)の2つの部分に分けられる。
残差ブロックはノイズ抑圧ネットワークで使用され、画像内のノイズマップを学習するために使用される一方、CvTは構造拡張ネットワークで使用され、ノイズ抑圧ネットワークによって処理された画像に付加されるために必要な詳細を学習するために使用される。
このモデルは、DIV2Kトレーニングセットデータセットを使用してトレーニングされ、DIV2K検証セットを使用して検証された。
トレーニング後,Lena, Bridge, Pepper, BSD300画像のノイズレベルを30%, 50%, 70%とし,PSNRの結果をDBA, NASNLM, PARIGI, NLSF, NLSF-MLP, NLSF-CNN法と比較した。
NLSF-CNNではPSNRが32.99dB、提案手法ではPSNRが31.70dBである。
関連論文リスト
- A cross Transformer for image denoising [83.68175077524111]
直列ブロック(SB)、並列ブロック(PB)、残留ブロック(RB)を備えたクロストランスフォーマー(CTNet)を提案する。
CTNetは、実画像や合成画像のデノナイジングにおいて、一般的なデノナイジング法よりも優れている。
論文 参考訳(メタデータ) (2023-10-16T13:53:19Z) - Spatially Adaptive Self-Supervised Learning for Real-World Image
Denoising [73.71324390085714]
本稿では,現実の sRGB 画像復号化の問題を解決するために,新しい視点を提案する。
ノイズの多い画像における平坦領域とテクスチャ領域のそれぞれの特徴を考慮し、それらを個別に管理する。
LAN自体がBNNの出力で管理されているのに対して,我々はその要件を満たすためのローカル・アウェア・ネットワーク(LAN)を提案する。
論文 参考訳(メタデータ) (2023-03-27T06:18:20Z) - Multi-stage image denoising with the wavelet transform [125.2251438120701]
深部畳み込みニューラルネットワーク(Deep Convolutional Neural Network, CNN)は、正確な構造情報を自動マイニングすることで、画像の復調に使用される。
動的畳み込みブロック(DCB)、2つのカスケードウェーブレット変換および拡張ブロック(WEB)、残留ブロック(RB)の3段階を経由した、MWDCNNによるCNNの多段階化を提案する。
論文 参考訳(メタデータ) (2022-09-26T03:28:23Z) - Robust Deep Ensemble Method for Real-world Image Denoising [62.099271330458066]
そこで本研究では,実世界の画像認識のための単純なベイズディープアンサンブル(BDE)手法を提案する。
我々のBDEは、最先端の復調法よりも+0.28dBPSNRのゲインを達成している。
我々のBDEは他の画像復元タスクにも拡張でき、ベンチマークデータセット上で+0.30dB、+0.18dB、+0.12dB PSNRゲインを達成することができる。
論文 参考訳(メタデータ) (2022-06-08T06:19:30Z) - Practical Blind Image Denoising via Swin-Conv-UNet and Data Synthesis [148.16279746287452]
本研究では,残差畳み込み層の局所モデリング能力とスウィントランスブロックの非局所モデリング能力を組み込むスウィンコンブブロックを提案する。
トレーニングデータ合成のために,異なる種類のノイズを考慮した実用的なノイズ劣化モデルの設計を行う。
AGWN除去と実画像復号化の実験は、新しいネットワークアーキテクチャ設計が最先端の性能を達成することを実証している。
論文 参考訳(メタデータ) (2022-03-24T18:11:31Z) - Feature-Align Network and Knowledge Distillation for Efficient Denoising [4.997028216419175]
深層学習に基づくRAW画像復調は画像復元において重要な問題である。
モバイルデバイス上での効率的なRAWデノベーションのための新しいネットワークを提案する。
MACが263倍、パラメータが最新ネットワークよりも17.6倍少ない48.28dBのPSNRを実現します。
論文 参考訳(メタデータ) (2021-03-02T07:09:32Z) - Image Denoising using Attention-Residual Convolutional Neural Networks [0.0]
本稿では,学習に基づく新たな非盲検手法であるAttention Residual Convolutional Neural Network (ARCNN)を提案し,その拡張としてFlexible Attention Residual Convolutional Neural Network (FARCNN)を提案する。
ARCNNはガウス語とポアソン語で約0.44dBと0.96dBの平均PSNR結果を達成し、FARCNNはARCNNに比べて若干パフォーマンスが悪くても非常に一貫した結果を示した。
論文 参考訳(メタデータ) (2021-01-19T16:37:57Z) - Neighbor2Neighbor: Self-Supervised Denoising from Single Noisy Images [98.82804259905478]
Neighbor2Neighborを提示し、ノイズの多い画像のみで効果的な画像消音モデルをトレーニングします。
ネットワークのトレーニングに使用される入力とターゲットは、同じノイズ画像からサブサンプリングされた画像である。
デノイジングネットワークは、第1段階で生成されたサブサンプルトレーニングペアで訓練され、提案された正規化器は、より良いパフォーマンスのための追加の損失として訓練される。
論文 参考訳(メタデータ) (2021-01-08T02:03:25Z) - Image Denoising for Strong Gaussian Noises With Specialized CNNs for
Different Frequency Components [4.010371060637209]
ニューラルネットワークをデノイズ化するための機械学習アプローチでは、ノイズの多い画像からクリーンなイメージを復元するために訓練される。
本稿では,複数の特化ネットワークのトレーニングに基づく新しい構造を提案する。
論文 参考訳(メタデータ) (2020-11-26T23:20:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。