論文の概要: TRNR: Task-Driven Image Rain and Noise Removal with a Few Images Based
on Patch Analysis
- arxiv url: http://arxiv.org/abs/2112.01924v1
- Date: Fri, 3 Dec 2021 14:12:15 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-06 15:49:33.067344
- Title: TRNR: Task-Driven Image Rain and Noise Removal with a Few Images Based
on Patch Analysis
- Title(参考訳): TRNR:パッチ解析に基づく少数の画像によるタスク駆動型画像雨とノイズ除去
- Authors: Wu Ran, Bohong Yang, Peirong Ma, and Hong Lu
- Abstract要約: 提案したパッチ解析戦略に基づいて,タスク駆動型画像雨・ノイズ除去(TRNR)を提案する。
TRNRは、適切なデータ以外の豊富なN周波数Kショット学習タスクからニューラルネットワークを学習することを可能にする。
TRNRを利用したMSResNetとDNNetは、大規模ラベル付きデータセットでトレーニングされたデータ駆動の最新のディープラーニング手法よりも優れたパフォーマンスを得た。
- 参考スコア(独自算出の注目度): 3.700062979948223
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The recent prosperity of learning-based image rain and noise removal is
mainly due to the well-designed neural network architectures and large labeled
datasets. However, we find that current image rain and noise removal methods
result in low utilization of images. To alleviate the reliance on large labeled
datasets, we propose the task-driven image rain and noise removal (TRNR) based
on the introduced patch analysis strategy. The patch analysis strategy provides
image patches with various spatial and statistical properties for training and
has been verified to increase the utilization of images. Further, the patch
analysis strategy motivates us to consider learning image rain and noise
removal task-driven instead of data-driven. Therefore we introduce the
N-frequency-K-shot learning task for TRNR. Each N-frequency-K-shot learning
task is based on a tiny dataset containing NK image patches sampled by the
patch analysis strategy. TRNR enables neural networks to learn from abundant
N-frequency-K-shot learning tasks other than from adequate data. To verify the
effectiveness of TRNR, we build a light Multi-Scale Residual Network (MSResNet)
with about 0.9M parameters to learn image rain removal and use a simple ResNet
with about 1.2M parameters dubbed DNNet for blind gaussian noise removal with a
few images (for example, 20.0% train-set of Rain100H). Experimental results
demonstrate that TRNR enables MSResNet to learn better from fewer images. In
addition, MSResNet and DNNet utilizing TRNR have obtained better performance
than most recent deep learning methods trained data-driven on large labeled
datasets. These experimental results have confirmed the effectiveness and
superiority of the proposed TRNR. The codes of TRNR will be public soon.
- Abstract(参考訳): 学習に基づく画像雨とノイズ除去の最近の繁栄は、よく設計されたニューラルネットワークアーキテクチャと大きなラベル付きデータセットによるものである。
しかし,現在の降雨量とノイズ除去法は画像の利用率を低下させることがわかった。
大規模ラベル付きデータセットへの依存を軽減するため,提案したパッチ解析戦略に基づいて,タスク駆動型画像雨・ノイズ除去(TRNR)を提案する。
パッチ解析戦略は,画像の空間的および統計的特性の異なる画像パッチを提供し,画像の利用率を高めることが確認されている。
さらに、パッチ分析戦略は、データ駆動ではなく、画像雨とノイズ除去タスクを学習する動機付けとなる。
そこで,TRNRのためのN周波数Kショット学習タスクを提案する。
各N周波数Kショット学習タスクは、パッチ解析戦略によってサンプリングされたNK画像パッチを含む小さなデータセットに基づいている。
TRNRは、適切なデータ以外の豊富なN周波数Kショット学習タスクからニューラルネットワークを学習することを可能にする。
trnrの有効性を検証するために,画像雨除去を学習するために約0.9mのパラメータを持つ軽量マルチスケール残差ネットワーク(msresnet)を構築し,数枚の画像(例えば20.0%レインセットのレイン100h)を用いたブラインドガウスノイズ除去のために約1.2mパラメータのdnnetを用いた簡易再ネットを用いた。
TRNRにより、より少ない画像からMSResNetを学習できることを示した。
さらに、TRNRを利用したMSResNetとDNNetは、大規模ラベル付きデータセットでトレーニングされたデータ駆動の最近のディープラーニング手法よりも優れたパフォーマンスを得た。
これらの実験結果から提案したTRNRの有効性と優位性が確認された。
TRNRのコードはまもなく公開される。
関連論文リスト
- Residual Transformer Fusion Network for Salt and Pepper Image Denoising [1.0923877073891441]
画像の雑音化は、ノイズの多い画像から発生する余分なノイズを様々な戦略で低減することを目的としている。
この問題を解決するために、Convolutional Vision Transformer(CvT)とResidual Networks(ResNet)を組み合わせたアーキテクチャが使用されている。
このモデルは、DIV2Kトレーニングセットデータセットを使用してトレーニングされ、DIV2K検証セットを使用して検証された。
論文 参考訳(メタデータ) (2025-02-13T06:32:19Z) - Leveraging Neural Radiance Fields for Uncertainty-Aware Visual
Localization [56.95046107046027]
我々は,Neural Radiance Fields (NeRF) を用いてシーン座標回帰のためのトレーニングサンプルを生成することを提案する。
レンダリングにおけるNeRFの効率にもかかわらず、レンダリングされたデータの多くはアーティファクトによって汚染されるか、最小限の情報ゲインしか含まない。
論文 参考訳(メタデータ) (2023-10-10T20:11:13Z) - Deep Multi-Threshold Spiking-UNet for Image Processing [51.88730892920031]
本稿では,SNN(Spike Neural Networks)とU-Netアーキテクチャを組み合わせた,画像処理のためのスパイキング-UNetの概念を紹介する。
効率的なスパイキング-UNetを実現するためには,スパイクによる高忠実度情報伝播の確保と,効果的なトレーニング戦略の策定という2つの課題に直面する。
実験の結果,画像のセグメンテーションとデノイングにおいて,スパイキングUNetは非スパイキングと同等の性能を発揮することがわかった。
論文 参考訳(メタデータ) (2023-07-20T16:00:19Z) - Core Risk Minimization using Salient ImageNet [53.616101711801484]
私たちは、1000のImagenetクラスのコアとスプリアス機能をローカライズする100万人以上のソフトマスクを備えたSalient Imagenetデータセットを紹介します。
このデータセットを用いて、まず、いくつかのImagenet事前訓練されたモデル(総計42件)の素早い特徴に対する依存度を評価する。
次に、コアリスク最小化(CoRM)と呼ばれる新しい学習パラダイムを導入する。
論文 参考訳(メタデータ) (2022-03-28T01:53:34Z) - Influence of image noise on crack detection performance of deep
convolutional neural networks [0.0]
深層畳み込みニューラルネットワークを用いた画像データからのひび割れの分類について多くの研究がなされている。
本稿では,画像ノイズがネットワークの精度に与える影響について検討する。
AlexNetは提案したインデックスに基づいて最も効率的なモデルに選ばれた。
論文 参考訳(メタデータ) (2021-11-03T09:08:54Z) - Self-Denoising Neural Networks for Few Shot Learning [66.38505903102373]
既存のニューラルアーキテクチャの複数の段階でノイズを追加すると同時に、この付加ノイズに対して堅牢であるように学習する新しいトレーニングスキームを提案する。
このアーキテクチャは、SDNN(Self-Denoising Neural Network)と呼ばれ、現代の畳み込みニューラルネットワークに容易に適用できます。
論文 参考訳(メタデータ) (2021-10-26T03:28:36Z) - Image Denoising using Attention-Residual Convolutional Neural Networks [0.0]
本稿では,学習に基づく新たな非盲検手法であるAttention Residual Convolutional Neural Network (ARCNN)を提案し,その拡張としてFlexible Attention Residual Convolutional Neural Network (FARCNN)を提案する。
ARCNNはガウス語とポアソン語で約0.44dBと0.96dBの平均PSNR結果を達成し、FARCNNはARCNNに比べて若干パフォーマンスが悪くても非常に一貫した結果を示した。
論文 参考訳(メタデータ) (2021-01-19T16:37:57Z) - Deep Networks for Direction-of-Arrival Estimation in Low SNR [89.45026632977456]
我々は,真の配列多様体行列の変異チャネルデータから学習した畳み込みニューラルネットワーク(CNN)を導入する。
我々は低SNR体制でCNNを訓練し、すべてのSNRでDoAを予測する。
私たちの堅牢なソリューションは、ワイヤレスアレイセンサーから音響マイクロフォンやソナーまで、いくつかの分野に適用できます。
論文 参考訳(メタデータ) (2020-11-17T12:52:18Z) - Cross-Scale Internal Graph Neural Network for Image Super-Resolution [147.77050877373674]
自然画像における非局所的な自己相似性は、画像修復に有効な先行研究として、よく研究されている。
単一の画像超解像(SISR)の場合、既存のディープ非局所法のほとんどは、低解像度(LR)入力画像と同じ規模のパッチしか利用していない。
これは、新しいクロススケールな内部グラフニューラルネットワーク(IGNN)を用いて実現される。
論文 参考訳(メタデータ) (2020-06-30T10:48:40Z) - SAR Image Despeckling by Deep Neural Networks: from a pre-trained model
to an end-to-end training strategy [8.097773654147105]
畳み込みニューラルネットワーク(CNN)は、最近、SAR画像復元の最先端のパフォーマンスに達することが示されている。
CNNトレーニングには、多くのスペックルフリー/スペックル故障した画像のペアという、優れたトレーニングデータが必要です。
本稿では,実施したいスペックル除去作業に応じて,採用可能なさまざまな戦略を解析する。
論文 参考訳(メタデータ) (2020-06-28T09:47:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。