論文の概要: Memory augment is All You Need for image restoration
- arxiv url: http://arxiv.org/abs/2309.01377v1
- Date: Mon, 4 Sep 2023 06:02:47 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-06 19:41:53.112931
- Title: Memory augment is All You Need for image restoration
- Title(参考訳): メモリ拡張は、画像復元に必要なすべてです
- Authors: Xiao Feng Zhang, Chao Chen Gu, Shan Ying Zhu
- Abstract要約: メモリネットという3つの粒度メモリ層とコントラスト学習を提案する。
Derain/Deshadow/Deblurタスクの実験は、これらの手法が修復性能の向上に有効であることを示した。
本モデルでは, 劣化型が異なる3つのデータセットに対して, 有意なPSNR, SSIMゲインを得る。
- 参考スコア(独自算出の注目度): 8.480197148953431
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Image restoration is a low-level vision task, most CNN methods are designed
as a black box, lacking transparency and internal aesthetics. Although some
methods combining traditional optimization algorithms with DNNs have been
proposed, they all have some limitations. In this paper, we propose a
three-granularity memory layer and contrast learning named MemoryNet,
specifically, dividing the samples into positive, negative, and actual three
samples for contrastive learning, where the memory layer is able to preserve
the deep features of the image and the contrastive learning converges the
learned features to balance. Experiments on Derain/Deshadow/Deblur task
demonstrate that these methods are effective in improving restoration
performance. In addition, this paper's model obtains significant PSNR, SSIM
gain on three datasets with different degradation types, which is a strong
proof that the recovered images are perceptually realistic. The source code of
MemoryNet can be obtained from https://github.com/zhangbaijin/MemoryNet
- Abstract(参考訳): 画像復元は低レベルの視覚タスクであり、ほとんどのCNNメソッドはブラックボックスとして設計されており、透明性と内部美学に欠ける。
従来の最適化アルゴリズムとDNNを組み合わせた手法が提案されているが、いずれもいくつかの制限がある。
本稿では,メモリ層が画像の深い特徴を保存でき,コントラスト学習がバランスを取るために学習された特徴を収束させる,コントラスト学習のための3次元記憶層と3次元記憶層,特に標本を正、負、実3つのサンプルに分割する。
derain/deshadow/deblurタスクの実験により,これらの手法が修復性能の向上に有効であることが示された。
さらに, 本モデルでは, 劣化型が異なる3つのデータセットに対してPSNR, SSIMゲインを有意な精度で取得し, 得られた画像が知覚的に現実的であることを強く証明する。
MemoryNetのソースコードはhttps://github.com/zhangbaijin/MemoryNetから取得できる。
関連論文リスト
- ReDistill: Residual Encoded Distillation for Peak Memory Reduction [5.532610278442954]
教師・学生の枠組みにおけるピークメモリ削減のための残差符号化蒸留(ReDistill)を提案する。
画像分類では、ほとんどのCNNアーキテクチャにおいて、エッジGPU上で2x-3.2xのピークメモリを出力し、精度の劣化を無視できる。
拡散に基づく画像生成では, 提案手法により, 4倍低い理論ピークメモリを有するデノナイジングネットワークが得られる。
論文 参考訳(メタデータ) (2024-06-06T04:44:10Z) - IRConStyle: Image Restoration Framework Using Contrastive Learning and
Style Transfer [5.361977985410345]
我々は、任意のU-Net構造ネットワークに効率的に統合できる textbfConStyle と呼ばれる、画像復元のための新しいモジュールを提案する。
我々は,デノナイジング,デラミニング,デヘイジングなど,様々な画像修復作業について広範囲にわたる実験を行った。
19のベンチマークの結果は、ConStyleが任意のU-Netベースのネットワークと統合でき、性能を大幅に向上できることを示している。
論文 参考訳(メタデータ) (2024-02-24T10:52:50Z) - Rethinking PRL: A Multiscale Progressively Residual Learning Network for
Inverse Halftoning [3.632876183725243]
逆ハーフトニングは古典的な画像復元作業であり、バイレベルピクセルのみでハーフトーン画像から連続トーン画像を復元することを目的としている。
本稿では,UNetアーキテクチャを持ち,マルチスケールな入力画像を取得する,エンドツーエンドのマルチスケール・残留学習ネットワーク(MSPRL)を提案する。
論文 参考訳(メタデータ) (2023-05-27T03:37:33Z) - Improving Image Recognition by Retrieving from Web-Scale Image-Text Data [68.63453336523318]
本稿では,メモリから抽出した各サンプルの重要性を学習するアテンションベースのメモリモジュールを提案する。
既存の手法と比較して,提案手法は無関係な検索例の影響を排除し,入力クエリに有益であるものを保持する。
我々は、ImageNet-LT、Places-LT、Webvisionのデータセットで最先端の精度を実現していることを示す。
論文 参考訳(メタデータ) (2023-04-11T12:12:05Z) - From seeing to remembering: Images with harder-to-reconstruct
representations leave stronger memory traces [4.012995481864761]
本稿では,画像の特徴埋め込みを圧縮するためのスパース符号化モデルを提案する。
シーン画像のオープンな記憶可能性データセットにおいて、再構成誤差は記憶精度だけでなく、検索中の応答遅延も説明し、後者の場合、強力な視覚のみのモデルによって説明されるすべての分散が説明されることを示す。
論文 参考訳(メタデータ) (2023-02-21T01:40:32Z) - {\mu}Split: efficient image decomposition for microscopy data [50.794670705085835]
muSplitは、蛍光顕微鏡画像の文脈で訓練された画像分解のための専用アプローチである。
本稿では,大規模な画像コンテキストのメモリ効率向上を実現するメタアーキテクチャである横型文脈化(LC)を提案する。
muSplitを5つの分解タスクに適用し、1つは合成データセットに、もう4つは実際の顕微鏡データから導出する。
論文 参考訳(メタデータ) (2022-11-23T11:26:24Z) - Remember What You have drawn: Semantic Image Manipulation with Memory [84.74585786082388]
本稿では,リアルでテキスト変換された画像を生成するメモリベースの画像操作ネットワーク(MIM-Net)を提案する。
頑健なメモリを学習するために,新しいランダム化メモリトレーニング損失を提案する。
4つの一般的なデータセットに対する実験は、既存のデータセットと比較して、我々の手法の優れた性能を示している。
論文 参考訳(メタデータ) (2021-07-27T03:41:59Z) - Image Restoration by Deep Projected GSURE [115.57142046076164]
Ill-posed inverse problem は、デブロアリングや超解像など、多くの画像処理アプリケーションに現れる。
本稿では,一般化されたSteinUnbiased Risk Estimator(GSURE)の「投影変換」とCNNによる潜在画像のパラメータ化を含む損失関数の最小化に基づく,新たな画像復元フレームワークを提案する。
論文 参考訳(メタデータ) (2021-02-04T08:52:46Z) - Neural Sparse Representation for Image Restoration [116.72107034624344]
スパース符号化に基づく画像復元モデルの堅牢性と効率に触発され,深部ネットワークにおけるニューロンの空間性について検討した。
本手法は,隠れたニューロンに対する空間的制約を構造的に強制する。
実験により、複数の画像復元タスクのためのディープニューラルネットワークではスパース表現が不可欠であることが示されている。
論文 参考訳(メタデータ) (2020-06-08T05:15:17Z) - Pyramid Attention Networks for Image Restoration [124.34970277136061]
自己相似性(Self-similarity)とは、画像復元アルゴリズムで広く使われる画像を指す。
近年の深層畳み込みニューラルネットワークによる画像復元手法は, 自己相似性を十分に活用していない。
画像復元のための新しいピラミッドアテンションモジュールを提案し,マルチスケール特徴ピラミッドから長距離特徴対応をキャプチャする。
論文 参考訳(メタデータ) (2020-04-28T21:12:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。