論文の概要: Noise-Equipped Convolutional Neural Networks
- arxiv url: http://arxiv.org/abs/2012.12109v1
- Date: Wed, 9 Dec 2020 09:01:45 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-16 02:09:52.284364
- Title: Noise-Equipped Convolutional Neural Networks
- Title(参考訳): 雑音付き畳み込みニューラルネットワーク
- Authors: Menghan Xia and Tien-Tsin Wong
- Abstract要約: Convolutional Neural Network (CNN)は、画像合成および翻訳タスクに広く採用されています。
CNNモデルにフラットな入力が与えられると、畳み込みカーネルの空間的共有性により、変換はスケール操作に分解される。
- 参考スコア(独自算出の注目度): 15.297063646935078
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: As a generic modeling tool, Convolutional Neural Network (CNN) has been
widely employed in image synthesis and translation tasks. However, when a CNN
model is fed with a flat input, the transformation degrades into a scaling
operation due to the spatial sharing nature of convolution kernels. This
inherent problem has been barely studied nor raised as an application
restriction. In this paper, we point out that such convolution degradation
actually hinders some specific image generation tasks that expect value-variant
output from a flat input. We study the cause behind it and propose a generic
solution to tackle it. Our key idea is to break the flat input condition
through a proxy input module that perturbs the input data symmetrically with a
noise map and reassembles them in feature domain. We call it noise-equipped CNN
model and study its behavior through multiple analysis. Our experiments show
that our model is free of degradation and hence serves as a superior
alternative to standard CNN models. We further demonstrate improved
performances of applying our model to existing applications, e.g. semantic
photo synthesis and color-encoded grayscale generation.
- Abstract(参考訳): 一般的なモデリングツールとして、畳み込みニューラルネットワーク(CNN)は画像合成や翻訳タスクに広く利用されている。
しかし、cnnモデルに平坦な入力が供給されると、畳み込み核の空間的共有性のため、変換はスケーリング操作に分解される。
この本質的な問題は、アプリケーション制限としてほとんど研究されていない。
本稿では,このような畳み込み劣化が,フラット入力から出力される値変化を期待する特定の画像生成タスクを実際に妨げていることを指摘する。
我々はその背後にある原因を研究し、それに取り組むための汎用的な解決策を提案する。
私たちのキーとなるアイデアは、フラットな入力条件をプロキシ入力モジュールによって破り、入力データをノイズマップと対称に摂動させ、特徴領域で再組み立てすることです。
ノイズ付きcnnモデルと呼び、複数の分析を通してその挙動を研究する。
実験の結果,我々のモデルには劣化がなく,標準CNNモデルよりも優れた代替手段となることがわかった。
既存のアプリケーションにモデルを適用した場合のパフォーマンスも向上する。
セマンティックフォト合成とカラーエンコードグレースケール生成
関連論文リスト
- Truly Scale-Equivariant Deep Nets with Fourier Layers [14.072558848402362]
コンピュータビジョンでは、モデルが画像の解像度の変化に適応し、画像分割などのタスクを効果的に実行できなければならない。
最近の研究は、ウェイトシェアリングとカーネルのリサイズを通じて、スケール平等な畳み込みニューラルネットワークの開発を進展させた。
本稿では,Fourier層に基づく新しいアーキテクチャを提案する。
論文 参考訳(メタデータ) (2023-11-06T07:32:27Z) - Lossy Image Compression with Conditional Diffusion Models [25.158390422252097]
本稿では,拡散生成モデルを用いた画像圧縮のエンドツーエンド最適化について概説する。
VAEベースのニューラル圧縮とは対照的に、(平均)デコーダは決定論的ニューラルネットワークであり、私たちのデコーダは条件付き拡散モデルである。
提案手法では,GANモデルよりもFIDスコアが強く,VAEモデルとの競合性能も高い。
論文 参考訳(メタデータ) (2022-09-14T21:53:27Z) - Interpretations Steered Network Pruning via Amortized Inferred Saliency
Maps [85.49020931411825]
限られたリソースを持つエッジデバイスにこれらのモデルをデプロイするには、畳み込みニューラルネットワーク(CNN)圧縮が不可欠である。
本稿では,新しい視点からチャネルプルーニング問題に対処するために,モデルの解釈を活用して,プルーニング過程を解析する手法を提案する。
本研究では,実時間スムーズなスムーズなスムーズなスムーズなマスク予測を行うセレクタモデルを導入することで,この問題に対処する。
論文 参考訳(メタデータ) (2022-09-07T01:12:11Z) - Restormer: Efficient Transformer for High-Resolution Image Restoration [118.9617735769827]
畳み込みニューラルネットワーク(CNN)は、大規模データから一般化可能な画像の事前学習をうまく行う。
トランスフォーマーは、自然言語とハイレベルな視覚タスクにおいて、顕著なパフォーマンス向上を示している。
我々のモデルであるRecovery Transformer (Restormer) は、いくつかの画像復元タスクにおいて最先端の結果を得る。
論文 参考訳(メタデータ) (2021-11-18T18:59:10Z) - Deep Neural Networks are Surprisingly Reversible: A Baseline for
Zero-Shot Inversion [90.65667807498086]
本稿では、内部表現のみを与えられたトレーニングモデルへの入力を復元するゼロショット直接モデル逆変換フレームワークを提案する。
ImageNetの最新の分類モデルでは、20層以上の表現から元の224x224px画像を近似的に復元できることを実証的に示す。
論文 参考訳(メタデータ) (2021-07-13T18:01:43Z) - Content-Aware Convolutional Neural Networks [98.97634685964819]
畳み込みニューラルネットワーク(CNN)は、畳み込み層の強力な特徴学習能力によって大きな成功を収めている。
本研究では,スムーズなウィンドウを自動的に検出し,元の大規模カーネルを置き換えるために1x1畳み込みカーネルを適用するContent-aware Convolution (CAC)を提案する。
論文 参考訳(メタデータ) (2021-06-30T03:54:35Z) - How Convolutional Neural Networks Deal with Aliasing [0.0]
画像分類器cnnは、原則としてアンチエイリアスフィルタを実装できるが、中間層でエイリアスが発生するのを防げないことを示す。
まず,入力時の発振を識別するCNNの能力を評価し,中間チャネルの冗長性がタスクの成功に重要な役割を担っていることを示す。
第2に、画像分類器CNNは、原則として、アンチエイリアスフィルタを実装することができるが、中間層でエイリアスを行うのを妨げないことを示す。
論文 参考訳(メタデータ) (2021-02-15T18:52:47Z) - When to Use Convolutional Neural Networks for Inverse Problems [40.60063929073102]
本稿では,畳み込みニューラルネットワークを,畳み込みスパース符号問題に対する近似解とみなすことができることを示す。
ある種の逆問題に対して、CNN近似は性能の低下につながると論じる。
具体的には、JPEGアーチファクトの低減と非剛性軌道再構成をCNNの逆問題として同定する。
論文 参考訳(メタデータ) (2020-03-30T21:08:14Z) - CycleISP: Real Image Restoration via Improved Data Synthesis [166.17296369600774]
本稿では,前向きと逆方向のカメラ画像パイプラインをモデル化するフレームワークを提案する。
リアルな合成データに基づいて新しい画像認識ネットワークをトレーニングすることにより、実際のカメラベンチマークデータセット上で最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2020-03-17T15:20:25Z) - Learning to Encode Position for Transformer with Continuous Dynamical
Model [88.69870971415591]
本研究では,トランスフォーマーモデルなどの非リカレントモデルの位置情報をエンコードする新しい学習方法を提案する。
このような力学系による位置指数に沿った符号化結果の進化をモデル化する。
論文 参考訳(メタデータ) (2020-03-13T00:41:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。