論文の概要: An Empirical Method to Quantify the Peripheral Performance Degradation
in Deep Networks
- arxiv url: http://arxiv.org/abs/2012.02749v1
- Date: Fri, 4 Dec 2020 18:00:47 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-22 20:48:01.803706
- Title: An Empirical Method to Quantify the Peripheral Performance Degradation
in Deep Networks
- Title(参考訳): ディープネットワークにおける周辺性能劣化の定量化のための経験的手法
- Authors: Calden Wloka and John K. Tsotsos
- Abstract要約: 畳み込みニューラルネットワーク(CNN)カーネルは、各畳み込み層に結合する。
より深いネットワークとストライドベースのダウンサンプリングを組み合わせることで、この領域の伝播は、画像の無視できない部分をカバーすることができる。
我々のデータセットは、高解像度の背景にオブジェクトを挿入することで構築され、画像境界に対してターゲットオブジェクトを特定の位置に配置するサブイメージを収穫することができる。
マスクR-CNNの動作を目標位置の選択にわたって探索することにより、画像境界付近、特に画像コーナーにおいて、パフォーマンス劣化の明確なパターンが明らかになる。
- 参考スコア(独自算出の注目度): 18.808132632482103
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: When applying a convolutional kernel to an image, if the output is to remain
the same size as the input then some form of padding is required around the
image boundary, meaning that for each layer of convolution in a convolutional
neural network (CNN), a strip of pixels equal to the half-width of the kernel
size is produced with a non-veridical representation. Although most CNN kernels
are small to reduce the parameter load of a network, this non-veridical area
compounds with each convolutional layer. The tendency toward deeper and deeper
networks combined with stride-based down-sampling means that the propagation of
this region can end up covering a non-negligable portion of the image. Although
this issue with convolutions has been well acknowledged over the years, the
impact of this degraded peripheral representation on modern network behavior
has not been fully quantified. What are the limits of translation invariance?
Does image padding successfully mitigate the issue, or is performance affected
as an object moves between the image border and center? Using Mask R-CNN as an
experimental model, we design a dataset and methodology to quantify the spatial
dependency of network performance. Our dataset is constructed by inserting
objects into high resolution backgrounds, thereby allowing us to crop
sub-images which place target objects at specific locations relative to the
image border. By probing the behaviour of Mask R-CNN across a selection of
target locations, we see clear patterns of performance degredation near the
image boundary, and in particular in the image corners. Quantifying both the
extent and magnitude of this spatial anisotropy in network performance is
important for the deployment of deep networks into unconstrained and realistic
environments in which the location of objects or regions of interest are not
guaranteed to be well localized within a given image.
- Abstract(参考訳): 画像に畳み込みカーネルを適用する場合、出力が入力と同じサイズである場合、画像境界付近で何らかのパディングが要求される。つまり、畳み込みニューラルネットワーク(CNN)における畳み込みの各層に対して、カーネルサイズの半幅に相当する画素のストリップを、非正則表現で生成する。
ほとんどのcnnカーネルはネットワークのパラメータ負荷を減らすために小さいが、この非バーティカル領域はそれぞれの畳み込み層を持つ。
深層・深層ネットワークとストライドベースのダウンサンプリングを組み合わせる傾向は、この領域の伝播が画像の無視できない部分をカバーすることになることを意味する。
この畳み込みに関する問題は長年にわたってよく認識されてきたが、現代のネットワーク行動に対する周辺表現の劣化の影響は十分に定量化されていない。
翻訳の不変性の限界は何か?
画像パディングは問題を軽減するか、あるいは物体が画像境界と中心の間を移動するときに性能に影響するか?
実験モデルとしてMask R-CNNを用いて,ネットワーク性能の空間依存性を定量化するデータセットと手法を設計する。
我々のデータセットは、高解像度の背景にオブジェクトを挿入することで構築され、画像境界に対してターゲットオブジェクトを特定の位置に配置するサブイメージを収穫することができる。
対象位置の選択を通してマスクr-cnnの挙動を調べることにより,画像境界近傍,特に画像コーナー付近における性能低下パターンが明らかになる。
ネットワーク性能におけるこの空間異方性の範囲と大きさの定量化は、被写体や関心領域の位置が所定の画像内で十分に局所化されることが保証されない制約のない現実的な環境にディープネットワークを配置する上で重要である。
関連論文リスト
- DDU-Net: A Domain Decomposition-based CNN for High-Resolution Image Segmentation on Multiple GPUs [46.873264197900916]
ドメイン分解に基づくU-Netアーキテクチャを導入し、入力イメージを重複しないパッチに分割する。
空間コンテキストの理解を高めるために、パッチ間情報交換を容易にするための通信ネットワークが追加される。
その結果、この手法は、パッチ間通信のない同一ネットワークと比較して、IoU(Universal over Union)スコアよりも2~3,%高い交点を達成できることが判明した。
論文 参考訳(メタデータ) (2024-07-31T01:07:21Z) - Mutual-Guided Dynamic Network for Image Fusion [51.615598671899335]
画像融合のための新しい相互誘導動的ネットワーク(MGDN)を提案する。
5つのベンチマークデータセットによる実験結果から,提案手法は4つの画像融合タスクにおいて既存手法よりも優れていることが示された。
論文 参考訳(メタデータ) (2023-08-24T03:50:37Z) - CEC-CNN: A Consecutive Expansion-Contraction Convolutional Network for
Very Small Resolution Medical Image Classification [0.8108972030676009]
深層・中層・浅層からのマルチスケール特徴を保存できる新しいCNNアーキテクチャを提案する。
膵管腺癌(PDAC)CTの超低解像度パッチのデータセットを用いて,我々のネットワークが最先端のアートモデルより優れていることを示す。
論文 参考訳(メタデータ) (2022-09-27T20:01:12Z) - Global and Local Alignment Networks for Unpaired Image-to-Image
Translation [170.08142745705575]
未ペア画像から画像への変換の目的は、対象領域のスタイルを反映した出力画像を作成することである。
既存の手法では内容変化に注意が払われていないため、ソース画像からの意味情報は翻訳中の劣化に悩まされる。
我々はGLA-Net(Global and Local Alignment Networks)という新しいアプローチを導入する。
本手法は既存の手法よりもシャープでリアルな画像を効果的に生成する。
論文 参考訳(メタデータ) (2021-11-19T18:01:54Z) - Spatially-Adaptive Image Restoration using Distortion-Guided Networks [51.89245800461537]
空間的に変化する劣化に苦しむ画像の復元のための学習ベースソリューションを提案する。
本研究では、歪み局所化情報を活用し、画像中の困難な領域に動的に適応するネットワーク設計であるSPAIRを提案する。
論文 参考訳(メタデータ) (2021-08-19T11:02:25Z) - AINet: Association Implantation for Superpixel Segmentation [82.21559299694555]
今回提案する新しいtextbfAssociation textbfImplantation(AI)モジュールは、ネットワークがピクセルとその周辺グリッド間の関係を明示的にキャプチャすることを可能にする。
本手法は最先端性能を実現するだけでなく,十分な推論効率を維持することができた。
論文 参考訳(メタデータ) (2021-01-26T10:40:13Z) - Deformable spatial propagation network for depth completion [2.5306673456895306]
本稿では,各画素に対して異なる受容場と親和性行列を適応的に生成する変形可能な空間伝搬ネットワーク(DSPN)を提案する。
これにより、ネットワークは伝播のためのより少ないがより関連性の高い情報を得ることができる。
論文 参考訳(メタデータ) (2020-07-08T16:39:50Z) - Multi-scale Cloud Detection in Remote Sensing Images using a Dual
Convolutional Neural Network [4.812718493682455]
CNNは、リモートセンシング画像のピクセルレベルの分類において、最先端の技術を進歩させた。
アンサンプとフル解像度の画像を逐次処理する2つのCNNモデルコンポーネントのアーキテクチャを提案する。
パッチによるCNNベースラインの画素精度は16%向上した。
論文 参考訳(メタデータ) (2020-06-01T10:27:42Z) - Image Fine-grained Inpainting [89.17316318927621]
拡張畳み込みの密結合を利用してより大きく効果的な受容場を得る一段階モデルを提案する。
この効率的なジェネレータをよく訓練するために、頻繁に使用されるVGG特徴整合損失を除いて、新しい自己誘導回帰損失を設計する。
また、局所的・グローバルな分枝を持つ識別器を用いて、局所的・グローバルな内容の整合性を確保する。
論文 参考訳(メタデータ) (2020-02-07T03:45:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。