論文の概要: Global-Local Processing in Convolutional Neural Networks
- arxiv url: http://arxiv.org/abs/2306.08336v1
- Date: Wed, 14 Jun 2023 08:08:08 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-16 19:47:26.511503
- Title: Global-Local Processing in Convolutional Neural Networks
- Title(参考訳): 畳み込みニューラルネットワークにおけるグローバルローカル処理
- Authors: Zahra Rezvani, Soroor Shekarizeh, Mohammad Sabokrou
- Abstract要約: 畳み込みニューラルネットワーク(CNN)は、画像処理の課題において優れたパフォーマンスを実現している。
CNNは局所的な特徴に非常に偏りがあり、入力のグローバルな側面を検知できないことが研究されている。
人間の瞳孔の無意識行動に触発された,シンプルで効果的な解法を提案する。
- 参考スコア(独自算出の注目度): 9.05607520128194
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Convolutional Neural Networks (CNNs) have achieved outstanding performance on
image processing challenges. Actually, CNNs imitate the typically developed
human brain structures at the micro-level (Artificial neurons). At the same
time, they distance themselves from imitating natural visual perception in
humans at the macro architectures (high-level cognition). Recently it has been
investigated that CNNs are highly biased toward local features and fail to
detect the global aspects of their input. Nevertheless, the literature offers
limited clues on this problem. To this end, we propose a simple yet effective
solution inspired by the unconscious behavior of the human pupil. We devise a
simple module called Global Advantage Stream (GAS) to learn and capture the
holistic features of input samples (i.e., the global features). Then, the GAS
features were combined with a CNN network as a plug-and-play component called
the Global/Local Processing (GLP) model. The experimental results confirm that
this stream improves the accuracy with an insignificant additional
computational/temporal load and makes the network more robust to adversarial
attacks. Furthermore, investigating the interpretation of the model shows that
it learns a more holistic representation similar to the perceptual system of
healthy humans
- Abstract(参考訳): 畳み込みニューラルネットワーク(CNN)は、画像処理の課題において優れたパフォーマンスを達成した。
実際、cnnはマイクロレベルのヒト脳構造(人工ニューロン)を模倣している。
同時に、マクロアーキテクチャ(ハイレベル認知)における人間の自然な視覚知覚の模倣から距離を置いている。
近年,CNNは局所的な特徴に非常に偏りがあり,入力のグローバルな側面を検知できないことが研究されている。
しかしながら、この文献はこの問題に関する限られた手がかりを提供している。
そこで本研究では,人間の瞳孔の無意識行動に触発された単純かつ効果的な解法を提案する。
我々は,Global Advantage Stream (GAS)と呼ばれるシンプルなモジュールを考案し,入力サンプルの全体的特徴(グローバル機能)を学習し,捉える。
次に,グローバル/ローカル処理(glp)モデルと呼ばれるプラグ・アンド・プレイコンポーネントとして,ガスの特徴をcnnネットワークと組み合わせた。
実験の結果,このストリームは計算量や時間負荷を増加させることで精度が向上し,ネットワークを敵の攻撃に対してより堅牢にすることを確認した。
さらに、モデルの解釈を調べることで、健康な人間の知覚システムに似た、より包括的な表現を学習できることが分かる。
関連論文リスト
- Convolutional Neural Networks Exploiting Attributes of Biological
Neurons [7.3517426088986815]
畳み込みニューラルネットワーク(CNN)のようなディープニューラルネットワークは、最前線として登場し、しばしば人間の能力を上回っている。
ここでは,生物ニューロンの原理をCNNの特定の層に統合する。
我々は,CNNの入力として使用する画像の特徴を抽出し,訓練効率の向上と精度の向上を期待する。
論文 参考訳(メタデータ) (2023-11-14T16:58:18Z) - Graph Neural Networks Provably Benefit from Structural Information: A
Feature Learning Perspective [53.999128831324576]
グラフニューラルネットワーク(GNN)は、グラフ表現学習の先駆けとなった。
本研究では,特徴学習理論の文脈におけるグラフ畳み込みの役割について検討する。
論文 参考訳(メタデータ) (2023-06-24T10:21:11Z) - What Can Be Learnt With Wide Convolutional Neural Networks? [69.55323565255631]
カーネルシステムにおける無限大の深層CNNについて検討する。
我々は,深部CNNが対象関数の空間スケールに適応していることを証明する。
我々は、別の深部CNNの出力に基づいて訓練された深部CNNの一般化誤差を計算して結論付ける。
論文 参考訳(メタデータ) (2022-08-01T17:19:32Z) - SAR Despeckling Using Overcomplete Convolutional Networks [53.99620005035804]
スペックルはSAR画像を劣化させるため、リモートセンシングにおいて重要な問題である。
近年の研究では、畳み込みニューラルネットワーク(CNN)が古典的解法よりも優れていることが示されている。
本研究は、受容場を制限することで低レベルの特徴を学習することに集中するために、過剰なCNNアーキテクチャを用いる。
本稿では,合成および実SAR画像の非特定化手法と比較して,提案手法により非特定化性能が向上することを示す。
論文 参考訳(メタデータ) (2022-05-31T15:55:37Z) - Data-driven emergence of convolutional structure in neural networks [83.4920717252233]
識別タスクを解くニューラルネットワークが、入力から直接畳み込み構造を学習できることを示す。
データモデルを慎重に設計することにより、このパターンの出現は、入力の非ガウス的、高次局所構造によって引き起こされることを示す。
論文 参考訳(メタデータ) (2022-02-01T17:11:13Z) - BreakingBED -- Breaking Binary and Efficient Deep Neural Networks by
Adversarial Attacks [65.2021953284622]
CNNのホワイトボックス攻撃やブラックボックス攻撃に対する堅牢性について検討する。
結果は、蒸留されたCNN、エージェントベースの最新のprunedモデル、およびバイナライズニューラルネットワークのために示されています。
論文 参考訳(メタデータ) (2021-03-14T20:43:19Z) - The Mind's Eye: Visualizing Class-Agnostic Features of CNNs [92.39082696657874]
本稿では,特定のレイヤの最も情報性の高い特徴を表現した対応する画像を作成することにより,画像の集合を視覚的に解釈する手法を提案する。
本手法では, 生成ネットワークを必要とせず, 元のモデルに変更を加えることなく, デュアルオブジェクトのアクティベーションと距離損失を利用する。
論文 参考訳(メタデータ) (2021-01-29T07:46:39Z) - Locality Guided Neural Networks for Explainable Artificial Intelligence [12.435539489388708]
LGNN(Locality Guided Neural Network)と呼ばれる,バック伝搬のための新しいアルゴリズムを提案する。
LGNNはディープネットワークの各層内の隣接ニューロン間の局所性を保っている。
実験では,CIFAR100 上の画像分類のための様々な VGG と Wide ResNet (WRN) ネットワークを訓練した。
論文 参考訳(メタデータ) (2020-07-12T23:45:51Z) - Teaching CNNs to mimic Human Visual Cognitive Process & regularise
Texture-Shape bias [18.003188982585737]
コンピュータビジョンにおける最近の実験は、畳み込みニューラルネットワーク(CNN)を用いたモデルにおいて、テクスチャバイアスが最高の結果の主因であることを実証している。
コスト関数は、CNNが欲張りなアプローチを採り、テクスチャのような局所的な情報に対する生産性を向上させ、その結果、グローバルな統計を探索することができないと信じられている。
画像の再構成と分類に形状,テクスチャ,エッジなどの人間の解釈可能な特徴を活用するために,心理学における特徴統合理論から着想を得た,新しい直感的なアーキテクチャであるCognitiveCNNを提案する。
論文 参考訳(メタデータ) (2020-06-25T22:32:54Z) - The shape and simplicity biases of adversarially robust ImageNet-trained
CNNs [9.707679445925516]
本稿では,AlexNet,GoogLeNet,ResNet-50モデルの汎用性を実現するための形状バイアスと内部機構について検討する。
興味深いことに、敵の訓練はCNNの「不正化」過程において隠れたニューロンに3つの単純バイアスを誘導する。
論文 参考訳(メタデータ) (2020-06-16T16:38:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。