論文の概要: Retinotopic Mapping Enhances the Robustness of Convolutional Neural
Networks
- arxiv url: http://arxiv.org/abs/2402.15480v1
- Date: Fri, 23 Feb 2024 18:15:37 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-26 13:41:35.788233
- Title: Retinotopic Mapping Enhances the Robustness of Convolutional Neural
Networks
- Title(参考訳): retinotopic mappingは畳み込みニューラルネットワークのロバスト性を高める
- Authors: Jean-Nicolas J\'er\'emie and Emmanuel Dauc\'e and Laurent U Perrinet
- Abstract要約: 本研究では,葉緑体視覚の重要成分であるレチノトピックマッピングが,画像分類と局所化性能を向上させることができるかどうかを検討する。
標準オフザシェルフ畳み込みニューラルネットワーク(CNN)の入力にレノトピックマッピングが組み込まれた
驚くべきことに、レチノトピー的にマッピングされたネットワークは、分類において同等のパフォーマンスを達成した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Foveated vision, a trait shared by many animals, including humans, has not
been fully utilized in machine learning applications, despite its significant
contributions to biological visual function. This study investigates whether
retinotopic mapping, a critical component of foveated vision, can enhance image
categorization and localization performance when integrated into deep
convolutional neural networks (CNNs). Retinotopic mapping was integrated into
the inputs of standard off-the-shelf convolutional neural networks (CNNs),
which were then retrained on the ImageNet task. As expected, the
logarithmic-polar mapping improved the network's ability to handle arbitrary
image zooms and rotations, particularly for isolated objects. Surprisingly, the
retinotopically mapped network achieved comparable performance in
classification. Furthermore, the network demonstrated improved classification
localization when the foveated center of the transform was shifted. This
replicates a crucial ability of the human visual system that is absent in
typical convolutional neural networks (CNNs). These findings suggest that
retinotopic mapping may be fundamental to significant preattentive visual
processes.
- Abstract(参考訳): 人間を含む多くの動物が共有するfoveated visionは、生物学的視覚機能に重要な貢献をしているにもかかわらず、機械学習アプリケーションで完全には使われていない。
本研究では,foveated visionの重要な構成要素であるレチノトピーマッピングが,深層畳み込みニューラルネットワーク(cnns)に統合された場合の画像分類と局所化性能を向上させることができるかを検討する。
レチノトピックマッピングは、標準の既製の畳み込みニューラルネットワーク(CNN)の入力に統合され、ImageNetタスクで再トレーニングされた。
予想通り、対数極マッピングはネットワークの任意のズームや回転、特に孤立した物体を扱う能力を改善した。
驚くべきことに、retinotoply mapping networkは分類において同等のパフォーマンスを達成した。
さらに, ネットワークは, 変形の中心がずれた場合に, 分類の局所化が向上することを示した。
これは、典型的な畳み込みニューラルネットワーク(cnns)にはない人間の視覚システムの重要な能力を再現する。
これらの結果から,レチノトピーマッピングは重要な先行視覚過程の基本である可能性が示唆された。
関連論文リスト
- Coding schemes in neural networks learning classification tasks [52.22978725954347]
完全接続型広義ニューラルネットワーク学習タスクについて検討する。
ネットワークが強力なデータ依存機能を取得することを示す。
驚くべきことに、内部表現の性質は神経の非線形性に大きく依存する。
論文 参考訳(メタデータ) (2024-06-24T14:50:05Z) - Graph Neural Networks for Learning Equivariant Representations of Neural Networks [55.04145324152541]
本稿では,ニューラルネットワークをパラメータの計算グラフとして表現することを提案する。
我々のアプローチは、ニューラルネットワークグラフを多種多様なアーキテクチャでエンコードする単一モデルを可能にする。
本稿では,暗黙的ニューラル表現の分類や編集など,幅広いタスクにおける本手法の有効性を示す。
論文 参考訳(メタデータ) (2024-03-18T18:01:01Z) - Unleashing the Power of Depth and Pose Estimation Neural Networks by
Designing Compatible Endoscopic Images [12.412060445862842]
内視鏡画像の特性を詳細に解析し、画像とニューラルネットワークの互換性を改善する。
まず,完全な画像情報の代わりに部分的な画像情報を入力するMask Image Modelling (MIM) モジュールを導入する。
第2に、画像とニューラルネットワークの互換性を明確に向上させるために、内視鏡画像を強化する軽量ニューラルネットワークを提案する。
論文 参考訳(メタデータ) (2023-09-14T02:19:38Z) - Addressing caveats of neural persistence with deep graph persistence [54.424983583720675]
神経の持続性に影響を与える主な要因は,ネットワークの重みのばらつきと大きな重みの空間集中である。
単一層ではなく,ニューラルネットワーク全体へのニューラルネットワークの持続性に基づくフィルタリングの拡張を提案する。
これにより、ネットワーク内の永続的なパスを暗黙的に取り込み、分散に関連する問題を緩和するディープグラフの永続性測定が得られます。
論文 参考訳(メタデータ) (2023-07-20T13:34:11Z) - Increasing the Accuracy of a Neural Network Using Frequency Selective
Mesh-to-Grid Resampling [4.211128681972148]
ニューラルネットワークの入力データの処理にFSMR(Keypoint frequency selective mesh-to-grid resampling)を提案する。
ネットワークアーキテクチャや分類タスクによって、トレーニング中のFSMRの適用は学習プロセスに役立ちます。
ResNet50とOxflower17データセットの分類精度は最大4.31ポイント向上できる。
論文 参考訳(メタデータ) (2022-09-28T21:34:47Z) - Prune and distill: similar reformatting of image information along rat
visual cortex and deep neural networks [61.60177890353585]
深部畳み込み神経ネットワーク(CNN)は、脳の機能的類似、視覚野の腹側流の優れたモデルを提供することが示されている。
ここでは、CNNまたは視覚野の内部表現で知られているいくつかの顕著な統計的パターンについて考察する。
我々は、CNNと視覚野が、オブジェクト表現の次元展開/縮小と画像情報の再構成と、同様の密接な関係を持っていることを示す。
論文 参考訳(メタデータ) (2022-05-27T08:06:40Z) - Biologically inspired deep residual networks for computer vision
applications [0.0]
本稿では, 六角形畳み込みをスキップ接続に沿って導入する, 生物学的にインスパイアされた深部ニューラルネットワークを提案する。
提案手法は,バニラResNetアーキテクチャのベースライン画像分類精度を向上させる。
論文 参考訳(メタデータ) (2022-05-05T10:23:43Z) - Data-driven emergence of convolutional structure in neural networks [83.4920717252233]
識別タスクを解くニューラルネットワークが、入力から直接畳み込み構造を学習できることを示す。
データモデルを慎重に設計することにより、このパターンの出現は、入力の非ガウス的、高次局所構造によって引き起こされることを示す。
論文 参考訳(メタデータ) (2022-02-01T17:11:13Z) - Deep Spiking Convolutional Neural Network for Single Object Localization
Based On Deep Continuous Local Learning [0.0]
グレースケール画像における単一物体の局所化のための深部畳み込みスパイクニューラルネットワークを提案する。
Oxford-IIIT-Petで報告された結果は、教師付き学習アプローチによるスパイクニューラルネットワークの活用を検証する。
論文 参考訳(メタデータ) (2021-05-12T12:02:05Z) - Ventral-Dorsal Neural Networks: Object Detection via Selective Attention [51.79577908317031]
我々はVDNet(Ventral-Dorsal Networks)と呼ばれる新しいフレームワークを提案する。
人間の視覚システムの構造にインスパイアされた我々は「Ventral Network」と「Dorsal Network」の統合を提案する。
実験の結果,提案手法は最先端の物体検出手法よりも優れていることがわかった。
論文 参考訳(メタデータ) (2020-05-15T23:57:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。