論文の概要: VCNet: Recreating High-Level Visual Cortex Principles for Robust Artificial Vision
- arxiv url: http://arxiv.org/abs/2508.02995v1
- Date: Tue, 05 Aug 2025 01:52:42 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-06 18:18:55.73546
- Title: VCNet: Recreating High-Level Visual Cortex Principles for Robust Artificial Vision
- Title(参考訳): VCNet:ロバストな人工視覚のための高レベルな視覚皮質原理を再現する
- Authors: Brennen A. Hill, Zhang Xinyu, Timothy Putra Prasetio,
- Abstract要約: 本稿では,霊長類視覚野のマクロスケール構造に基づく新しいニューラルネットワークアーキテクチャであるVisual Cortex Network(VCNet)を紹介する。
VCNetは、異なる皮質領域にわたる階層的処理、二重ストリーム情報分離、トップダウン予測フィードバックなど、重要な生物学的メカニズムをエミュレートする。
以上の結果から,VCNetはSpots-10では92.1%,光場データセットでは74.4%の分類精度を達成し,同規模の同時代のモデルを上回った。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Despite their success in image classification, modern convolutional neural networks (CNNs) exhibit fundamental limitations, including data inefficiency, poor out-of-distribution generalization, and vulnerability to adversarial perturbations. The primate visual system, in contrast, demonstrates superior efficiency and robustness, suggesting that its architectural principles may offer a blueprint for more capable artificial vision systems. This paper introduces Visual Cortex Network (VCNet), a novel neural network architecture whose design is informed by the macro-scale organization of the primate visual cortex. VCNet emulates key biological mechanisms, including hierarchical processing across distinct cortical areas, dual-stream information segregation, and top-down predictive feedback. We evaluate VCNet on two specialized benchmarks: the Spots-10 animal pattern dataset and a light field image classification task. Our results show that VCNet achieves a classification accuracy of 92.1\% on Spots-10 and 74.4\% on the light field dataset, surpassing contemporary models of comparable size. This work demonstrates that integrating neuroscientific principles into network design can lead to more efficient and robust models, providing a promising direction for addressing long-standing challenges in machine learning.
- Abstract(参考訳): 画像分類の成功にもかかわらず、現代の畳み込みニューラルネットワーク(CNN)は、データ非効率性、分布外一般化の貧弱さ、敵の摂動に対する脆弱性など、基本的な制限を示す。
対照的に霊長類視覚系は優れた効率性と堅牢性を示し、そのアーキテクチャ原理がより有能な人工視覚系のための青写真を提供する可能性があることを示唆している。
本稿では,霊長類視覚野のマクロな構成によってデザインを通知する新しいニューラルネットワークアーキテクチャであるVisual Cortex Network(VCNet)を紹介する。
VCNetは、異なる皮質領域にわたる階層的処理、二重ストリーム情報分離、トップダウン予測フィードバックなど、重要な生物学的メカニズムをエミュレートする。
我々は、Spots-10動物パターンデータセットと光フィールド画像分類タスクの2つの特別なベンチマークでVCNetを評価した。
以上の結果から,VCNetはSpots-10では92.1\%,光場データセットでは74.4\%の分類精度を達成し,同規模の同時代のモデルを上回った。
この研究は、神経科学的原則をネットワーク設計に統合することで、より効率的で堅牢なモデルが実現し、機械学習における長年の課題に対処するための有望な方向性を提供することを示した。
関連論文リスト
- V-EfficientNets: Vector-Valued Efficiently Scaled Convolutional Neural Network Models [0.4143603294943439]
V-EfficientNetsは任意のベクトル値データを処理するように設計されたEfficientNetの新たな拡張である。
提案手法は医用画像分類タスクで評価され,平均精度は99.46%である。
V-EfficientNetsは優れた効率を示し、パラメータを著しく削減し、最先端モデルより優れている。
論文 参考訳(メタデータ) (2025-05-08T21:35:35Z) - Exploring Neural Network Pruning with Screening Methods [3.443622476405787]
現代のディープラーニングモデルは数千万のパラメータを持ち、推論プロセスはリソース集約化されている。
本稿では,非必須パラメータを除去するネットワーク・プルーニング・フレームワークの提案と評価を行う。
提案するフレームワークは,従来のネットワークと比較して,競争力のあるリーンネットワークを生成する。
論文 参考訳(メタデータ) (2025-02-11T02:31:04Z) - Task-Oriented Real-time Visual Inference for IoVT Systems: A Co-design Framework of Neural Networks and Edge Deployment [61.20689382879937]
タスク指向エッジコンピューティングは、データ分析をエッジにシフトすることで、この問題に対処する。
既存の手法は、高いモデル性能と低いリソース消費のバランスをとるのに苦労している。
ニューラルネットワークアーキテクチャを最適化する新しい協調設計フレームワークを提案する。
論文 参考訳(メタデータ) (2024-10-29T19:02:54Z) - Towards Scalable and Versatile Weight Space Learning [51.78426981947659]
本稿では,重み空間学習におけるSANEアプローチを紹介する。
ニューラルネットワーク重みのサブセットの逐次処理に向けて,超表現の概念を拡張した。
論文 参考訳(メタデータ) (2024-06-14T13:12:07Z) - Applying Self-supervised Learning to Network Intrusion Detection for
Network Flows with Graph Neural Network [8.318363497010969]
本稿では,教師なし型ネットワークフローの特定のためのGNNの適用について検討する。
我々の知る限り、NIDSにおけるネットワークフローのマルチクラス分類のための最初のGNNベースの自己教師方式である。
論文 参考訳(メタデータ) (2024-03-03T12:34:13Z) - Unveiling the Unseen: Identifiable Clusters in Trained Depthwise
Convolutional Kernels [56.69755544814834]
深部分離型畳み込みニューラルネットワーク(DS-CNN)の最近の進歩は、新しいアーキテクチャをもたらす。
本稿では,DS-CNNアーキテクチャのもう一つの顕著な特性を明らかにする。
論文 参考訳(メタデータ) (2024-01-25T19:05:53Z) - Visual Prompting Upgrades Neural Network Sparsification: A Data-Model Perspective [64.04617968947697]
より優れた重量空間を実現するために、新しいデータモデル共設計視点を導入する。
具体的には、提案したVPNフレームワークでニューラルネットワークのスパーシフィケーションをアップグレードするために、カスタマイズされたVisual Promptが実装されている。
論文 参考訳(メタデータ) (2023-12-03T13:50:24Z) - ElegansNet: a brief scientific report and initial experiments [0.0]
ElegansNetは、現実世界のニューラルネットワーク回路を模倣するニューラルネットワークである。
自然ネットワークに似たトポロジを持つ改良されたディープラーニングシステムを生成する。
論文 参考訳(メタデータ) (2023-04-06T13:51:04Z) - Data-driven emergence of convolutional structure in neural networks [83.4920717252233]
識別タスクを解くニューラルネットワークが、入力から直接畳み込み構造を学習できることを示す。
データモデルを慎重に設計することにより、このパターンの出現は、入力の非ガウス的、高次局所構造によって引き起こされることを示す。
論文 参考訳(メタデータ) (2022-02-01T17:11:13Z) - CondenseNeXt: An Ultra-Efficient Deep Neural Network for Embedded
Systems [0.0]
畳み込みニューラルネットワーク(英: Convolutional Neural Network, CNN)は、画像センサが捉えた視覚画像の分析に広く用いられているディープニューラルネットワーク(DNN)のクラスである。
本稿では,組込みシステム上でのリアルタイム推論のために,既存のCNNアーキテクチャの性能を改善するために,深層畳み込みニューラルネットワークアーキテクチャの新しい変種を提案する。
論文 参考訳(メタデータ) (2021-12-01T18:20:52Z) - Binary Graph Neural Networks [69.51765073772226]
グラフニューラルネットワーク(gnns)は、不規則データに対する表現学習のための強力で柔軟なフレームワークとして登場した。
本稿では,グラフニューラルネットワークのバイナライゼーションのための異なる戦略を提示し,評価する。
モデルの慎重な設計とトレーニングプロセスの制御によって、バイナリグラフニューラルネットワークは、挑戦的なベンチマークの精度において、適度なコストでトレーニングできることを示しています。
論文 参考訳(メタデータ) (2020-12-31T18:48:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。