論文の概要: Improving VisNet for Object Recognition
- arxiv url: http://arxiv.org/abs/2511.08897v1
- Date: Thu, 13 Nov 2025 01:15:36 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-13 22:34:54.285675
- Title: Improving VisNet for Object Recognition
- Title(参考訳): オブジェクト認識のためのVisNetの改善
- Authors: Mehdi Fatan Serj, C. Alejandro Parraga, Xavier Otazu,
- Abstract要約: 本研究は、生物学的にインスピレーションを受けたニューラルネットワークモデルと、放射基底関数ニューロン、マハラノビス距離に基づく学習、および一般的な物体認識と対称性の分類のための前処理のような網膜を含むいくつかの拡張された変種について検討する。
MNIST、CIFAR10、カスタム対称オブジェクトセットを含む複数のデータセットにまたがる実験結果から、これらの拡張VisNet変異はベースラインモデルと比較して認識精度を大幅に向上することが示された。
これらの発見は、VisNetにインスパイアされたアーキテクチャの適応性と生物学的関連性を強調し、神経科学と人工知能の両方において、視覚認識のための強力で解釈可能なフレームワークを提供する。
- 参考スコア(独自算出の注目度): 0.40048696135519796
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Object recognition plays a fundamental role in how biological organisms perceive and interact with their environment. While the human visual system performs this task with remarkable efficiency, reproducing similar capabilities in artificial systems remains challenging. This study investigates VisNet, a biologically inspired neural network model, and several enhanced variants incorporating radial basis function neurons, Mahalanobis distance based learning, and retinal like preprocessing for both general object recognition and symmetry classification. By leveraging principles of Hebbian learning and temporal continuity associating temporally adjacent views to build invariant representations. VisNet and its extensions capture robust and transformation invariant features. Experimental results across multiple datasets, including MNIST, CIFAR10, and custom symmetric object sets, show that these enhanced VisNet variants substantially improve recognition accuracy compared with the baseline model. These findings underscore the adaptability and biological relevance of VisNet inspired architectures, offering a powerful and interpretable framework for visual recognition in both neuroscience and artificial intelligence. Keywords: VisNet, Object Recognition, Symmetry Detection, Hebbian Learning, RBF Neurons, Mahalanobis Distance, Biologically Inspired Models, Invariant Representations
- Abstract(参考訳): 物体認識は、生物が環境を知覚し、どのように相互作用するかにおいて、基本的な役割を担っている。
人間の視覚システムは驚くほどの効率でこのタスクを実行するが、人工システムで同様の能力を再現することは依然として困難である。
本研究では、生物学的にインスパイアされたニューラルネットワークモデルであるVisNetと、放射状基底関数ニューロン、マハラノビス距離に基づく学習、および一般的な物体認識と対称性分類のための前処理のような網膜を含むいくつかの拡張された変種について検討する。
ヘビアン学習の原理と時間的連続性を活用して、時間的に隣接する視点を関連付け、不変表現を構築する。
VisNetとその拡張は、堅牢でトランスフォーメーション不変の機能をキャプチャする。
MNIST、CIFAR10、カスタム対称オブジェクトセットを含む複数のデータセットにまたがる実験結果から、これらの拡張VisNet変異はベースラインモデルと比較して認識精度を大幅に向上することが示された。
これらの発見は、VisNetにインスパイアされたアーキテクチャの適応性と生物学的関連性を強調し、神経科学と人工知能の両方において、視覚認識のための強力で解釈可能なフレームワークを提供する。
キーワード: VisNet, Object Recognition, Symmetry Detection, Hebbian Learning, RBF Neurons, Mahalanobis Distance, Biologically Inspired Models, Invariant Representations
関連論文リスト
- Understanding Cross-Model Perceptual Invariances Through Ensemble Metamers [2.9687381456164004]
本稿では,ニューラルネットワークのアンサンブルを利用したメタマー生成手法を提案する。
我々は、意味的忠実度や自然性などの要因を評価するために、画像に基づく一連の指標を用いる。
我々の研究では、畳み込みニューラルネットワークはより認識されやすく、人間に似たメタマーを生成する一方、視覚トランスフォーマーは現実的だが伝達しにくいメタマーを生成する。
論文 参考訳(メタデータ) (2025-04-02T13:51:19Z) - A Quantitative Evaluation of the Expressivity of BMI, Pose and Gender in Body Embeddings for Recognition and Identification [56.10719736365069]
我々は,学習した特徴と特定の属性の相互情報として定義された表現性の概念を拡張し,属性のエンコード方法の定量化を行う。
その結果,BMIは最終層において高い表現性を示し,認識におけるその支配的な役割を示していることがわかった。
これらの結果は,ReIDにおける身体属性の中心的役割を示し,属性駆動相関を明らかにするための原則的アプローチを確立した。
論文 参考訳(メタデータ) (2025-03-09T05:15:54Z) - Discovering Chunks in Neural Embeddings for Interpretability [53.80157905839065]
本稿では, チャンキングの原理を応用して, 人工神経集団活動の解釈を提案する。
まず、この概念を正則性を持つ人工シーケンスを訓練したリカレントニューラルネットワーク(RNN)で実証する。
我々は、これらの状態に対する摂動が関連する概念を活性化または阻害すると共に、入力における概念に対応する同様の繰り返し埋め込み状態を特定する。
論文 参考訳(メタデータ) (2025-02-03T20:30:46Z) - Convolution goes higher-order: a biologically inspired mechanism empowers image classification [0.8999666725996975]
本稿では,複雑な非線形生物学的視覚処理に着想を得た画像分類手法を提案する。
我々のモデルは、Volterraのような畳み込み演算子の拡張を組み込み、乗法的相互作用をキャプチャする。
私たちの仕事は神経科学とディープラーニングを橋渡しし、より効果的で生物学的にインスパイアされたコンピュータビジョンモデルへの道筋を提供します。
論文 参考訳(メタデータ) (2024-12-09T18:33:09Z) - Neural Echos: Depthwise Convolutional Filters Replicate Biological
Receptive Fields [56.69755544814834]
哺乳類網膜で観察される生体受容野を,深部核が効果的に複製していることを示す証拠を提示する。
生体受容の分野からインスピレーションを得る手法を提案する。
論文 参考訳(メタデータ) (2024-01-18T18:06:22Z) - Multimodal Adaptive Fusion of Face and Gait Features using Keyless
attention based Deep Neural Networks for Human Identification [67.64124512185087]
歩行のような軟式生体認証は、人物認識や再識別といった監視作業において顔に広く使われている。
本稿では,キーレス注意深層ニューラルネットワークを活用することで,歩行と顔のバイオメトリック・キューを動的に組み込むための適応型マルチバイオメトリック・フュージョン戦略を提案する。
論文 参考訳(メタデータ) (2023-03-24T05:28:35Z) - Efficient visual object representation using a biologically plausible
spike-latency code and winner-take-all inhibition [0.0]
スパイキングニューラルネットワーク(SNN)は、物体認識システムの効率性と生物学的妥当性を向上させる可能性がある。
本稿では、スパイクレイテンシ符号化とWTA-オール阻害(WTA-I)を用いて視覚刺激を効率的に表現するSNNモデルを提案する。
我々は、150個のスパイクニューロンからなるネットワークが、40個のスパイクを持つオブジェクトを効率的に表現できることを実証した。
論文 参考訳(メタデータ) (2022-05-20T17:48:02Z) - Data-driven emergence of convolutional structure in neural networks [83.4920717252233]
識別タスクを解くニューラルネットワークが、入力から直接畳み込み構造を学習できることを示す。
データモデルを慎重に設計することにより、このパターンの出現は、入力の非ガウス的、高次局所構造によって引き起こされることを示す。
論文 参考訳(メタデータ) (2022-02-01T17:11:13Z) - Seeing eye-to-eye? A comparison of object recognition performance in
humans and deep convolutional neural networks under image manipulation [0.0]
本研究では,ヒトとフィードフォワードニューラルネットワークの視覚コア物体認識性能の行動比較を目的とした。
精度分析の結果、人間はDCNNを全ての条件で上回るだけでなく、形状や色の変化に対する強い堅牢性も示している。
論文 参考訳(メタデータ) (2020-07-13T10:26:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。