論文の概要: Object recognition in primates: What can early visual areas contribute?
- arxiv url: http://arxiv.org/abs/2407.04816v1
- Date: Fri, 5 Jul 2024 18:57:09 GMT
- ステータス: 処理完了
- システム内更新日: 2024-07-09 22:26:54.684810
- Title: Object recognition in primates: What can early visual areas contribute?
- Title(参考訳): 霊長類における物体認識:初期視覚領域は何に寄与するか?
- Authors: Christian Quaia, Richard J Krauzlis,
- Abstract要約: 本研究では,初期視覚処理領域で搬送される信号が周囲の物体認識にどのように利用されるかを検討した。
V1の単純なセルや複雑なセルのモデルは、非常に信頼できる情報を提供することができ、現実的なシナリオでは80%以上の性能が向上する。
我々は,物体認識を並列プロセスと見なすべきであり,低精度かつ高速なモジュールと並列に動作し,視野をまたいで動作可能であることを提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/publicdomain/zero/1.0/
- Abstract: If neuroscientists were asked which brain area is responsible for object recognition in primates, most would probably answer infero-temporal (IT) cortex. While IT is likely responsible for fine discriminations, and it is accordingly dominated by foveal visual inputs, there is more to object recognition than fine discrimination. Importantly, foveation of an object of interest usually requires recognizing, with reasonable confidence, its presence in the periphery. Arguably, IT plays a secondary role in such peripheral recognition, and other visual areas might instead be more critical. To investigate how signals carried by early visual processing areas (such as LGN and V1) could be used for object recognition in the periphery, we focused here on the task of distinguishing faces from non-faces. We tested how sensitive various models were to nuisance parameters, such as changes in scale and orientation of the image, and the type of image background. We found that a model of V1 simple or complex cells could provide quite reliable information, resulting in performance better than 80% in realistic scenarios. An LGN model performed considerably worse. Because peripheral recognition is both crucial to enable fine recognition (by bringing an object of interest on the fovea), and probably sufficient to account for a considerable fraction of our daily recognition-guided behavior, we think that the current focus on area IT and foveal processing is too narrow. We propose that rather than a hierarchical system with IT-like properties as its primary aim, object recognition should be seen as a parallel process, with high-accuracy foveal modules operating in parallel with lower-accuracy and faster modules that can operate across the visual field.
- Abstract(参考訳): 神経科学者が霊長類の物体認識にどの脳領域が関与しているかを尋ねられた場合、ほとんどの場合、非時間的(IT)大脳皮質に答えるでしょう。
ITは細分化の責任を負う可能性があり、それ故に葉の視覚入力に支配されているが、細分化よりも物体認識の方が重要である。
重要なことに、利害対象のファベーションは通常、合理的な信頼を持って、その周辺に存在することを認識する必要がある。
おそらく、このような周辺認識においてITは二次的な役割を担い、他の視覚領域はより重要かもしれない。
初期視覚処理領域(LGNやV1)で運ばれる信号が周囲の物体認識にどのように利用されるかを調べるため,顔と非顔の区別に焦点をあてた。
画像のスケールや向きの変化や背景のタイプなど,様々なモデルがニュアンスパラメータにどれほど敏感であるかを検証した。
V1の単純なセルや複雑なセルのモデルは信頼性の高い情報を提供することができ、現実的なシナリオでは80%以上の性能が向上することがわかった。
LGNモデルは大幅に悪化した。
周辺認識は微妙な認識を可能にするために重要であり、また、日常的な認識誘導行動のかなりの部分を占めるのに十分であると考えられるため、現在の領域ITと胎児処理の焦点は狭すぎると考えている。
そこで本稿では,IT的な特性を主目的とする階層型システムではなく,オブジェクト認識を並列プロセスとして,低精度で高速なモジュールと並列に動作し,視野をまたいで動作可能であることを提案する。
関連論文リスト
- Towards A Unified Neural Architecture for Visual Recognition and
Reasoning [40.938279131241764]
視覚認識と推論のための統一型ニューラルアーキテクチャを提案し,両者の汎用インターフェース(トークンなど)を提案する。
我々のフレームワークは、視覚的認識タスク、データセット、帰納的バイアスが、原則化された時間的推論機能を実現するのにどのように役立つかを調べることができる。
論文 参考訳(メタデータ) (2023-11-10T20:27:43Z) - Exploring Predicate Visual Context in Detecting Human-Object
Interactions [44.937383506126274]
クロスアテンションによる画像特徴の再導入について検討する。
PViCはHICO-DETおよびV-COCOベンチマークにおいて最先端の手法より優れている。
論文 参考訳(メタデータ) (2023-08-11T15:57:45Z) - Salient Mask-Guided Vision Transformer for Fine-Grained Classification [48.1425692047256]
きめ細かい視覚分類(FGVC)は、コンピュータビジョンの問題である。
その主な難しさの1つは、最も差別的な階級間のばらつきを捉えることである。
シンプルで効果的なマスク誘導型視覚変換器(SM-ViT)を導入する。
論文 参考訳(メタデータ) (2023-05-11T19:24:33Z) - Learning Common Rationale to Improve Self-Supervised Representation for
Fine-Grained Visual Recognition Problems [61.11799513362704]
我々は、インスタンスやクラスでよく見られる差別的手がかりを識別するための、追加のスクリーニングメカニズムの学習を提案する。
SSL目標から誘導されるGradCAMを単純に利用することで、共通な有理性検出器が学習可能であることを示す。
論文 参考訳(メタデータ) (2023-03-03T02:07:40Z) - A neuromorphic approach to image processing and machine vision [0.9137554315375922]
画像分割,視覚的注意,物体認識などの視覚的タスクの実装について検討する。
我々は,人工視覚システムを実現するために,メムリスタなどの不揮発性メモリデバイスの利用を強調してきた。
論文 参考訳(メタデータ) (2022-08-07T05:01:57Z) - Persistent Animal Identification Leveraging Non-Visual Markers [71.14999745312626]
乱雑なホームケージ環境下で各マウスにユニークな識別子を時間をかけて発見し提供することを目的としている。
これは、(i)各マウスの視覚的特徴の区別の欠如、(ii)一定の閉塞を伴うシーンの密閉性のため、非常に難しい問題である。
本手法は, この動物識別問題に対して77%の精度を達成し, 動物が隠れているときの急激な検出を拒否することができる。
論文 参考訳(メタデータ) (2021-12-13T17:11:32Z) - Domain Adaptation for Facial Expression Classifier via Domain
Discrimination and Gradient Reversal [0.0]
表情認識(FER)の分野での研究は、過去10年間に増加傾向にある。
本稿では、FERタスクのための新しいアーキテクチャを提案し、ドメイン識別損失正規化が学習プロセスに与える影響について検討する。
論文 参考訳(メタデータ) (2021-06-02T20:58:24Z) - Affect Analysis in-the-wild: Valence-Arousal, Expressions, Action Units
and a Unified Framework [83.21732533130846]
Aff-Wild と Aff-Wild2 の2つである。
これは、これらのデータベースで訓練された深層ニューラルネットワークの2つのクラスの設計を示す。
インパクト認識を共同で学び、効果的に一般化し、実行することができる新しいマルチタスクおよび全体主義のフレームワークが提示されます。
論文 参考訳(メタデータ) (2021-03-29T17:36:20Z) - Rethinking of the Image Salient Object Detection: Object-level Semantic
Saliency Re-ranking First, Pixel-wise Saliency Refinement Latter [62.26677215668959]
本稿では,意味的に有意な領域を粗い位置で特定する,軽量で教師付きの深層ネットワークを提案する。
次に,これらセマンティック・サリエント領域の深層モデルを画素ワイド・サリエンシ改善として融合する。
提案手法は単純だが有効であり,本手法は主眼をオブジェクトレベルのセマンティック・リグレード問題とみなすための最初の試みである。
論文 参考訳(メタデータ) (2020-08-10T07:12:43Z) - Ventral-Dorsal Neural Networks: Object Detection via Selective Attention [51.79577908317031]
我々はVDNet(Ventral-Dorsal Networks)と呼ばれる新しいフレームワークを提案する。
人間の視覚システムの構造にインスパイアされた我々は「Ventral Network」と「Dorsal Network」の統合を提案する。
実験の結果,提案手法は最先端の物体検出手法よりも優れていることがわかった。
論文 参考訳(メタデータ) (2020-05-15T23:57:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。