論文の概要: Configural processing as an optimized strategy for robust object recognition in neural networks
- arxiv url: http://arxiv.org/abs/2407.19072v1
- Date: Thu, 18 Jul 2024 10:39:14 GMT
- ステータス: 処理完了
- システム内更新日: 2024-08-05 01:06:22.373448
- Title: Configural processing as an optimized strategy for robust object recognition in neural networks
- Title(参考訳): ニューラルネットワークにおけるロバスト物体認識のための最適化戦略としての構成処理
- Authors: Hojin Jang, Pawan Sinha, Xavier Boix,
- Abstract要約: 構成的キューによるオブジェクトの処理は、局所的な工芸的キューと比較して、より堅牢な認識手段を提供することを示す。
本研究は,タスクの緊急度に基づいて,構成処理がナレーションネットワークに現れるという神経計算的証拠を提供する。
- 参考スコア(独自算出の注目度): 2.059931105362387
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Configural processing, the perception of spatial relationships among an object's components, is crucial for object recognition. However, the teleology and underlying neurocomputational mechanisms of such processing are still elusive, notwithstanding decades of research. We hypothesized that processing objects via configural cues provides a more robust means to recognizing them relative to local featural cues. We evaluated this hypothesis by devising identification tasks with composite letter stimuli and comparing different neural network models trained with either only local or configural cues available. We found that configural cues yielded more robust performance to geometric transformations such as rotation or scaling. Furthermore, when both features were simultaneously available, configural cues were favored over local featural cues. Layerwise analysis revealed that the sensitivity to configural cues emerged later relative to local feature cues, possibly contributing to the robustness to pixel-level transformations. Notably, this configural processing occurred in a purely feedforward manner, without the need for recurrent computations. Our findings with letter stimuli were successfully extended to naturalistic face images. Thus, our study provides neurocomputational evidence that configural processing emerges in a na\"ive network based on task contingencies, and is beneficial for robust object processing under varying viewing conditions.
- Abstract(参考訳): オブジェクトのコンポーネント間の空間的関係の認識である構成処理は、オブジェクト認識に不可欠である。
しかし、このような処理のテレロジーと基礎となる神経計算機構は、何十年もの研究にもかかわらず、いまだ解明されていない。
構成的手がかりによるオブジェクトの処理は、局所的な工芸的手がかりと比較して、より堅牢な認識手段を提供するという仮説を立てた。
我々は,この仮説を,複合文字刺激を用いた識別タスクを考案し,局所的あるいは構成的手法で学習した異なるニューラルネットワークモデルを比較して評価した。
構成的手がかりは回転やスケーリングといった幾何学的変換に対してより堅牢な性能をもたらすことがわかった。
さらに、両方の特徴が同時に利用可能になったとき、構成的手がかりは地元の工芸的手がかりよりも好まれていた。
階層解析により, 局所的な特徴的手がかりに対して構成的手がかりに対する感度が後に出現し, ピクセルレベルの変換に対する堅牢性に寄与する可能性が示唆された。
特に、この構成処理は、再帰的な計算を必要とせず、純粋にフィードフォワード的に発生した。
文字刺激による所見は自然主義的な顔画像に拡張した。
そこで本研究では,タスクの同時性に基づくネットワークにおいて,構成処理が出現する神経計算的証拠を提供するとともに,観察条件の変化による堅牢なオブジェクト処理に有用であることを示す。
関連論文リスト
- RADA: Robust and Accurate Feature Learning with Domain Adaptation [7.905594146253435]
本稿では、2つの重要な要素を組み込んだ多層機能集約ネットワークを導入し、堅牢で正確な特徴の学習を容易にする。
提案手法は,画像マッチング,カメラポーズ推定,視覚的ローカライゼーションタスクにおいて優れた結果が得られる。
論文 参考訳(メタデータ) (2024-07-22T16:49:58Z) - Object-Centric Conformance Alignments with Synchronization (Extended Version) [57.76661079749309]
対象中心のペトリネットが一対多の関係を捉える能力と,その同一性に基づいたオブジェクトの比較と同期を行う識別子を持つペトリネットの能力を組み合わせた,新たな形式主義を提案する。
我々は、満足度変調理論(SMT)の符号化に基づく、そのようなネットに対する適合性チェック手法を提案する。
論文 参考訳(メタデータ) (2023-12-13T21:53:32Z) - Understanding Forward Process of Convolutional Neural Network [0.0]
本稿では,CNNの前方処理における選択的回転について述べる。
これは、入力データの回転面を統一し定量化する識別機構として活性化関数を解明する。
論文 参考訳(メタデータ) (2023-07-27T00:37:18Z) - Quasi-orthogonality and intrinsic dimensions as measures of learning and
generalisation [55.80128181112308]
ニューラルネットワークの特徴空間の次元性と準直交性は、ネットワークの性能差別と共同して機能する可能性があることを示す。
本研究は, ネットワークの最終的な性能と, ランダムに初期化された特徴空間の特性との関係を示唆する。
論文 参考訳(メタデータ) (2022-03-30T21:47:32Z) - Data-driven emergence of convolutional structure in neural networks [83.4920717252233]
識別タスクを解くニューラルネットワークが、入力から直接畳み込み構造を学習できることを示す。
データモデルを慎重に設計することにより、このパターンの出現は、入力の非ガウス的、高次局所構造によって引き起こされることを示す。
論文 参考訳(メタデータ) (2022-02-01T17:11:13Z) - Combining Local and Global Pose Estimation for Precise Tracking of
Similar Objects [2.861848675707602]
類似・非テクスチャオブジェクトに対する多目的6D検出・追跡パイプラインを提案する。
合成画像のみを訓練した新しいネットワークアーキテクチャは、複数のオブジェクトの同時ポーズ推定を可能にする。
建設現場における実際のAR支援アプリケーションにおいて,システムがどのように利用できるかを示す。
論文 参考訳(メタデータ) (2022-01-31T14:36:57Z) - Similarity and Matching of Neural Network Representations [0.0]
我々は、深層ニューラルネットワークにおける表現の類似性を分析するために、Frankenstein博士と呼ばれるツールセットを使用します。
我々は、2つのトレーニングニューラルネットワークの与えられた層上でのアクティベーションを、縫合層で結合することで一致させることを目指している。
論文 参考訳(メタデータ) (2021-10-27T17:59:46Z) - SI-Score: An image dataset for fine-grained analysis of robustness to
object location, rotation and size [95.00667357120442]
オブジェクトの位置、回転、サイズを変えることは、非自明な方法で予測に影響を与える可能性がある。
合成データセットであるSI-Scoreを用いて,これらの変動要因に対するロバストネスのきめ細かい解析を行う。
論文 参考訳(メタデータ) (2021-04-09T05:00:49Z) - Joint Learning of Neural Transfer and Architecture Adaptation for Image
Recognition [77.95361323613147]
現在の最先端の視覚認識システムは、大規模データセット上でニューラルネットワークを事前トレーニングし、より小さなデータセットでネットワーク重みを微調整することに依存している。
本稿では,各ドメインタスクに適応したネットワークアーキテクチャの動的適応と,効率と効率の両面で重みの微調整の利点を実証する。
本手法は,ソースドメインタスクでスーパーネットトレーニングを自己教師付き学習に置き換え,下流タスクで線形評価を行うことにより,教師なしパラダイムに容易に一般化することができる。
論文 参考訳(メタデータ) (2021-03-31T08:15:17Z) - Learning Connectivity of Neural Networks from a Topological Perspective [80.35103711638548]
本稿では,ネットワークを解析のための完全なグラフに表現するためのトポロジ的視点を提案する。
接続の規模を反映したエッジに学習可能なパラメータを割り当てることにより、学習プロセスを異なる方法で行うことができる。
この学習プロセスは既存のネットワークと互換性があり、より大きな検索空間と異なるタスクへの適応性を持っている。
論文 参考訳(メタデータ) (2020-08-19T04:53:31Z) - Zero-Shot Reinforcement Learning with Deep Attention Convolutional
Neural Networks [12.282277258055542]
本研究では、特定の視覚センサ構成を持つ深層注意畳み込みニューラルネットワーク(DACNN)が、より低い計算複雑性で高いドメインとパラメータの変動を持つデータセット上でトレーニングを行うことを示す。
我々の新しいアーキテクチャは、制御対象に対する認識に適応し、知覚ネットワークを事前訓練することなくゼロショット学習を実現する。
論文 参考訳(メタデータ) (2020-01-02T19:41:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。