論文の概要: Why all roads don't lead to Rome: Representation geometry varies across the human visual cortical hierarchy
- arxiv url: http://arxiv.org/abs/2509.13459v1
- Date: Tue, 16 Sep 2025 18:50:33 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-18 18:41:50.617719
- Title: Why all roads don't lead to Rome: Representation geometry varies across the human visual cortical hierarchy
- Title(参考訳): すべての道路がローマに通じない理由:表現幾何学は人間の視覚皮質階層によって異なる
- Authors: Arna Ghosh, Zahraa Chorghay, Shahab Bakhtiari, Blake A. Richards,
- Abstract要約: 人工ニューラルネットワーク(ANN)を用いたヒト視覚野の表現解析
汎用的でスケールのない表現は、ほとんどの領域で法的な固有スペクトルによって特徴づけられる。
ある種の高次の視覚領域では、スケールフリーな表現がなく、スケールフリーな幾何学は脳の普遍的な性質ではないことを示している。
- 参考スコア(独自算出の注目度): 11.216529076002585
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Biological and artificial intelligence systems navigate the fundamental efficiency-robustness tradeoff for optimal encoding, i.e., they must efficiently encode numerous attributes of the input space while also being robust to noise. This challenge is particularly evident in hierarchical processing systems like the human brain. With a view towards understanding how systems navigate the efficiency-robustness tradeoff, we turned to a population geometry framework for analyzing representations in the human visual cortex alongside artificial neural networks (ANNs). In the ventral visual stream, we found general-purpose, scale-free representations characterized by a power law-decaying eigenspectrum in most areas. However, in certain higher-order visual areas did not have scale-free representations, indicating that scale-free geometry is not a universal property of the brain. In parallel, ANNs trained with a self-supervised learning objective also exhibited free-free geometry, but not after fine-tune on a specific task. Based on these empirical results and our analytical insights, we posit that a system's representation geometry is not a universal property and instead depends upon the computational objective.
- Abstract(参考訳): 生物学的および人工知能システムは、最適なエンコーディングのために基本的な効率とロバスト性のトレードオフをナビゲートする。
この課題は、人間の脳のような階層的な処理システムにおいて特に顕著である。
そこで我々は,人間の視覚野における表現を,人工ニューラルネットワーク(ANN)とともに分析するための集団幾何学的枠組みに転換した。
腹側視覚ストリームでは,ほとんどの領域において,パワーローカリング固有スペクトルを特徴とする汎用的,スケールフリーな表現がみられた。
しかし、ある高次視覚領域では、スケールフリーな表現がなく、スケールフリーな幾何学は脳の普遍的な性質ではないことを示している。
並行して、自己教師型学習目標を用いて訓練されたANNは、自由な幾何学も示したが、特定のタスクに対する微調整は行わなかった。
これらの経験的結果と分析的洞察に基づいて、システムの表現幾何学は普遍的な性質ではなく、計算目的に依存していると仮定する。
関連論文リスト
- Coding schemes in neural networks learning classification tasks [52.22978725954347]
完全接続型広義ニューラルネットワーク学習タスクについて検討する。
ネットワークが強力なデータ依存機能を取得することを示す。
驚くべきことに、内部表現の性質は神経の非線形性に大きく依存する。
論文 参考訳(メタデータ) (2024-06-24T14:50:05Z) - Saliency Suppressed, Semantics Surfaced: Visual Transformations in Neural Networks and the Brain [0.0]
私たちは神経科学からインスピレーションを得て、ニューラルネットワークが情報を低(視覚的満足度)で高(セマンティックな類似性)の抽象レベルでエンコードする方法について光を当てています。
ResNetsは、オブジェクト分類の目的によって訓練された場合、ViTsよりも唾液度情報に敏感であることが分かりました。
我々は、セマンティックエンコーディングがAIと人間の視覚知覚を協調させる重要な要素であることを示し、サリエンシ抑制は非脳的な戦略であることを示した。
論文 参考訳(メタデータ) (2024-04-29T15:05:42Z) - URLOST: Unsupervised Representation Learning without Stationarity or Topology [26.010647961403148]
定常性やトポロジの事前知識のない高次元データから学習する新しいフレームワークを提案する。
このモデルでは,学習可能な自己組織化層,スペクトルクラスタリング,マスク付きオートエンコーダを組み合わせる。
本研究は,生体視覚データ,一次視覚野からの神経記録,遺伝子発現を含む3種類のデータモダリティに対して有効性を評価する。
論文 参考訳(メタデータ) (2023-10-06T18:00:02Z) - FuNNscope: Visual microscope for interactively exploring the loss
landscape of fully connected neural networks [77.34726150561087]
ニューラルネットワークの高次元景観特性を探索する方法を示す。
我々は、小さなニューラルネットワークの観測結果をより複雑なシステムに一般化する。
インタラクティブダッシュボードは、いくつかのアプリケーションネットワークを開放する。
論文 参考訳(メタデータ) (2022-04-09T16:41:53Z) - Emergence of Machine Language: Towards Symbolic Intelligence with Neural
Networks [73.94290462239061]
本稿では、ニューラルネットワークを用いてシンボルとコネクショナリズムの原理を組み合わせることで、離散表現を導出することを提案する。
対話型環境とタスクを設計することにより、機械が自発的で柔軟でセマンティックな言語を生成できることを実証した。
論文 参考訳(メタデータ) (2022-01-14T14:54:58Z) - Symmetry Perception by Deep Networks: Inadequacy of Feed-Forward
Architectures and Improvements with Recurrent Connections [3.6923632650826477]
本研究では, 実例から対称性知覚を学習するタスクにおいて, ディープニューラルネットワーク(DNN)アーキテクチャを評価する。
再帰的アーキテクチャは,非局所的空間依存を局所的な操作列に分解することで,対称性を知覚できることがわかった。
論文 参考訳(メタデータ) (2021-12-08T08:21:25Z) - Grounding Psychological Shape Space in Convolutional Neural Networks [0.0]
我々は畳み込みニューラルネットワークを用いて、知覚入力間の一般化可能なマッピングと、最近提案された形状領域の心理学的類似性空間を学習する。
この結果から,分類に基づくマルチタスク学習シナリオが最も優れた結果が得られるが,その性能は類似性空間の次元に比較的敏感であることが示唆された。
論文 参考訳(メタデータ) (2021-11-16T12:21:07Z) - Joint Learning of Neural Transfer and Architecture Adaptation for Image
Recognition [77.95361323613147]
現在の最先端の視覚認識システムは、大規模データセット上でニューラルネットワークを事前トレーニングし、より小さなデータセットでネットワーク重みを微調整することに依存している。
本稿では,各ドメインタスクに適応したネットワークアーキテクチャの動的適応と,効率と効率の両面で重みの微調整の利点を実証する。
本手法は,ソースドメインタスクでスーパーネットトレーニングを自己教師付き学習に置き換え,下流タスクで線形評価を行うことにより,教師なしパラダイムに容易に一般化することができる。
論文 参考訳(メタデータ) (2021-03-31T08:15:17Z) - VisualEchoes: Spatial Image Representation Learning through Echolocation [97.23789910400387]
いくつかの動物種(コウモリ、イルカ、クジラなど)や視覚障害者さえもエコーロケーションを行う能力を持っている。
エコーロケーションを用いて有用な視覚特徴を学習する対話型表現学習フレームワークを提案する。
我々の研究は、物理的世界との相互作用によって監督される、エンボディエージェントのための表現学習の新しい道を開く。
論文 参考訳(メタデータ) (2020-05-04T16:16:58Z) - Learning Depth With Very Sparse Supervision [57.911425589947314]
本稿では, 環境との相互作用を通じて, 知覚が世界の3次元特性と結合するという考えを考察する。
我々は、環境と対話するロボットが利用できるような、特殊なグローバルローカルネットワークアーキテクチャを訓練する。
いくつかのデータセットの実験では、画像ピクセルの1つでも基底真理が利用できる場合、提案されたネットワークは、最先端のアプローチよりも22.5%の精度でモノクロの深度推定を学習できることを示している。
論文 参考訳(メタデータ) (2020-03-02T10:44:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。