論文の概要: Efficient coding along the visual hierarchy
- arxiv url: http://arxiv.org/abs/2605.19155v1
- Date: Mon, 18 May 2026 22:20:17 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-20 15:03:09.013033
- Title: Efficient coding along the visual hierarchy
- Title(参考訳): 視覚的階層に沿った効率的な符号化
- Authors: Ananya Passi, Brian S. Robinson, Michael F. Bonner,
- Abstract要約: 効率的なコーディングは、限られたデータから人間に沿った視覚的特徴の階層を構築することができることを示す。
効率的なコーディングと教師付き微調整を組み合わせたハイブリッド学習手法により、低データ設定での脳のアライメントが向上する。
これらの結果は、効率的な符号化が視覚階層全体にわたって表現を形作る可能性があることを示唆している。
- 参考スコア(独自算出の注目度): 0.764671395172401
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Biological visual systems learn from limited experience, unlike deep learning models that rely on millions of training images. What learning principles make this possible? We tested whether efficient coding, the idea that neural representations capture the statistical structure of natural inputs, can build a hierarchy of human-aligned visual features from limited data. We developed an unsupervised learning procedure in which each layer of a deep network compresses its inputs onto the dominant modes of variation in natural images, using only local statistics and no labels, tasks, or backpropagation. This unsupervised procedure yields features that progress from edges and colors to textures and shapes. The features of this deep efficient coding model are readily recognized by human observers and are predictive of image-evoked fMRI responses in human visual cortex. Furthermore, a hybrid learning procedure that combines efficient coding with supervised fine-tuning yields better brain alignment in low-data settings and more rapid category learning. These findings suggest that efficient coding may shape representations across the entire visual hierarchy and help explain the data efficiency of biological vision.
- Abstract(参考訳): 生物学的視覚システムは、数百万のトレーニングイメージに依存するディープラーニングモデルとは異なり、限られた経験から学習する。
どのような学習原則がこれを可能にしますか?
ニューラル表現が自然な入力の統計構造を捉えるというアイデアである効率的なコーディングが、限られたデータから人間と協調した視覚的特徴の階層を構築することができるかどうかを検証した。
我々は,深層ネットワークの各層が,局所的な統計情報のみを使用し,ラベルやタスクやバックプロパゲーションを伴わず,その入力を自然画像における支配的なモードに圧縮する,教師なし学習手法を開発した。
この教師なしの手順は、エッジや色からテクスチャや形へと進化する特徴をもたらす。
この深部符号化モデルの特徴は、人間の観察者によって容易に認識され、人間の視覚野における画像誘発fMRI応答を予測できる。
さらに、効率的なコーディングと教師付き微調整を組み合わせたハイブリッド学習手法により、低データ設定における脳のアライメントが向上し、より高速なカテゴリ学習が可能となる。
これらの結果は、効率的な符号化が視覚階層全体の表現を形作り、生物学的視覚のデータ効率を説明するのに役立つことを示唆している。
関連論文リスト
- In Pursuit of Pixel Supervision for Visual Pre-training [60.63095313440605]
Pixioは、最小限の人間のキュレーションで自己キュレーション戦略を備えた、2Bのウェブクローリング画像に基づいて訓練された強化マスク付きオートエンコーダ(MAE)である。
Pixioは、単眼深度推定、フィードフォワード3D再構成、セマンティックセグメンテーション、ロボット学習など、幅広い下流タスクで競争力を発揮する。
この結果から,画素空間の自己教師型学習は有望な代替手段となり,潜在空間アプローチの補完となる可能性が示唆された。
論文 参考訳(メタデータ) (2025-12-17T18:59:58Z) - From Images to Perception: Emergence of Perceptual Properties by Reconstructing Images [1.77513002450736]
網膜-V1大脳皮質のいくつかの既知の事実に対応するバイオインスパイアされたアーキテクチャであるPerceptNetは、画像再構成に関連するさまざまなタスクにエンドツーエンドで最適化されている。
以上の結果から,エンコーダの段階は画像歪みに対する人間の知覚的判断と一貫した相関を示すことがわかった。
論文 参考訳(メタデータ) (2025-08-14T08:37:30Z) - L-WISE: Boosting Human Visual Category Learning Through Model-Based Image Selection and Enhancement [12.524893323311108]
画像の摂動は、人間が真実のクラスを正確に報告する能力を高めることができることを示す。
本研究では,人間の視覚的学習を,テスト時に人間の分類精度を向上させる方法で強化することを提案する。
論文 参考訳(メタデータ) (2024-12-12T23:57:01Z) - MLIP: Enhancing Medical Visual Representation with Divergence Encoder
and Knowledge-guided Contrastive Learning [48.97640824497327]
本稿では、画像テキストのコントラスト学習を通じて、言語情報を視覚領域に統合するための案内信号として、ドメイン固有の医療知識を活用する新しいフレームワークを提案する。
我々のモデルには、設計した分散エンコーダによるグローバルコントラスト学習、局所トークン・知識・パッチアライメントコントラスト学習、知識誘導型カテゴリレベルのコントラスト学習、エキスパートナレッジによるコントラスト学習が含まれる。
特に、MLIPは、限られた注釈付きデータであっても最先端の手法を超越し、医療表現学習の進歩におけるマルチモーダル事前学習の可能性を強調している。
論文 参考訳(メタデータ) (2024-02-03T05:48:50Z) - Unsupervised Domain Transfer with Conditional Invertible Neural Networks [83.90291882730925]
条件付き可逆ニューラルネットワーク(cINN)に基づくドメイン転送手法を提案する。
提案手法は本質的に,その可逆的アーキテクチャによるサイクル一貫性を保証し,ネットワークトレーニングを最大限効率的に行うことができる。
提案手法は,2つの下流分類タスクにおいて,現実的なスペクトルデータの生成を可能にし,その性能を向上する。
論文 参考訳(メタデータ) (2023-03-17T18:00:27Z) - Convolutional Neural Generative Coding: Scaling Predictive Coding to
Natural Images [79.07468367923619]
畳み込み型神経生成符号化(Conv-NGC)を開発した。
我々は、潜伏状態マップを段階的に洗練する柔軟な神経生物学的動機付けアルゴリズムを実装した。
本研究は,脳にインスパイアされたニューラル・システムによる再建と画像復調の課題に対する効果について検討する。
論文 参考訳(メタデータ) (2022-11-22T06:42:41Z) - Data-driven emergence of convolutional structure in neural networks [83.4920717252233]
識別タスクを解くニューラルネットワークが、入力から直接畳み込み構造を学習できることを示す。
データモデルを慎重に設計することにより、このパターンの出現は、入力の非ガウス的、高次局所構造によって引き起こされることを示す。
論文 参考訳(メタデータ) (2022-02-01T17:11:13Z) - Joint Learning of Neural Transfer and Architecture Adaptation for Image
Recognition [77.95361323613147]
現在の最先端の視覚認識システムは、大規模データセット上でニューラルネットワークを事前トレーニングし、より小さなデータセットでネットワーク重みを微調整することに依存している。
本稿では,各ドメインタスクに適応したネットワークアーキテクチャの動的適応と,効率と効率の両面で重みの微調整の利点を実証する。
本手法は,ソースドメインタスクでスーパーネットトレーニングを自己教師付き学習に置き換え,下流タスクで線形評価を行うことにより,教師なしパラダイムに容易に一般化することができる。
論文 参考訳(メタデータ) (2021-03-31T08:15:17Z) - Self supervised contrastive learning for digital histopathology [0.0]
我々はSimCLRと呼ばれる対照的な自己教師型学習手法を用いて、自然シーン画像の最先端結果を得た。
異なる種類の染色特性と分解特性とを組み合わせることで,学習した特徴の質が向上することがわかった。
学習した機能に基づいてトレーニングされた線形分類器は、デジタル病理学データセットで事前トレーニングされたネットワークが、ImageNet事前トレーニングされたネットワークよりも優れたパフォーマンスを示すことを示している。
論文 参考訳(メタデータ) (2020-11-27T19:18:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。