論文の概要: How does the primate brain combine generative and discriminative
computations in vision?
- arxiv url: http://arxiv.org/abs/2401.06005v1
- Date: Thu, 11 Jan 2024 16:07:58 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-12 13:43:33.021806
- Title: How does the primate brain combine generative and discriminative
computations in vision?
- Title(参考訳): 霊長類の脳は、視覚における生成的および識別的計算をどのように組み合わせるか?
- Authors: Benjamin Peters, James J. DiCarlo, Todd Gureckis, Ralf Haefner, Leyla
Isik, Joshua Tenenbaum, Talia Konkle, Thomas Naselaris, Kimberly Stachenfeld,
Zenna Tavares, Doris Tsao, Ilker Yildirim, Nikolaus Kriegeskorte
- Abstract要約: 推論過程の2つの対照的な概念は、それぞれ生物学的ビジョンと機械ビジョンの研究に影響を与えている。
視覚は、しばしば感覚データのトップダウン予測を含むと考えられるプロセスにおいて、証拠の尋問を通じて生成モデルを逆転させることを示す。
本稿では,この用語を説明し,重要な実証的証拠を概説するとともに,霊長類視覚の謎のハイブリッドアルゴリズムを明らかにするための段階を超越し,設定する経験的研究プログラムを提案する。
- 参考スコア(独自算出の注目度): 4.691670689443386
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Vision is widely understood as an inference problem. However, two contrasting
conceptions of the inference process have each been influential in research on
biological vision as well as the engineering of machine vision. The first
emphasizes bottom-up signal flow, describing vision as a largely feedforward,
discriminative inference process that filters and transforms the visual
information to remove irrelevant variation and represent behaviorally relevant
information in a format suitable for downstream functions of cognition and
behavioral control. In this conception, vision is driven by the sensory data,
and perception is direct because the processing proceeds from the data to the
latent variables of interest. The notion of "inference" in this conception is
that of the engineering literature on neural networks, where feedforward
convolutional neural networks processing images are said to perform inference.
The alternative conception is that of vision as an inference process in
Helmholtz's sense, where the sensory evidence is evaluated in the context of a
generative model of the causal processes giving rise to it. In this conception,
vision inverts a generative model through an interrogation of the evidence in a
process often thought to involve top-down predictions of sensory data to
evaluate the likelihood of alternative hypotheses. The authors include
scientists rooted in roughly equal numbers in each of the conceptions and
motivated to overcome what might be a false dichotomy between them and engage
the other perspective in the realm of theory and experiment. The primate brain
employs an unknown algorithm that may combine the advantages of both
conceptions. We explain and clarify the terminology, review the key empirical
evidence, and propose an empirical research program that transcends the
dichotomy and sets the stage for revealing the mysterious hybrid algorithm of
primate vision.
- Abstract(参考訳): ビジョンは推論問題として広く理解されている。
しかし、推論過程の2つの対照的な概念は、それぞれが生体視覚の研究や機械ビジョンの工学に影響を与えている。
1つ目はボトムアップ信号の流れを強調し、視覚を主にフィードフォワードの識別的推論プロセスとして表現し、視覚情報をフィルタリングし変換して無関係な変化を除去し、認知と行動制御の下流機能に適したフォーマットで行動関連情報を表現している。
この概念では、視覚は知覚データによって駆動され、その処理がデータから潜在変数へと進行するので、知覚は直接的である。
この概念における「干渉」の概念は、画像を処理するフィードフォワード畳み込み畳み込みニューラルネットワークが推論を行うと言われる、ニューラルネットワークに関する工学文献である。
オルタナティブな概念は、ヘルムホルツの意味での推論過程としての視覚であり、そこでは感覚的証拠が因果過程の生成モデル(英語版)の文脈で評価される。
この概念では、視覚は、しばしば、代替仮説の可能性を評価するために感覚データのトップダウン予測を含むと考えられるプロセスにおいて、証拠の尋問を通じて生成モデルを反転させる。
著者らは、各概念のほぼ等しい数に根ざし、それらの間の誤った二分法を克服し、理論と実験の領域で他の視点に取り組みたいという動機を持っている。
霊長類の脳は、両方の概念の利点を組み合わせた未知のアルゴリズムを用いる。
本稿では,この用語を説明し,重要な実証的証拠を検証し,二分法を超越し,霊長類視覚の謎のハイブリッドアルゴリズムを明らかにするための実験的な研究プログラムを提案する。
関連論文リスト
- When Does Perceptual Alignment Benefit Vision Representations? [76.32336818860965]
視覚モデル表現と人間の知覚的判断との整合がユーザビリティに与える影響について検討する。
モデルと知覚的判断を一致させることで、多くの下流タスクで元のバックボーンを改善する表現が得られることがわかった。
その結果,人間の知覚的知識に関する帰納バイアスを視覚モデルに注入することは,より良い表現に寄与することが示唆された。
論文 参考訳(メタデータ) (2024-10-14T17:59:58Z) - Neural Causal Abstractions [63.21695740637627]
我々は、変数とそのドメインをクラスタリングすることで、因果抽象化の新しいファミリーを開発する。
本稿では,ニューラルネットワークモデルを用いて,そのような抽象化が現実的に学習可能であることを示す。
本実験は、画像データを含む高次元設定に因果推論をスケールする方法を記述し、その理論を支持する。
論文 参考訳(メタデータ) (2024-01-05T02:00:27Z) - Brain in the Dark: Design Principles for Neuro-mimetic Learning and
Inference [0.0]
この推論をモデル化するためのアプローチは、脳が世界の生成モデルを持っていると仮定し、感覚刺激の背後にある隠れた原因、すなわち知覚を推論する。
この仮定は、どのように脳にインスパイアされた生成モデルを設計する問題を定式化するか、推論と学習のタスクに対してそれらを逆転させるか、最適化すべき適切な損失関数は何か、といった重要な疑問を提起する。
論文 参考訳(メタデータ) (2023-07-14T15:04:21Z) - Intrinsic Physical Concepts Discovery with Object-Centric Predictive
Models [86.25460882547581]
PHYsical Concepts Inference NEtwork (PHYCINE) は、異なる抽象レベルの物理概念を監督なしで推論するシステムである。
物理概念変数を含むオブジェクト表現は因果推論タスクの性能向上に有効であることを示す。
論文 参考訳(メタデータ) (2023-03-03T11:52:21Z) - Guiding Visual Attention in Deep Convolutional Neural Networks Based on
Human Eye Movements [0.0]
ディープ畳み込みニューラルネットワーク(DCNN)は、当初は生物学的ビジョンの原理にインスパイアされていた。
近年のディープラーニングの進歩は、この類似性を減らしているようだ。
有用なモデルを得るための純粋にデータ駆動型アプローチについて検討する。
論文 参考訳(メタデータ) (2022-06-21T17:59:23Z) - Prune and distill: similar reformatting of image information along rat
visual cortex and deep neural networks [61.60177890353585]
深部畳み込み神経ネットワーク(CNN)は、脳の機能的類似、視覚野の腹側流の優れたモデルを提供することが示されている。
ここでは、CNNまたは視覚野の内部表現で知られているいくつかの顕著な統計的パターンについて考察する。
我々は、CNNと視覚野が、オブジェクト表現の次元展開/縮小と画像情報の再構成と、同様の密接な関係を持っていることを示す。
論文 参考訳(メタデータ) (2022-05-27T08:06:40Z) - Hybrid Predictive Coding: Inferring, Fast and Slow [62.997667081978825]
本稿では,反復型と償却型の両方を原則的に組み合わせたハイブリッド予測符号化ネットワークを提案する。
我々は,本モデルが本質的に不確実性に敏感であり,最小計算費用を用いて正確な信念を得るためにバランスを適応的にバランスさせることを実証した。
論文 参考訳(メタデータ) (2022-04-05T12:52:45Z) - The world seems different in a social context: a neural network analysis
of human experimental data [57.729312306803955]
本研究では,先行・知覚的信号の精度を変化させることで,個人・社会的タスク設定の両方で人間の行動データを再現可能であることを示す。
トレーニングされたネットワークの神経活性化トレースの分析は、情報が個人や社会的条件のネットワークにおいて、根本的に異なる方法でコード化されていることを示す。
論文 参考訳(メタデータ) (2022-03-03T17:19:12Z) - Relating Blindsight and AI: A Review [2.071592865573579]
我々は、人工知能モデルのためのアイデアを創出する試みとして、視力現象の研究をレビューする。
Blindsightは、視覚経験の減少形と見なすことができる。
論文 参考訳(メタデータ) (2021-12-09T02:33:11Z) - Visual Sensation and Perception Computational Models for Deep Learning:
State of the art, Challenges and Prospects [7.949330621850412]
視覚感覚と知覚は、環境認識と理解において視覚情報を検知し、整理し、識別し、解釈する過程を指す。
視覚知覚にインスパイアされた計算モデルは、認知科学、情報科学、人工知能など多くの分野から生まれた複雑さと多様性の特徴を持つ。
論文 参考訳(メタデータ) (2021-09-08T01:51:24Z) - Data augmentation and image understanding [2.123756175601459]
論文は、機械学習、認知科学、神経科学の間の有利なシナジーを探求する。
論文は、視覚知覚や生物学的視覚とより整合した学習表現に焦点を当てている。
論文 参考訳(メタデータ) (2020-12-28T11:00:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。