論文の概要: Visual Sensation and Perception Computational Models for Deep Learning:
State of the art, Challenges and Prospects
- arxiv url: http://arxiv.org/abs/2109.03391v1
- Date: Wed, 8 Sep 2021 01:51:24 GMT
- ステータス: 処理完了
- システム内更新日: 2021-09-10 04:03:03.105024
- Title: Visual Sensation and Perception Computational Models for Deep Learning:
State of the art, Challenges and Prospects
- Title(参考訳): 深層学習のための視覚知覚と知覚計算モデル--現状,課題,展望
- Authors: Bing Wei, Yudi Zhao, Kuangrong Hao, and Lei Gao
- Abstract要約: 視覚感覚と知覚は、環境認識と理解において視覚情報を検知し、整理し、識別し、解釈する過程を指す。
視覚知覚にインスパイアされた計算モデルは、認知科学、情報科学、人工知能など多くの分野から生まれた複雑さと多様性の特徴を持つ。
- 参考スコア(独自算出の注目度): 7.949330621850412
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Visual sensation and perception refers to the process of sensing, organizing,
identifying, and interpreting visual information in environmental awareness and
understanding. Computational models inspired by visual perception have the
characteristics of complexity and diversity, as they come from many subjects
such as cognition science, information science, and artificial intelligence. In
this paper, visual perception computational models oriented deep learning are
investigated from the biological visual mechanism and computational vision
theory systematically. Then, some points of view about the prospects of the
visual perception computational models are presented. Finally, this paper also
summarizes the current challenges of visual perception and predicts its future
development trends. Through this survey, it will provide a comprehensive
reference for research in this direction.
- Abstract(参考訳): 視覚感覚と知覚は、環境認識と理解において視覚情報を検知し、整理し、識別し、解釈する過程を指す。
視覚知覚にインスパイアされた計算モデルは、認知科学、情報科学、人工知能など多くの分野から生まれた複雑さと多様性の特徴を持つ。
本稿では,生体視覚機構と計算視覚理論から,深層学習を指向した視覚知覚計算モデルについて系統的に検討する。
そこで,視覚知覚計算モデルの展望について,いくつかの視点を提示する。
最後に,視覚知覚の現在の課題を要約し,今後の展開傾向を予測する。
この調査を通じて、この方向の研究の包括的な参考資料を提供する。
関連論文リスト
- How does the primate brain combine generative and discriminative
computations in vision? [4.691670689443386]
推論過程の2つの対照的な概念は、それぞれ生物学的ビジョンと機械ビジョンの研究に影響を与えている。
視覚は、しばしば感覚データのトップダウン予測を含むと考えられるプロセスにおいて、証拠の尋問を通じて生成モデルを逆転させることを示す。
本稿では,この用語を説明し,重要な実証的証拠を概説するとともに,霊長類視覚の謎のハイブリッドアルゴリズムを明らかにするための段階を超越し,設定する経験的研究プログラムを提案する。
論文 参考訳(メタデータ) (2024-01-11T16:07:58Z) - Deep Learning for Visual Neuroprosthesis [22.59701507351177]
視覚経路は、視覚情報の符号化と処理に寄与する細胞と領域の複雑なネットワークを含んでいる。
本章では、視覚知覚の重要性と、視覚情報が脳内でどのようにエンコードされ、どのように表現されるかを理解する上での課題について論じる。
論文 参考訳(メタデータ) (2024-01-08T02:53:22Z) - Review of Large Vision Models and Visual Prompt Engineering [50.63394642549947]
レビューは、大きな視覚モデルと視覚プロンプトエンジニアリングのためにコンピュータビジョン領域で使用される手法を要約することを目的としている。
本稿では、視覚領域における影響力のある大規模モデルと、これらのモデルに使用される一連のプロンプトエンジニアリング手法を提案する。
論文 参考訳(メタデータ) (2023-07-03T08:48:49Z) - Intrinsic Physical Concepts Discovery with Object-Centric Predictive
Models [86.25460882547581]
PHYsical Concepts Inference NEtwork (PHYCINE) は、異なる抽象レベルの物理概念を監督なしで推論するシステムである。
物理概念変数を含むオブジェクト表現は因果推論タスクの性能向上に有効であることを示す。
論文 参考訳(メタデータ) (2023-03-03T11:52:21Z) - Deep Learning to See: Towards New Foundations of Computer Vision [88.69805848302266]
この本はコンピュータビジョンの分野における科学的進歩を批判している。
情報に基づく自然法則の枠組みにおける視覚の研究を提案する。
論文 参考訳(メタデータ) (2022-06-30T15:20:36Z) - Peripheral Vision Transformer [52.55309200601883]
我々は生物学的にインスパイアされたアプローチを採用し、視覚認識のためのディープニューラルネットワークの周辺視覚をモデル化する。
本稿では,マルチヘッド自己アテンション層に周辺位置エンコーディングを組み込むことにより,トレーニングデータから視覚領域を様々な周辺領域に分割することをネットワークが学べるようにすることを提案する。
大規模画像Netデータセット上でPerViTと呼ばれる提案したネットワークを評価し,マシン知覚モデルの内部動作を体系的に検討した。
論文 参考訳(メタデータ) (2022-06-14T12:47:47Z) - Causal Reasoning Meets Visual Representation Learning: A Prospective
Study [117.08431221482638]
解釈可能性の欠如、堅牢性、分布外一般化が、既存の視覚モデルの課題となっている。
人間レベルのエージェントの強い推論能力にインスパイアされた近年では、因果推論パラダイムの開発に多大な努力が注がれている。
本稿では,この新興分野を包括的に概観し,注目し,議論を奨励し,新たな因果推論手法の開発の急激さを先導することを目的とする。
論文 参考訳(メタデータ) (2022-04-26T02:22:28Z) - Relating Blindsight and AI: A Review [2.071592865573579]
我々は、人工知能モデルのためのアイデアを創出する試みとして、視力現象の研究をレビューする。
Blindsightは、視覚経験の減少形と見なすことができる。
論文 参考訳(メタデータ) (2021-12-09T02:33:11Z) - Attention Mechanisms in Computer Vision: A Survey [75.6074182122423]
本稿では,コンピュータビジョンにおける様々な注意機構について概観する。
チャネルアテンション,空間アテンション,時間アテンション,分岐アテンションなど,アプローチによって分類する。
我々は注意機構研究の今後の方向性を提案する。
論文 参考訳(メタデータ) (2021-11-15T09:18:40Z) - Data augmentation and image understanding [2.123756175601459]
論文は、機械学習、認知科学、神経科学の間の有利なシナジーを探求する。
論文は、視覚知覚や生物学的視覚とより整合した学習表現に焦点を当てている。
論文 参考訳(メタデータ) (2020-12-28T11:00:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。