論文の概要: Visual Sensation and Perception Computational Models for Deep Learning:
State of the art, Challenges and Prospects
- arxiv url: http://arxiv.org/abs/2109.03391v1
- Date: Wed, 8 Sep 2021 01:51:24 GMT
- ステータス: 処理完了
- システム内更新日: 2021-09-10 04:03:03.105024
- Title: Visual Sensation and Perception Computational Models for Deep Learning:
State of the art, Challenges and Prospects
- Title(参考訳): 深層学習のための視覚知覚と知覚計算モデル--現状,課題,展望
- Authors: Bing Wei, Yudi Zhao, Kuangrong Hao, and Lei Gao
- Abstract要約: 視覚感覚と知覚は、環境認識と理解において視覚情報を検知し、整理し、識別し、解釈する過程を指す。
視覚知覚にインスパイアされた計算モデルは、認知科学、情報科学、人工知能など多くの分野から生まれた複雑さと多様性の特徴を持つ。
- 参考スコア(独自算出の注目度): 7.949330621850412
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Visual sensation and perception refers to the process of sensing, organizing,
identifying, and interpreting visual information in environmental awareness and
understanding. Computational models inspired by visual perception have the
characteristics of complexity and diversity, as they come from many subjects
such as cognition science, information science, and artificial intelligence. In
this paper, visual perception computational models oriented deep learning are
investigated from the biological visual mechanism and computational vision
theory systematically. Then, some points of view about the prospects of the
visual perception computational models are presented. Finally, this paper also
summarizes the current challenges of visual perception and predicts its future
development trends. Through this survey, it will provide a comprehensive
reference for research in this direction.
- Abstract(参考訳): 視覚感覚と知覚は、環境認識と理解において視覚情報を検知し、整理し、識別し、解釈する過程を指す。
視覚知覚にインスパイアされた計算モデルは、認知科学、情報科学、人工知能など多くの分野から生まれた複雑さと多様性の特徴を持つ。
本稿では,生体視覚機構と計算視覚理論から,深層学習を指向した視覚知覚計算モデルについて系統的に検討する。
そこで,視覚知覚計算モデルの展望について,いくつかの視点を提示する。
最後に,視覚知覚の現在の課題を要約し,今後の展開傾向を予測する。
この調査を通じて、この方向の研究の包括的な参考資料を提供する。
関連論文リスト
- When Does Perceptual Alignment Benefit Vision Representations? [76.32336818860965]
視覚モデル表現と人間の知覚的判断との整合がユーザビリティに与える影響について検討する。
モデルと知覚的判断を一致させることで、多くの下流タスクで元のバックボーンを改善する表現が得られることがわかった。
その結果,人間の知覚的知識に関する帰納バイアスを視覚モデルに注入することは,より良い表現に寄与することが示唆された。
論文 参考訳(メタデータ) (2024-10-14T17:59:58Z) - Graphical Perception of Saliency-based Model Explanations [6.936466872687605]
本研究では,視覚認知モデルに対するモデル説明の知覚,特に正当性に基づく説明について検討する。
以上の結果から, 可視化設計決定やアライメントの種類, サリエンシマップの質に関連する要因が, 人間がサリエンシに基づく視覚的説明を知覚する上で重要な役割を担っていることが明らかとなった。
論文 参考訳(メタデータ) (2024-06-11T20:29:25Z) - Visual Knowledge in the Big Model Era: Retrospect and Prospect [63.282425615863]
視覚知識は、視覚概念とその関係を簡潔で包括的で解釈可能な方法でカプセル化できる新しい知識表現である。
視覚世界に関する知識は、人間の認知と知性にとって欠かせない要素として認識されているため、視覚知識は、機械知性を確立する上で重要な役割を担っていると考えられる。
論文 参考訳(メタデータ) (2024-04-05T07:31:24Z) - Deep Learning for Visual Neuroprosthesis [22.59701507351177]
視覚経路は、視覚情報の符号化と処理に寄与する細胞と領域の複雑なネットワークを含んでいる。
本章では、視覚知覚の重要性と、視覚情報が脳内でどのようにエンコードされ、どのように表現されるかを理解する上での課題について論じる。
論文 参考訳(メタデータ) (2024-01-08T02:53:22Z) - Intrinsic Physical Concepts Discovery with Object-Centric Predictive
Models [86.25460882547581]
PHYsical Concepts Inference NEtwork (PHYCINE) は、異なる抽象レベルの物理概念を監督なしで推論するシステムである。
物理概念変数を含むオブジェクト表現は因果推論タスクの性能向上に有効であることを示す。
論文 参考訳(メタデータ) (2023-03-03T11:52:21Z) - Deep Learning to See: Towards New Foundations of Computer Vision [88.69805848302266]
この本はコンピュータビジョンの分野における科学的進歩を批判している。
情報に基づく自然法則の枠組みにおける視覚の研究を提案する。
論文 参考訳(メタデータ) (2022-06-30T15:20:36Z) - Peripheral Vision Transformer [52.55309200601883]
我々は生物学的にインスパイアされたアプローチを採用し、視覚認識のためのディープニューラルネットワークの周辺視覚をモデル化する。
本稿では,マルチヘッド自己アテンション層に周辺位置エンコーディングを組み込むことにより,トレーニングデータから視覚領域を様々な周辺領域に分割することをネットワークが学べるようにすることを提案する。
大規模画像Netデータセット上でPerViTと呼ばれる提案したネットワークを評価し,マシン知覚モデルの内部動作を体系的に検討した。
論文 参考訳(メタデータ) (2022-06-14T12:47:47Z) - Causal Reasoning Meets Visual Representation Learning: A Prospective
Study [117.08431221482638]
解釈可能性の欠如、堅牢性、分布外一般化が、既存の視覚モデルの課題となっている。
人間レベルのエージェントの強い推論能力にインスパイアされた近年では、因果推論パラダイムの開発に多大な努力が注がれている。
本稿では,この新興分野を包括的に概観し,注目し,議論を奨励し,新たな因果推論手法の開発の急激さを先導することを目的とする。
論文 参考訳(メタデータ) (2022-04-26T02:22:28Z) - Relating Blindsight and AI: A Review [2.071592865573579]
我々は、人工知能モデルのためのアイデアを創出する試みとして、視力現象の研究をレビューする。
Blindsightは、視覚経験の減少形と見なすことができる。
論文 参考訳(メタデータ) (2021-12-09T02:33:11Z) - Data augmentation and image understanding [2.123756175601459]
論文は、機械学習、認知科学、神経科学の間の有利なシナジーを探求する。
論文は、視覚知覚や生物学的視覚とより整合した学習表現に焦点を当てている。
論文 参考訳(メタデータ) (2020-12-28T11:00:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。