論文の概要: Data augmentation and image understanding
- arxiv url: http://arxiv.org/abs/2012.14185v1
- Date: Mon, 28 Dec 2020 11:00:52 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-19 11:10:25.901034
- Title: Data augmentation and image understanding
- Title(参考訳): データ拡張と画像理解
- Authors: Alex Hernandez-Garcia
- Abstract要約: 論文は、機械学習、認知科学、神経科学の間の有利なシナジーを探求する。
論文は、視覚知覚や生物学的視覚とより整合した学習表現に焦点を当てている。
- 参考スコア(独自算出の注目度): 2.123756175601459
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Interdisciplinary research is often at the core of scientific progress. This
dissertation explores some advantageous synergies between machine learning,
cognitive science and neuroscience. In particular, this thesis focuses on
vision and images. The human visual system has been widely studied from both
behavioural and neuroscientific points of view, as vision is the dominant sense
of most people. In turn, machine vision has also been an active area of
research, currently dominated by the use of artificial neural networks. This
work focuses on learning representations that are more aligned with visual
perception and the biological vision. For that purpose, I have studied tools
and aspects from cognitive science and computational neuroscience, and
attempted to incorporate them into machine learning models of vision.
A central subject of this dissertation is data augmentation, a commonly used
technique for training artificial neural networks to augment the size of data
sets through transformations of the images. Although often overlooked, data
augmentation implements transformations that are perceptually plausible, since
they correspond to the transformations we see in our visual world -- changes in
viewpoint or illumination, for instance. Furthermore, neuroscientists have
found that the brain invariantly represents objects under these
transformations. Throughout this dissertation, I use these insights to analyse
data augmentation as a particularly useful inductive bias, a more effective
regularisation method for artificial neural networks, and as the framework to
analyse and improve the invariance of vision models to perceptually plausible
transformations. Overall, this work aims to shed more light on the properties
of data augmentation and demonstrate the potential of interdisciplinary
research.
- Abstract(参考訳): 学際研究は、しばしば科学的進歩の核心にある。
この論文は、機械学習、認知科学、神経科学の間の有利なシナジーを探求している。
特にこの論文は視覚と画像に焦点を当てている。
視覚は多くの人の支配的な感覚であるため、人間の視覚システムは行動と神経科学の両方の観点から広く研究されてきた。
逆に、機械ビジョンは研究の活発な領域であり、現在は人工ニューラルネットワークによって支配されている。
この研究は、視覚知覚と生物学的ビジョンとより整合した学習表現に焦点を当てている。
その目的のために、認知科学や計算神経科学からツールや側面を研究し、それらを視覚の機械学習モデルに組み込もうとしました。
この論文の中心的なテーマは、画像の変換を通じてデータセットのサイズを増強するために、人工ニューラルネットワークをトレーニングするための一般的なテクニックであるdata augmentationである。
しばしば見過ごされるが、データ拡張は、視覚の世界で見られる変換 – 例えば視点や照明の変化 – に対応するため、知覚的に妥当な変換を実装している。
さらに、神経科学者は、脳がこれらの変換の下で不変に物体を表現していることを発見した。
この論文を通して、私はこれらの洞察を用いて、特に有用な帰納的バイアス、より効果的なニューラルネットワークの正規化法、知覚可能な変換への視覚モデルの不変性の分析と改善のためのフレームワークとしてデータ拡張を分析する。
全体として、この研究は、データ拡張の特性にさらなる光を当て、学際研究の可能性を示すことを目的としている。
関連論文リスト
- Connecting metrics for shape-texture knowledge in computer vision [1.7785095623975342]
深層ニューラルネットワークは、人間が画像の分類ミスを起こさないような、画像の多くの変化の影響を受けやすいままである。
この異なる振る舞いの一部は、視覚タスクで人間とディープニューラルネットワークが使用する機能の種類によって説明できるかもしれない。
論文 参考訳(メタデータ) (2023-01-25T14:37:42Z) - BI AVAN: Brain inspired Adversarial Visual Attention Network [67.05560966998559]
機能的脳活動から直接人間の視覚的注意を特徴付ける脳誘発対人視覚注意ネットワーク(BI-AVAN)を提案する。
本モデルは,人間の脳が監督されていない方法で焦点を絞った映画フレーム内の視覚的物体を識別・発見するために,注意関連・無視対象間の偏りのある競合過程を模倣する。
論文 参考訳(メタデータ) (2022-10-27T22:20:36Z) - Adapting Brain-Like Neural Networks for Modeling Cortical Visual
Prostheses [68.96380145211093]
皮質補綴は視覚野に移植された装置で、電気的にニューロンを刺激することで失った視力を回復しようとする。
現在、これらのデバイスが提供する視覚は限られており、刺激による視覚知覚を正確に予測することはオープンな課題である。
我々は、視覚システムの有望なモデルとして登場した「脳様」畳み込みニューラルネットワーク(CNN)を活用することで、この問題に対処することを提案する。
論文 参考訳(メタデータ) (2022-09-27T17:33:19Z) - A neuromorphic approach to image processing and machine vision [0.9137554315375922]
画像分割,視覚的注意,物体認識などの視覚的タスクの実装について検討する。
我々は,人工視覚システムを実現するために,メムリスタなどの不揮発性メモリデバイスの利用を強調してきた。
論文 参考訳(メタデータ) (2022-08-07T05:01:57Z) - Guiding Visual Attention in Deep Convolutional Neural Networks Based on
Human Eye Movements [0.0]
ディープ畳み込みニューラルネットワーク(DCNN)は、当初は生物学的ビジョンの原理にインスパイアされていた。
近年のディープラーニングの進歩は、この類似性を減らしているようだ。
有用なモデルを得るための純粋にデータ駆動型アプローチについて検討する。
論文 参考訳(メタデータ) (2022-06-21T17:59:23Z) - Peripheral Vision Transformer [52.55309200601883]
我々は生物学的にインスパイアされたアプローチを採用し、視覚認識のためのディープニューラルネットワークの周辺視覚をモデル化する。
本稿では,マルチヘッド自己アテンション層に周辺位置エンコーディングを組み込むことにより,トレーニングデータから視覚領域を様々な周辺領域に分割することをネットワークが学べるようにすることを提案する。
大規模画像Netデータセット上でPerViTと呼ばれる提案したネットワークを評価し,マシン知覚モデルの内部動作を体系的に検討した。
論文 参考訳(メタデータ) (2022-06-14T12:47:47Z) - Prune and distill: similar reformatting of image information along rat
visual cortex and deep neural networks [61.60177890353585]
深部畳み込み神経ネットワーク(CNN)は、脳の機能的類似、視覚野の腹側流の優れたモデルを提供することが示されている。
ここでは、CNNまたは視覚野の内部表現で知られているいくつかの顕著な統計的パターンについて考察する。
我々は、CNNと視覚野が、オブジェクト表現の次元展開/縮小と画像情報の再構成と、同様の密接な関係を持っていることを示す。
論文 参考訳(メタデータ) (2022-05-27T08:06:40Z) - Interpretability of Neural Network With Physiological Mechanisms [5.1971653175509145]
ディープラーニングは、レグレッションと分類タスクの様々な領域で異常な精度を達成した強力な最先端技術として、引き続き機能している。
ニューラルネットワークモデルを最初に提案する目的は、数学的表現アプローチを使用して複雑な人間の脳を理解することを改善することである。
近年のディープラーニング技術は、ブラックボックス近似器として扱われることによって、機能的プロセスの解釈を失う傾向にある。
論文 参考訳(メタデータ) (2022-03-24T21:40:04Z) - The world seems different in a social context: a neural network analysis
of human experimental data [57.729312306803955]
本研究では,先行・知覚的信号の精度を変化させることで,個人・社会的タスク設定の両方で人間の行動データを再現可能であることを示す。
トレーニングされたネットワークの神経活性化トレースの分析は、情報が個人や社会的条件のネットワークにおいて、根本的に異なる方法でコード化されていることを示す。
論文 参考訳(メタデータ) (2022-03-03T17:19:12Z) - Visual Sensation and Perception Computational Models for Deep Learning:
State of the art, Challenges and Prospects [7.949330621850412]
視覚感覚と知覚は、環境認識と理解において視覚情報を検知し、整理し、識別し、解釈する過程を指す。
視覚知覚にインスパイアされた計算モデルは、認知科学、情報科学、人工知能など多くの分野から生まれた複雑さと多様性の特徴を持つ。
論文 参考訳(メタデータ) (2021-09-08T01:51:24Z) - Affect Analysis in-the-wild: Valence-Arousal, Expressions, Action Units
and a Unified Framework [83.21732533130846]
Aff-Wild と Aff-Wild2 の2つである。
これは、これらのデータベースで訓練された深層ニューラルネットワークの2つのクラスの設計を示す。
インパクト認識を共同で学び、効果的に一般化し、実行することができる新しいマルチタスクおよび全体主義のフレームワークが提示されます。
論文 参考訳(メタデータ) (2021-03-29T17:36:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。