論文の概要: Do DNNs trained on Natural Images acquire Gestalt Properties?
- arxiv url: http://arxiv.org/abs/2203.07302v1
- Date: Mon, 14 Mar 2022 17:06:11 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-15 16:13:11.520219
- Title: Do DNNs trained on Natural Images acquire Gestalt Properties?
- Title(参考訳): 自然画像の訓練を受けたDNNはゲシュタルト特性を取得するか?
- Authors: Valerio Biscione, Jeffrey S. Bowers
- Abstract要約: 人間の視覚の魅力的なモデルとして、自然画像に基づいて訓練されたディープニューラルネットワーク(DNN)が提案されている。
差別判断において人間とDNNの反応を比較した。
その結果, 自然画像に基づいてトレーニングしたネットワークは, 分類の最終段階において, 形状に敏感であることがわかった。
- 参考スコア(独自算出の注目度): 0.6091702876917281
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Under some circumstances, humans tend to perceive individual elements as a
group or "whole". This has been widely investigated for more than a century by
the school of Gestalt Psychology, which formulated several laws of perceptual
grouping. Recently, Deep Neural Networks (DNNs) trained on natural images have
been proposed as compelling models of human vision based on reports that they
learn internal representations similar to the primate ventral visual stream and
show similar patterns of errors in object classification tasks. That is, DNNs
often perform well on brain and behavioral benchmarks. Here we compared human
and DNN responses in discrimination judgments that assess a range of Gestalt
organization principles (Pomerantz et al., 1977; Pomerantz and Portillo, 2011).
Amongst the DNNs tested we selected models that perform well on the Brain-Score
benchmark (Schrimpf et al., 2018). We found that network trained on natural
images exhibited sensitivity to shapes at the last stage of classification,
which in some cases matched humans responses. When shape familiarity was
controlled for (by using dot patterns that would not resemble shapes) we found
the networks were insensitive to the standard Gestalt principles of proximity,
orientation, and linearity, which have been shown to have a strong and robust
effect on humans. This shows that models that perform well on behavioral and
brain benchmarks nevertheless miss fundamental principles of human vision.
- Abstract(参考訳): ある状況下では、人間は集団や「全体」として個々の要素を知覚する傾向がある。
これは、知覚的グループ化の法則を定式化したゲシュタルト心理学の学派によって1世紀以上にわたって広く研究されてきた。
近年,自然画像に基づいて訓練されたDeep Neural Networks (DNN) は,霊長類の腹側視覚ストリームに似た内部表現を学習し,オブジェクト分類タスクに類似したエラーパターンを示すという報告に基づいて,人間の視覚の魅力的なモデルとして提案されている。
つまり、DNNは脳と行動のベンチマークでよく機能する。
ここでは,ゲシュタルトの組織的原則(Pomerantz et al., 1977; Pomerantz and Portillo, 2011)を評価する識別判断における人間とDNNの反応を比較した。
DNNのテストの中で、Brain-Scoreベンチマークでうまく機能するモデルを選択しました(Schrimpf et al., 2018)。
自然画像に訓練されたネットワークは分類の最終段階で形状に対する感受性を示し,ヒトの反応と一致する場合も見られた。
形状の親和性が(形状に似ていないドットパターンを用いて)制御されたとき、ネットワークは近接性、向き、線形性という標準的なゲシュタルト原理に影響を受けず、これは人間に強く、強固な影響を与えることが示されている。
これは、行動や脳のベンチマークでうまく機能するモデルは、それでも人間の視覚の基本原則を欠いていることを示している。
関連論文リスト
- Evaluating Multiview Object Consistency in Humans and Image Models [68.36073530804296]
我々は、物体の形状に関するゼロショット視覚的推論を必要とする認知科学の実験的設計を活用する。
我々は500人以上の参加者から行動データの35万件の試行を収集した。
次に、一般的な視覚モデルの性能を評価する。
論文 参考訳(メタデータ) (2024-09-09T17:59:13Z) - Dimensions underlying the representational alignment of deep neural networks with humans [3.1668470116181817]
我々は、人間とディープニューラルネットワーク(DNN)において、同等の表現を得るための一般的なフレームワークを提案する。
この枠組みを人間に適用し、自然画像のDNNモデルを用いて、視覚次元と意味次元の両方の低次元DNN埋め込みを明らかにした。
人間とは対照的に、DNNは視覚的オーバーセマンティックな特徴の明確な優位性を示し、画像を表現するための異なる戦略を示した。
論文 参考訳(メタデータ) (2024-06-27T11:14:14Z) - Divergences in Color Perception between Deep Neural Networks and Humans [3.0315685825606633]
我々はディープニューラルネットワーク(DNN)におけるカラー埋め込みの知覚的コヒーレンスを評価する実験を開発した。
これらのアルゴリズムがオンライン調査によって収集された人間の色類似性判定の精度を評価する。
本研究では,ウェーブレット分解に基づく色知覚モデルとDNN性能を比較した。
論文 参考訳(メタデータ) (2023-09-11T20:26:40Z) - Evaluating alignment between humans and neural network representations in image-based learning tasks [5.657101730705275]
トレーニング済みの860ドルのニューラルネットワークモデルの表現が、人間の学習軌跡にどのようにマッピングされているかテストしました。
トレーニングデータセットのサイズは人間の選択に沿った中核的な決定要因であるのに対し、マルチモーダルデータ(テキストと画像)による対照的なトレーニングは、人間の一般化を予測するために現在公開されているモデルの一般的な特徴であることがわかった。
結論として、事前訓練されたニューラルネットワークは、タスク間で伝達可能な認知の基本的な側面を捉えているように見えるため、認知モデルのための表現を抽出するのに役立つ。
論文 参考訳(メタデータ) (2023-06-15T08:18:29Z) - Guiding Visual Attention in Deep Convolutional Neural Networks Based on
Human Eye Movements [0.0]
ディープ畳み込みニューラルネットワーク(DCNN)は、当初は生物学的ビジョンの原理にインスパイアされていた。
近年のディープラーニングの進歩は、この類似性を減らしているようだ。
有用なモデルを得るための純粋にデータ駆動型アプローチについて検討する。
論文 参考訳(メタデータ) (2022-06-21T17:59:23Z) - Prune and distill: similar reformatting of image information along rat
visual cortex and deep neural networks [61.60177890353585]
深部畳み込み神経ネットワーク(CNN)は、脳の機能的類似、視覚野の腹側流の優れたモデルを提供することが示されている。
ここでは、CNNまたは視覚野の内部表現で知られているいくつかの顕著な統計的パターンについて考察する。
我々は、CNNと視覚野が、オブジェクト表現の次元展開/縮小と画像情報の再構成と、同様の密接な関係を持っていることを示す。
論文 参考訳(メタデータ) (2022-05-27T08:06:40Z) - MetaAvatar: Learning Animatable Clothed Human Models from Few Depth
Images [60.56518548286836]
新規な入力ポーズから現実的な布の変形を生成するには、通常、水密メッシュや高密度フルボディスキャンが入力として必要とされる。
本研究では, 単眼深度画像のみを考慮し, 制御可能なニューラルSDFとして表現された, リアルな衣服付きアバターを迅速に生成する手法を提案する。
論文 参考訳(メタデータ) (2021-06-22T17:30:12Z) - Gaze Perception in Humans and CNN-Based Model [66.89451296340809]
cnn(convolutional neural network)ベースの視線モデルと,実世界の映像における注意の軌跡を人間がどのように推定するかを比較した。
モデルと比較すると,注目点の人間推定はシーンの文脈に強く影響していることが示される。
論文 参考訳(メタデータ) (2021-04-17T04:52:46Z) - Assessing The Importance Of Colours For CNNs In Object Recognition [70.70151719764021]
畳み込みニューラルネットワーク(CNN)は相反する性質を示すことが示されている。
CNNが予測をしながら色情報に大きく依存していることを実証します。
congruent, greyscale, incongruent画像の合同画像で学習したモデルを評価する。
論文 参考訳(メタデータ) (2020-12-12T22:55:06Z) - Fooling the primate brain with minimal, targeted image manipulation [67.78919304747498]
本稿では、行動に反映される神経活動と知覚の両方の変化をもたらす、最小限の標的画像摂動を生成するための一連の手法を提案する。
我々の研究は、敵対的攻撃、すなわち最小限のターゲットノイズによる画像の操作で同じ目標を共有し、ANNモデルに画像の誤分類を誘導する。
論文 参考訳(メタデータ) (2020-11-11T08:30:54Z) - Seeing eye-to-eye? A comparison of object recognition performance in
humans and deep convolutional neural networks under image manipulation [0.0]
本研究では,ヒトとフィードフォワードニューラルネットワークの視覚コア物体認識性能の行動比較を目的とした。
精度分析の結果、人間はDCNNを全ての条件で上回るだけでなく、形状や色の変化に対する強い堅牢性も示している。
論文 参考訳(メタデータ) (2020-07-13T10:26:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。