論文の概要: The developmental trajectory of object recognition robustness: children
are like small adults but unlike big deep neural networks
- arxiv url: http://arxiv.org/abs/2205.10144v1
- Date: Fri, 20 May 2022 12:39:02 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-23 21:49:31.954723
- Title: The developmental trajectory of object recognition robustness: children
are like small adults but unlike big deep neural networks
- Title(参考訳): 物体認識の堅牢性の発達的軌跡--子どもは小さな大人に似ているが、大きなディープニューラルネットワークとは異なっている
- Authors: Lukas S. Huber, Robert Geirhos, Felix A. Wichmann
- Abstract要約: 過去2年間、Deep Deep Networks(DNN)の堅牢性は著しく向上した。
これは、人間の堅牢性も、単に幼少期以降の経験(歪んだ視覚入力)に起因しているかどうかという疑問を提起する。
本稿では,大人とDNNに対する子どもの物体認識性能を比較して,この問題を考察する。
- 参考スコア(独自算出の注目度): 7.085050078390945
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In laboratory object recognition tasks based on undistorted photographs, both
adult humans and Deep Neural Networks (DNNs) perform close to ceiling. Unlike
adults', whose object recognition performance is robust against a wide range of
image distortions, DNNs trained on standard ImageNet (1.3M images) perform
poorly on distorted images. However, the last two years have seen impressive
gains in DNN distortion robustness, predominantly achieved through
ever-increasing large-scale datasets$\unicode{x2014}$orders of magnitude larger
than ImageNet. While this simple brute-force approach is very effective in
achieving human-level robustness in DNNs, it raises the question of whether
human robustness, too, is simply due to extensive experience with (distorted)
visual input during childhood and beyond. Here we investigate this question by
comparing the core object recognition performance of 146 children (aged
4$\unicode{x2013}$15) against adults and against DNNs. We find, first, that
already 4$\unicode{x2013}$6 year-olds showed remarkable robustness to image
distortions and outperform DNNs trained on ImageNet. Second, we estimated the
number of $\unicode{x201C}$images$\unicode{x201D}$ children have been exposed
to during their lifetime. Compared to various DNNs, children's high robustness
requires relatively little data. Third, when recognizing objects
children$\unicode{x2014}$like adults but unlike DNNs$\unicode{x2014}$rely
heavily on shape but not on texture cues. Together our results suggest that the
remarkable robustness to distortions emerges early in the developmental
trajectory of human object recognition and is unlikely the result of a mere
accumulation of experience with distorted visual input. Even though current
DNNs match human performance regarding robustness they seem to rely on
different and more data-hungry strategies to do so.
- Abstract(参考訳): 実験室のオブジェクト認識タスクでは、大人の人間とディープニューラルネットワーク(dnn)の両方が天井近くで動作します。
物体認識性能が幅広い画像歪みに対して堅牢である成人と異なり、標準画像Net(1.3M画像)で訓練されたDNNは歪んだ画像では不十分である。
しかし、過去2年間、DNNの歪みの堅牢性は著しく向上し、主に大規模データセット$\unicode{x2014}$ordersがImageNetよりも大きくなった。
この単純なブルートフォースアプローチは、DNNにおいて人間のレベルの堅牢性を達成するのに非常に効果的であるが、人間の堅牢性も単に幼少期以降の視覚的入力による(歪んだ)経験によるものなのかという疑問を提起する。
本稿では,146名の子ども(年齢4$\unicode{x2013}$15)のコアオブジェクト認識性能を成人とdnnとの比較により検討する。
まず、すでに4$\unicode{x2013}$6の子供が、画像の歪みや、ImageNetで訓練されたDNNよりもはるかに堅牢であることがわかった。
第二に、$\unicode{x201C}$images$\unicode{x201D}$ childrenが生涯にわたって露出していると見積もった。
様々なDNNと比較して、子供の高い堅牢性は比較的少ないデータを必要とする。
第三に、オブジェクトを認識するとき、$\unicode{x2014}$like adultだが、DNNs$\unicode{x2014}$rely heavily on shape but not on texture cues。
以上の結果から, 歪みに対する顕著な堅牢性は, 人間の物体認識の発達過程の早期に出現し, 変形した視覚入力による経験の蓄積の結果である可能性が示唆された。
現在のDNNは、堅牢性に関して人間のパフォーマンスにマッチするが、それを行うには、異なる、より多くのデータ処理戦略に依存しているようだ。
関連論文リスト
- NAS-BNN: Neural Architecture Search for Binary Neural Networks [55.058512316210056]
我々は、NAS-BNNと呼ばれる二元ニューラルネットワークのための新しいニューラルネットワーク探索手法を提案する。
我々の発見したバイナリモデルファミリーは、20Mから2Mまでの幅広い操作(OP)において、以前のBNNよりも優れていた。
さらに,対象検出タスクにおける探索されたBNNの転送可能性を検証するとともに,探索されたBNNを用いたバイナリ検出器は,MSデータセット上で31.6% mAP,370万 OPsなどの新たな最先端結果を得る。
論文 参考訳(メタデータ) (2024-08-28T02:17:58Z) - Performance-optimized deep neural networks are evolving into worse
models of inferotemporal visual cortex [8.45100792118802]
深部ニューラルネットワーク(DNN)の物体認識精度は,非時間的(IT)大脳皮質の自然画像に対する神経応答を予測する能力と相関することを示した。
この結果から,高調波DNNは画像ネット精度とニューラル予測精度のトレードオフを断ち切ることが示唆された。
論文 参考訳(メタデータ) (2023-06-06T15:34:45Z) - Are Deep Neural Networks Adequate Behavioural Models of Human Visual
Perception? [8.370048099732573]
ディープニューラルネットワーク(Deep Neural Network, DNN)は、コンピュータビジョンに革命をもたらした機械学習アルゴリズムである。
統計ツールと計算モデルとを区別することが重要であると論じる。
我々は視覚科学においてDNNを取り巻く多くの神話を排除した。
論文 参考訳(メタデータ) (2023-05-26T15:31:06Z) - InternImage: Exploring Large-Scale Vision Foundation Models with
Deformable Convolutions [95.94629864981091]
この研究は、パラメータの増加やViTsのようなトレーニングデータから得られるインターンイメージと呼ばれる、CNNベースの新しい大規模ファンデーションモデルを提案する。
提案されたInternImageは、従来のCNNの厳格な帰納バイアスを低減し、ViTのような大規模データから、より強く堅牢なパターンを学習できるようにする。
論文 参考訳(メタデータ) (2022-11-10T18:59:04Z) - Harmonizing the object recognition strategies of deep neural networks
with humans [10.495114898741205]
最先端のディープニューラルネットワーク(DNN)は、精度が向上するにつれて、人間との整合性が低下していることを示す。
我々の研究は、現在DNNの設計を導くスケーリング法則が、人間の視覚を悪化させるモデルを生み出した最初の例である。
論文 参考訳(メタデータ) (2022-11-08T20:03:49Z) - 3D Clothed Human Reconstruction in the Wild [67.35107130310257]
ClothWildは、Wild内の画像のロバスト性に対処する、3Dの服を着た人間の再構築フレームワークである。
そこで本研究では,Wild データセットの2次元教師対象でトレーニング可能な弱教師付きパイプラインを提案する。
提案したClosWildは最先端の手法よりもはるかに正確で堅牢な結果が得られる。
論文 参考訳(メタデータ) (2022-07-20T17:33:19Z) - Progress and limitations of deep networks to recognize objects in
unusual poses [0.0]
ディープネットワークは、高精細な現実世界のアプリケーションでうまく利用できれば、まれに堅牢でなければならない。
また,近年の38の競合画像分類データセットの収集と評価を行ない,不規則なポーズに対するディープネットワークの分類が課題であることを示す。
この結果から,実世界における深層ネットワークのロバスト性の測定が重要である。
論文 参考訳(メタデータ) (2022-07-16T23:03:35Z) - Pixel Difference Networks for Efficient Edge Detection [71.03915957914532]
本稿では,Pixel Difference Network (PiDiNet) という軽量かつ効率的なエッジ検出アーキテクチャを提案する。
BSDS500、NYUD、Multicueのデータセットに関する大規模な実験が、その効果を示すために提供されている。
0.1M未満のパラメータを持つPiDiNetのより高速なバージョンは、200FPSのアーティファクトで同等のパフォーマンスを達成できる。
論文 参考訳(メタデータ) (2021-08-16T10:42:59Z) - Contemplating real-world object classification [53.10151901863263]
Barbuらが最近提案したObjectNetデータセットを再分析した。
日常の状況に物を含むこと。
分離されたオブジェクトにディープモデルを適用すると、元の論文のようにシーン全体ではなく、約20~30%の性能改善が得られます。
論文 参考訳(メタデータ) (2021-03-08T23:29:59Z) - Sparse Fooling Images: Fooling Machine Perception through Unrecognizable
Images [36.42135216182063]
そこで本研究では,少ない画素数を持つ単一カラー画像であるスパルスドローイング画像(SFI)を新たに提案する。
SFIは自然対象として認識され、高い信頼度を持つクラスに分類される。
この研究はCNNの構造と堅牢性に関する質問を引き起こし、人間と機械の知覚の違いについて議論する。
論文 参考訳(メタデータ) (2020-12-07T16:47:33Z) - Event-Based Angular Velocity Regression with Spiking Networks [51.145071093099396]
スパイキングニューラルネットワーク(SNN)は、数値ではなく時間スパイクとして伝達される情報を処理する。
本稿では,イベントカメラから与えられた事象の時間回帰問題を初めて提案する。
角速度回帰を行うためにSNNをうまく訓練できることが示される。
論文 参考訳(メタデータ) (2020-03-05T17:37:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。