論文の概要: Shape or Texture: Understanding Discriminative Features in CNNs
- arxiv url: http://arxiv.org/abs/2101.11604v1
- Date: Wed, 27 Jan 2021 18:54:00 GMT
- ステータス: 処理完了
- システム内更新日: 2021-02-02 03:11:28.454185
- Title: Shape or Texture: Understanding Discriminative Features in CNNs
- Title(参考訳): Shape or Texture: CNNにおける識別的特徴の理解
- Authors: Md Amirul Islam, Matthew Kowal, Patrick Esser, Sen Jia, Bjorn Ommer,
Konstantinos G. Derpanis, Neil Bruce
- Abstract要約: 最近の研究では、CNNが実際にテクスチャバイアスを持っていることが示されている」。
ネットワークは,最初の数回の訓練で,全体の形状情報の大部分を学習することを示す。
また、形状の符号化は、局所化された画素ごとのセマンティック情報の符号化を意味するものではないことを示す。
- 参考スコア(独自算出の注目度): 28.513300496205044
- License: http://creativecommons.org/publicdomain/zero/1.0/
- Abstract: Contrasting the previous evidence that neurons in the later layers of a
Convolutional Neural Network (CNN) respond to complex object shapes, recent
studies have shown that CNNs actually exhibit a `texture bias': given an image
with both texture and shape cues (e.g., a stylized image), a CNN is biased
towards predicting the category corresponding to the texture. However, these
previous studies conduct experiments on the final classification output of the
network, and fail to robustly evaluate the bias contained (i) in the latent
representations, and (ii) on a per-pixel level. In this paper, we design a
series of experiments that overcome these issues. We do this with the goal of
better understanding what type of shape information contained in the network is
discriminative, where shape information is encoded, as well as when the network
learns about object shape during training. We show that a network learns the
majority of overall shape information at the first few epochs of training and
that this information is largely encoded in the last few layers of a CNN.
Finally, we show that the encoding of shape does not imply the encoding of
localized per-pixel semantic information. The experimental results and findings
provide a more accurate understanding of the behaviour of current CNNs, thus
helping to inform future design choices.
- Abstract(参考訳): CNN(Convolutional Neural Network, Convolutional Neural Network, Convolutional Neural Network, Convolutional Neural Network, CNN)の後期の神経細胞が複雑な物体の形状に反応するという以前の証拠と対照的に、CNNは実際に「テクスチャバイアス」を示すことを示している。
しかしながら、これらの研究はネットワークの最終分類出力について実験を行い、(i)潜在表現に含まれるバイアスと(ii)ピクセル単位でのバイアスを頑健に評価することができない。
本稿では,これらの問題を克服する一連の実験を設計する。
我々は,ネットワークに含まれる形状情報の種類を識別し,形状情報を符号化し,ネットワークがトレーニング中に対象形状について学習する際の理解を深めることを目的としている。
ネットワークは、トレーニングの開始から数年で、全体の形状情報の大部分を学習し、この情報はcnnの最後の数層に主にエンコードされていることを示す。
最後に,形状のエンコーディングは,ピクセル単位の局所的な意味情報のエンコーディングを意味するものではないことを示す。
実験結果と知見は、現在のcnnの挙動をより正確に理解し、将来の設計選択を知らせるのに役立つ。
関連論文リスト
- Convolutional Neural Networks Rarely Learn Shape for Semantic Segmentation [16.343080265661882]
形状学習は、対象物体が特定の形状を持つ場合、畳み込みニューラルネットワーク(CNN)の望ましい特性である可能性がある。
我々は,CNNが形状情報を利用する範囲を測定するための新しい行動指標を提案する。
我々は、CNNが典型的な設定で形状を学習するのではなく、興味のある対象を特定するために利用可能な他の機能に依存していると結論付けている。
論文 参考訳(メタデータ) (2023-05-11T05:02:11Z) - Random Padding Data Augmentation [23.70951896315126]
畳み込みニューラルネットワーク(CNN)は、画像内の異なる位置で同じ物体を学習する。
CNNにおける特徴情報の空間的情報の有用性はよく研究されていない。
我々はCNNを訓練するための新しいタイプのパディング手法であるランダムパディングを紹介する。
論文 参考訳(メタデータ) (2023-02-17T04:15:33Z) - Prune and distill: similar reformatting of image information along rat
visual cortex and deep neural networks [61.60177890353585]
深部畳み込み神経ネットワーク(CNN)は、脳の機能的類似、視覚野の腹側流の優れたモデルを提供することが示されている。
ここでは、CNNまたは視覚野の内部表現で知られているいくつかの顕著な統計的パターンについて考察する。
我々は、CNNと視覚野が、オブジェクト表現の次元展開/縮小と画像情報の再構成と、同様の密接な関係を持っていることを示す。
論文 参考訳(メタデータ) (2022-05-27T08:06:40Z) - Convolutional Neural Networks Demystified: A Matched Filtering
Perspective Based Tutorial [7.826806223782053]
畳み込みニューラルネットワーク(CNN)は、大量の信号や画像を分析するためのデファクト標準である。
我々は、最初の原則と一致するフィルタリングの観点から、それらの操作を再考する。
このチュートリアルが、深層ニューラルネットワークの理解とさらなる発展に新たな光と物理的直感をもたらすことを願っています。
論文 参考訳(メタデータ) (2021-08-26T09:07:49Z) - The Mind's Eye: Visualizing Class-Agnostic Features of CNNs [92.39082696657874]
本稿では,特定のレイヤの最も情報性の高い特徴を表現した対応する画像を作成することにより,画像の集合を視覚的に解釈する手法を提案する。
本手法では, 生成ネットワークを必要とせず, 元のモデルに変更を加えることなく, デュアルオブジェクトのアクティベーションと距離損失を利用する。
論文 参考訳(メタデータ) (2021-01-29T07:46:39Z) - Assessing The Importance Of Colours For CNNs In Object Recognition [70.70151719764021]
畳み込みニューラルネットワーク(CNN)は相反する性質を示すことが示されている。
CNNが予測をしながら色情報に大きく依存していることを実証します。
congruent, greyscale, incongruent画像の合同画像で学習したモデルを評価する。
論文 参考訳(メタデータ) (2020-12-12T22:55:06Z) - Informative Dropout for Robust Representation Learning: A Shape-bias
Perspective [84.30946377024297]
Informative Dropout (InfoDrop) と呼ばれる軽量モデル非依存の手法を提案し, 解釈性の向上とテクスチャバイアスの低減を図る。
具体的には、画像中の局所的な自己情報に基づいて形状からテクスチャを識別し、Dropoutのようなアルゴリズムを用いて局所的なテクスチャからのモデル出力をデコレーションする。
論文 参考訳(メタデータ) (2020-08-10T16:52:24Z) - Teaching CNNs to mimic Human Visual Cognitive Process & regularise
Texture-Shape bias [18.003188982585737]
コンピュータビジョンにおける最近の実験は、畳み込みニューラルネットワーク(CNN)を用いたモデルにおいて、テクスチャバイアスが最高の結果の主因であることを実証している。
コスト関数は、CNNが欲張りなアプローチを採り、テクスチャのような局所的な情報に対する生産性を向上させ、その結果、グローバルな統計を探索することができないと信じられている。
画像の再構成と分類に形状,テクスチャ,エッジなどの人間の解釈可能な特徴を活用するために,心理学における特徴統合理論から着想を得た,新しい直感的なアーキテクチャであるCognitiveCNNを提案する。
論文 参考訳(メタデータ) (2020-06-25T22:32:54Z) - An Information-theoretic Visual Analysis Framework for Convolutional
Neural Networks [11.15523311079383]
CNNモデルから抽出可能なデータを整理するデータモデルを提案する。
次に、異なる状況下でエントロピーを計算する2つの方法を提案する。
我々は,モデル内の情報変化量をインタラクティブに探索する視覚解析システムCNNSlicerを開発した。
論文 参考訳(メタデータ) (2020-05-02T21:36:50Z) - Shape-Oriented Convolution Neural Network for Point Cloud Analysis [59.405388577930616]
ポイントクラウドは3次元幾何学情報符号化に採用されている主要なデータ構造である。
形状指向型メッセージパッシング方式であるShapeConvを提案する。
論文 参考訳(メタデータ) (2020-04-20T16:11:51Z) - Curriculum By Smoothing [52.08553521577014]
畳み込みニューラルネットワーク(CNN)は、画像分類、検出、セグメンテーションなどのコンピュータビジョンタスクにおいて顕著な性能を示している。
アンチエイリアスフィルタやローパスフィルタを用いてCNNの機能埋め込みを円滑化するエレガントなカリキュラムベースのスキームを提案する。
トレーニング中に特徴マップ内の情報量が増加するにつれて、ネットワークはデータのより優れた表現を徐々に学習することができる。
論文 参考訳(メタデータ) (2020-03-03T07:27:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。