論文の概要: Assessing The Importance Of Colours For CNNs In Object Recognition
- arxiv url: http://arxiv.org/abs/2012.06917v1
- Date: Sat, 12 Dec 2020 22:55:06 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-10 06:09:08.371416
- Title: Assessing The Importance Of Colours For CNNs In Object Recognition
- Title(参考訳): 物体認識におけるcnn色の重要性評価
- Authors: Aditya Singh, Alessandro Bay and Andrea Mirabile
- Abstract要約: 畳み込みニューラルネットワーク(CNN)は相反する性質を示すことが示されている。
CNNが予測をしながら色情報に大きく依存していることを実証します。
congruent, greyscale, incongruent画像の合同画像で学習したモデルを評価する。
- 参考スコア(独自算出の注目度): 70.70151719764021
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Humans rely heavily on shapes as a primary cue for object recognition. As
secondary cues, colours and textures are also beneficial in this regard.
Convolutional neural networks (CNNs), an imitation of biological neural
networks, have been shown to exhibit conflicting properties. Some studies
indicate that CNNs are biased towards textures whereas, another set of studies
suggests shape bias for a classification task. However, they do not discuss the
role of colours, implying its possible humble role in the task of object
recognition. In this paper, we empirically investigate the importance of
colours in object recognition for CNNs. We are able to demonstrate that CNNs
often rely heavily on colour information while making a prediction. Our results
show that the degree of dependency on colours tend to vary from one dataset to
another. Moreover, networks tend to rely more on colours if trained from
scratch. Pre-training can allow the model to be less colour dependent. To
facilitate these findings, we follow the framework often deployed in
understanding role of colours in object recognition for humans. We evaluate a
model trained with congruent images (images in original colours eg. red
strawberries) on congruent, greyscale, and incongruent images (images in
unnatural colours eg. blue strawberries). We measure and analyse network's
predictive performance (top-1 accuracy) under these different stylisations. We
utilise standard datasets of supervised image classification and fine-grained
image classification in our experiments.
- Abstract(参考訳): 人間は物体認識の主要な手がかりとして形状に大きく依存している。
第二の手がかりとして、色やテクスチャも有用である。
生物学的ニューラルネットワークの模倣である畳み込みニューラルネットワーク(cnns)は、相反する特性を示すことが示されている。
いくつかの研究はcnnがテクスチャに偏っていることを示唆しているが、別の研究は分類タスクの形状バイアスを示唆している。
しかし、色の役割については議論せず、物体認識のタスクにおいてその謙虚な役割を暗示している。
本稿では,CNNにおける物体認識における色の重要性を実証的に検討する。
私たちは、CNNが予測しながら色情報に大きく依存していることを示すことができます。
その結果,色への依存度はデータセットによって異なる傾向にあることがわかった。
さらにネットワークは、スクラッチからトレーニングすれば色に依存する傾向がある。
事前トレーニングにより、モデルは色に依存しない。
これらの発見を容易にするために、人間の物体認識における色の役割を理解するためにしばしばデプロイされる枠組みに従う。
一致した画像(原色画像など)で訓練したモデルを評価する。
赤いイチゴ)コングルート、グレイスケール、不自然な画像(不自然な色の画像 eg。
イチゴ(イチゴ)。
これらの異なるスタイルで,ネットワークの予測性能(トップ1精度)を測定し,解析する。
我々は,教師付き画像分類ときめ細かい画像分類の標準データセットを実験で活用する。
関連論文リスト
- Color Equivariant Convolutional Networks [50.655443383582124]
CNNは、偶然に記録された条件によって導入された色の変化の間にデータ不均衡がある場合、苦労する。
カラースペクトル間の形状特徴共有を可能にする新しいディープラーニングビルディングブロックであるカラー等変畳み込み(CEConvs)を提案する。
CEConvsの利点は、様々なタスクに対するダウンストリーム性能と、列車-テストの分散シフトを含む色の変化に対するロバスト性の改善である。
論文 参考訳(メタデータ) (2023-10-30T09:18:49Z) - Divergences in Color Perception between Deep Neural Networks and Humans [3.0315685825606633]
我々はディープニューラルネットワーク(DNN)におけるカラー埋め込みの知覚的コヒーレンスを評価する実験を開発した。
これらのアルゴリズムがオンライン調査によって収集された人間の色類似性判定の精度を評価する。
本研究では,ウェーブレット分解に基づく色知覚モデルとDNN性能を比較した。
論文 参考訳(メタデータ) (2023-09-11T20:26:40Z) - On the ability of CNNs to extract color invariant intensity based
features for image classification [4.297070083645049]
畳み込みニューラルネットワーク(CNN)は視覚関連タスクにおいて顕著な成功を収めている。
近年の研究では、画像分類作業において、CNNは対象形状ではなくテクスチャに偏っていることが示唆されている。
本稿では,CNNが文脈や背景を維持しつつ,画像内の異なる色分布に適応できる能力について検討する。
論文 参考訳(メタデータ) (2023-07-13T00:36:55Z) - Learning to Structure an Image with Few Colors and Beyond [59.34619548026885]
カラー量子化ネットワークであるColorCNNを提案し、分類損失を最小限に抑えて、限られた色空間で画像を構成することを学習する。
複数の色空間サイズ構成をサポートするColorCNN+を導入し、大色空間における認識精度の低下と望ましくない視覚的忠実度に関する過去の問題に対処する。
潜在的な応用として、ネットワーク認識のための画像圧縮手法としてColorCNNが利用可能であることを示す。
論文 参考訳(メタデータ) (2022-08-17T17:59:15Z) - Prune and distill: similar reformatting of image information along rat
visual cortex and deep neural networks [61.60177890353585]
深部畳み込み神経ネットワーク(CNN)は、脳の機能的類似、視覚野の腹側流の優れたモデルを提供することが示されている。
ここでは、CNNまたは視覚野の内部表現で知られているいくつかの顕著な統計的パターンについて考察する。
我々は、CNNと視覚野が、オブジェクト表現の次元展開/縮小と画像情報の再構成と、同様の密接な関係を持っていることを示す。
論文 参考訳(メタデータ) (2022-05-27T08:06:40Z) - Exploring the Interchangeability of CNN Embedding Spaces [0.5735035463793008]
画像分類CNN10点と顔認識CNN4点をマップする。
同じクラスにトレーニングされ、共通のバックエンド-ログアーキテクチャを共有するCNNの場合、リニアマッピングは常にバックエンド層重みから直接計算される。
この意味は遠く離れており、共通のタスクのために設計、訓練されたネットワークによって学習された表現間の基礎的な共通性を示している。
論文 参考訳(メタデータ) (2020-10-05T20:32:40Z) - Teaching CNNs to mimic Human Visual Cognitive Process & regularise
Texture-Shape bias [18.003188982585737]
コンピュータビジョンにおける最近の実験は、畳み込みニューラルネットワーク(CNN)を用いたモデルにおいて、テクスチャバイアスが最高の結果の主因であることを実証している。
コスト関数は、CNNが欲張りなアプローチを採り、テクスチャのような局所的な情報に対する生産性を向上させ、その結果、グローバルな統計を探索することができないと信じられている。
画像の再構成と分類に形状,テクスチャ,エッジなどの人間の解釈可能な特徴を活用するために,心理学における特徴統合理論から着想を得た,新しい直感的なアーキテクチャであるCognitiveCNNを提案する。
論文 参考訳(メタデータ) (2020-06-25T22:32:54Z) - Semantic-driven Colorization [78.88814849391352]
最近の着色は、白黒画像の着色を学習しながら意味情報を暗黙的に予測する。
そこで本研究では,まず,人間の動作をシミュレートして,画像の理解を学習し,色づけする。
論文 参考訳(メタデータ) (2020-06-13T08:13:30Z) - Learning to Structure an Image with Few Colors [59.34619548026885]
そこで,カラー量子化ネットワークであるColorCNNを提案する。
1ビットのカラースペース(すなわち2色)だけで、提案されたネットワークはCIFAR10データセット上で82.1%のトップ-1の精度を達成した。
アプリケーションの場合、PNGでエンコードされた場合、提案したカラー量子化は、極低ビットレート方式の他の画像圧縮方法よりも優れていることを示す。
論文 参考訳(メタデータ) (2020-03-17T17:56:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。