論文の概要: Perceptual misalignment of texture representations in convolutional neural networks
- arxiv url: http://arxiv.org/abs/2604.01341v1
- Date: Wed, 01 Apr 2026 19:51:45 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-03 14:21:09.86328
- Title: Perceptual misalignment of texture representations in convolutional neural networks
- Title(参考訳): 畳み込みニューラルネットワークにおけるテクスチャ表現の知覚的ミスアライメント
- Authors: Ludovica de Paolis, Fabio Anselmi, Alessio Ansuini, Eugenio Piasini,
- Abstract要約: 多様な畳み込みニューラルネットワーク(CNN)のために計算された特徴相関による知覚内容の比較を行う。
視覚システムのモデルとしての従来のCNN品質尺度と人間のテクスチャ知覚との関連性は見つからない。
我々は、テクスチャ認識は、物体認識に基づいて訓練されたCNNに基づいて、一般的にモデル化されるものと異なるメカニズムを伴っていると結論付けた。
- 参考スコア(独自算出の注目度): 3.68986335765876
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Mathematical modeling of visual textures traces back to Julesz's intuition that texture perception in humans is based on local correlations between image features. An influential approach for texture analysis and generation generalizes this notion to linear correlations between the nonlinear features computed by convolutional neural networks (CNNs), compiled into Gram matrices. Given that CNNs are often used as models for the visual system, it is natural to ask whether such "texture representations" spontaneously align with the textures' perceptual content, and in particular whether those CNNs that are regarded as better models for the visual system also possess more human-like texture representations. Here we compare the perceptual content captured by feature correlations computed for a diverse pool of CNNs, and we compare it to the models' perceptual alignment with the mammalian visual system as measured by Brain-Score. Surprisingly, we find that there is no connection between conventional measures of CNN quality as a model of the visual system and its alignment with human texture perception. We conclude that texture perception involves mechanisms that are distinct from those that are commonly modeled using approaches based on CNNs trained on object recognition, possibly depending on the integration of contextual information.
- Abstract(参考訳): 視覚的テクスチャの数学的モデリングは、人間のテクスチャ知覚は画像の特徴の局所的相関に基づくというユレスの直感に遡る。
テクスチャ解析と生成に対する影響力のあるアプローチは、畳み込みニューラルネットワーク(CNN)によって計算された非線形特徴間の線形相関にこの概念を一般化し、グラマー行列にコンパイルする。
CNNが視覚システムのモデルとしてしばしば使用されることを考えると、このような「テクスチャ表現」がテクスチャの知覚的内容と自然に一致しているか、特に視覚システムのより良いモデルと見なされるCNNがより人間的なテクスチャ表現を持っているかどうかを問うのは自然なことである。
本稿では,CNNの多様なプールに対して計算された特徴相関によって得られた知覚内容を比較し,Brain-Scoreが測定したモデルと哺乳類の視覚系との知覚的アライメントを比較した。
意外なことに、視覚システムのモデルとしての従来のCNN品質尺度と、人間のテクスチャ知覚との整合性には関連性がない。
テクスチャ認識は,物体認識に基づいて訓練されたCNNをベースとした手法を用いて,一般的にモデル化されるメカニズムと異なる機構が関係していると結論づける。
関連論文リスト
- ImageNet-trained CNNs are not biased towards texture: Revisiting feature reliance through controlled suppression [10.20881592893918]
我々は、畳み込みニューラルネットワーク(CNN)が本質的にテクスチャバイアスを受けているという仮説を再考する。
本稿では, 形状, テクスチャ, 色調を体系的に抑制することで, 特徴の信頼度を定量化するドメインに依存しないフレームワークを提案する。
コンピュータビジョン, 医用画像, リモートセンシングにまたがって解析を拡張し, 依存パターンが系統的に異なることを明らかにした。
論文 参考訳(メタデータ) (2025-09-24T15:24:43Z) - Graph Neural Networks for Learning Equivariant Representations of Neural Networks [55.04145324152541]
本稿では,ニューラルネットワークをパラメータの計算グラフとして表現することを提案する。
我々のアプローチは、ニューラルネットワークグラフを多種多様なアーキテクチャでエンコードする単一モデルを可能にする。
本稿では,暗黙的ニューラル表現の分類や編集など,幅広いタスクにおける本手法の有効性を示す。
論文 参考訳(メタデータ) (2024-03-18T18:01:01Z) - DeepDC: Deep Distance Correlation as a Perceptual Image Quality
Evaluator [53.57431705309919]
ImageNet Pre-trained Deep Neural Network (DNN)は、効果的な画像品質評価(IQA)モデルを構築するための顕著な転送性を示す。
我々は,事前学習DNN機能のみに基づく新しいフル参照IQA(FR-IQA)モデルを開発した。
5つの標準IQAデータセット上で,提案した品質モデルの優位性を示すため,包括的実験を行った。
論文 参考訳(メタデータ) (2022-11-09T14:57:27Z) - Prune and distill: similar reformatting of image information along rat
visual cortex and deep neural networks [61.60177890353585]
深部畳み込み神経ネットワーク(CNN)は、脳の機能的類似、視覚野の腹側流の優れたモデルを提供することが示されている。
ここでは、CNNまたは視覚野の内部表現で知られているいくつかの顕著な統計的パターンについて考察する。
我々は、CNNと視覚野が、オブジェクト表現の次元展開/縮小と画像情報の再構成と、同様の密接な関係を持っていることを示す。
論文 参考訳(メタデータ) (2022-05-27T08:06:40Z) - Informative Dropout for Robust Representation Learning: A Shape-bias
Perspective [84.30946377024297]
Informative Dropout (InfoDrop) と呼ばれる軽量モデル非依存の手法を提案し, 解釈性の向上とテクスチャバイアスの低減を図る。
具体的には、画像中の局所的な自己情報に基づいて形状からテクスチャを識別し、Dropoutのようなアルゴリズムを用いて局所的なテクスチャからのモデル出力をデコレーションする。
論文 参考訳(メタデータ) (2020-08-10T16:52:24Z) - Teaching CNNs to mimic Human Visual Cognitive Process & regularise
Texture-Shape bias [18.003188982585737]
コンピュータビジョンにおける最近の実験は、畳み込みニューラルネットワーク(CNN)を用いたモデルにおいて、テクスチャバイアスが最高の結果の主因であることを実証している。
コスト関数は、CNNが欲張りなアプローチを採り、テクスチャのような局所的な情報に対する生産性を向上させ、その結果、グローバルな統計を探索することができないと信じられている。
画像の再構成と分類に形状,テクスチャ,エッジなどの人間の解釈可能な特徴を活用するために,心理学における特徴統合理論から着想を得た,新しい直感的なアーキテクチャであるCognitiveCNNを提案する。
論文 参考訳(メタデータ) (2020-06-25T22:32:54Z) - Texture Interpolation for Probing Visual Perception [4.637185817866918]
テクスチャの深部畳み込みニューラルネットワーク(CNN)活性化の分布は楕円分布によってよく説明されている。
そこで我々は,任意のテクスチャ間を補間する最適な輸送距離を持つ自然測地学を提案する。
本手法は他のCNN手法と比較して,テクスチャ知覚の幾何学とより密に一致しているようである。
論文 参考訳(メタデータ) (2020-06-05T21:28:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。