論文の概要: Quantifying and Inducing Shape Bias in CNNs via Max-Pool Dilation
- arxiv url: http://arxiv.org/abs/2601.05599v1
- Date: Fri, 09 Jan 2026 07:36:29 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-12 17:41:49.897277
- Title: Quantifying and Inducing Shape Bias in CNNs via Max-Pool Dilation
- Title(参考訳): 最大プールダイレーションによるCNNの形状バイアスの定量化と誘導
- Authors: Takito Sawada, Akinori Iwata, Masahiro Okuda,
- Abstract要約: 畳み込みニューラルネットワーク(CNN)は強いテクスチャバイアスを示し、グローバルな形状情報よりも局所的なパターンを好むことが知られている。
構造類似度指数(SSIM)の計算によりデータセットの形状・テクスチャバランスを定量化するデータ駆動計量を提案する。
本稿では,畳み込み重みを凍結したまま最大プール演算のディレーションを変更することにより,形状バイアスを促進する計算効率のよい適応法を提案する。
- 参考スコア(独自算出の注目度): 0.9176056742068813
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Convolutional Neural Networks (CNNs) are known to exhibit a strong texture bias, favoring local patterns over global shape information--a tendency inherent to their convolutional architecture. While this bias is beneficial for texture-rich natural images, it often degrades performance on shape-dominant data such as illustrations and sketches. Although prior work has proposed shape-biased models to mitigate this issue, these approaches lack a quantitative metric for identifying which datasets would actually benefit from such modifications. To address this gap, we propose a data-driven metric that quantifies the shape-texture balance of a dataset by computing the Structural Similarity Index (SSIM) between each image's luminance channel and its L0-smoothed counterpart. Building on this metric, we further introduce a computationally efficient adaptation method that promotes shape bias by modifying the dilation of max-pooling operations while keeping convolutional weights frozen. Experimental results show that this approach consistently improves classification accuracy on shape-dominant datasets, particularly in low-data regimes where full fine-tuning is impractical, requiring training only the final classification layer.
- Abstract(参考訳): 畳み込みニューラルネットワーク(CNN)は強いテクスチャバイアスを示し、グローバルな形状情報よりも局所的なパターンを好むことが知られている。
このバイアスはテクスチャに富んだ自然画像には有益であるが、イラストやスケッチのような形状に支配的なデータの性能を低下させることが多い。
これまでの研究では、この問題を緩和するための形状バイアスモデルが提案されていたが、これらのアプローチでは、どのデータセットが実際にそのような修正の恩恵を受けるかを特定するための定量的な指標が欠如している。
このギャップに対処するために、各画像の輝度チャネルとL0平滑化チャネルとの間の構造類似度指数(SSIM)を計算することにより、データセットの形状・テクスチャバランスを定量化するデータ駆動メトリックを提案する。
この指標に基づいて,最大プール演算のディレーションを変更しつつ,畳み込み重みを凍結したままにすることで,形状バイアスを促進する計算効率の良い適応法も導入する。
実験結果から,本手法は形状に支配的なデータセットの分類精度を一貫して向上させ,特に完全な微調整が不可能な低データ方式では最終分類層のみを訓練する必要があることがわかった。
関連論文リスト
- Nonparametric Data Attribution for Diffusion Models [57.820618036556084]
生成モデルのデータ属性は、個々のトレーニング例がモデル出力に与える影響を定量化する。
生成画像とトレーニング画像のパッチレベルの類似性によって影響を測定する非パラメトリック属性法を提案する。
論文 参考訳(メタデータ) (2025-10-16T03:37:16Z) - GratNet: A Photorealistic Neural Shader for Diffractive Surfaces [0.0]
回折面のデータ駆動レンダリングのための多層パーセプトロン (MLP) を用いた手法を提案する。
我々は,Pak-Signal-to-Noise (PSNR), Structure similarity Index Measure (SSIM) と flipping difference Evaluator (FLIP) を評価指標として,地上構造の高品質な再構築を実証した。
論文 参考訳(メタデータ) (2025-06-18T18:58:00Z) - Mean flow data assimilation using physics-constrained Graph Neural Networks [0.0]
本研究では,グラフニューラルネットワーク(GNN)と最適化手法を統合し,平均流路復元の精度を高める新しいデータ同化手法を提案する。
GNNフレームワークは非構造化データを扱うのに適しており、計算流体力学(CFD)で遭遇する複雑な測地に共通している。
その結果,データ駆動モデルに類似するモデルと比較して,訓練データに制限がある場合でも,平均フロー再構成の精度は著しく向上した。
論文 参考訳(メタデータ) (2024-11-14T14:31:52Z) - Distance Weighted Trans Network for Image Completion [52.318730994423106]
本稿では,DWT(Distance-based Weighted Transformer)を利用した画像コンポーネント間の関係をよりよく理解するためのアーキテクチャを提案する。
CNNは、粗い事前の局所的なテクスチャ情報を強化するために使用される。
DWTブロックは、特定の粗いテクスチャやコヒーレントな視覚構造を復元するために使用される。
論文 参考訳(メタデータ) (2023-10-11T12:46:11Z) - Minimizing the Accumulated Trajectory Error to Improve Dataset
Distillation [151.70234052015948]
本稿では,フラットな軌道を求める最適化アルゴリズムを提案する。
合成データに基づいてトレーニングされた重みは、平坦な軌道への正規化を伴う累積誤差摂動に対して頑健であることを示す。
本手法はFTD (Flat Trajectory Distillation) と呼ばれ, 勾配整合法の性能を最大4.7%向上させる。
論文 参考訳(メタデータ) (2022-11-20T15:49:11Z) - Neural Jacobian Fields: Learning Intrinsic Mappings of Arbitrary Meshes [38.157373733083894]
本稿では,ニューラルネットワークによる任意のメッシュの断片的線形マッピングを正確に予測するフレームワークを提案する。
このフレームワークは、グローバルな形状記述子に条件付けされた単一点の行列の予測に神経的な側面を還元することに基づいている。
個々のメッシュの固有の勾配領域で操作することで、フレームワークは高度に正確なマッピングを予測できる。
論文 参考訳(メタデータ) (2022-05-05T19:51:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。