論文の概要: Low-Frequency Shortcuts in Texture-Driven Visual Learning
- arxiv url: http://arxiv.org/abs/2606.03493v1
- Date: Tue, 02 Jun 2026 11:11:20 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-03 22:00:04.95658
- Title: Low-Frequency Shortcuts in Texture-Driven Visual Learning
- Title(参考訳): テクスチャ駆動型ビジュアルラーニングにおける低周波ショートカット
- Authors: Utku Şirin, Cathy Hou, David Alvarez-Melis, Stratos Idreos,
- Abstract要約: テクスチャ駆動ドメインに対するショートカット学習分析を提案する。
テクスチャ駆動型ドメインは低周波ショートカットに悩まされている。
低周波のショートカットは、OODの腐敗に対して非常に脆弱であることを示す。
- 参考スコア(独自算出の注目度): 9.533535844742845
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Neural networks suffer from shortcut learning, where learned features generalize well to the training set but not to in-distribution (ID) or out-of-distribution (OOD) test sets. Existing studies are all based on a few standard benchmarks, which are shape-driven. Numerous application domains, however, are texture-driven. In this work, we present shortcut learning analysis for texture-driven domains, and compare it with that of a standard benchmark. We show that texture-driven domains suffer from low-frequency shortcuts. They make the majority of their decisions based on a few low-frequency components (LFCs) with a skewed spectral behavior, despite that their classification information is in higher-frequency, fine-grained details. Pruning LFCs from training and test sets eliminates the shortcut and provides a more balanced spectral behavior, improving the ID accuracy by up to 8%. We show that low-frequency shortcuts make the models highly vulnerable to OOD corruptions, leading up to 70% accuracy drop compared to the ID accuracy. Pruning LFCs significantly improves robustness to low-frequency corruptions, by up to 40%, and introduces a trade-off for high-frequency corruptions; the balanced spectral behavior provides a better generalization performance, whereas the increased dependence on high-frequency features reduces it. OOD accuracy depends on the interaction between these two factors.
- Abstract(参考訳): ニューラルネットワークはショートカット学習に苦しむが、学習機能はトレーニングセットによく当てはまるが、分布内(ID)や分布外(OOD)テストセットには適用されない。
既存の研究はすべて、形状駆動のいくつかの標準ベンチマークに基づいている。
しかし、多くのアプリケーションドメインはテクスチャ駆動である。
本研究では,テクスチャ駆動型ドメインのショートカット学習分析を行い,標準ベンチマークと比較する。
テクスチャ駆動型ドメインは低周波ショートカットに悩まされている。
彼らは、分類情報が高頻度できめ細かな詳細であるにもかかわらず、歪んだスペクトル挙動を持ついくつかの低周波成分(LFC)に基づいて決定する。
トレーニングとテストセットからLFCを抽出することはショートカットを排除し、よりバランスの取れたスペクトル挙動を提供し、IDの精度を最大8%向上させる。
我々は,低周波ショートカットにより,OODの破損に対して極めて脆弱なモデルとなり,ID精度と比較して70%の精度低下が生じることを示した。
プルーニングLFCは、低周波汚損に対するロバスト性を最大40%向上させ、高周波汚損に対するトレードオフを導入する。
OODの精度はこれらの2つの要因間の相互作用に依存する。
関連論文リスト
- SCATR: Simple Calibrated Test-Time Ranking [22.43743012588733]
テストタイムスケーリング(TTS)は、推論時にさらなる計算を割り当てることで、大きな言語モデル(LLM)を改善する。
ベースモデルからの隠れ表現を用いて,小さなキャリブレーションセットから軽量スコアラーを学習する,シンプルで効率的なベストオブNランキング手法であるSCATRを導入する。
論文 参考訳(メタデータ) (2026-04-16T20:16:20Z) - Self-Supervised Learning via Flow-Guided Neural Operator on Time-Series Data [57.85958428020496]
Flow-Guided Neural Operator (FGNO)は、演算子学習とフローマッチングを組み合わせた新しいフレームワークである。
FGNOは、短時間フーリエ変換を用いて関数空間のマッピングを学習し、異なる時間分解能を統一する。
推論中にノイズのある入力を使用する以前の生成SSL法とは異なり、ノイズのある表現を学習しながら、クリーンな入力を用いて表現抽出を行う。
論文 参考訳(メタデータ) (2026-02-12T18:54:57Z) - Knowledge Regularized Negative Feature Tuning of Vision-Language Models for Out-of-Distribution Detection [54.433899174017185]
信頼性の高い機械学習モデルを構築するには、アウト・オブ・ディストリビューション(OOD)検出が不可欠である。
我々はKR-NFT(Knowledge Regularized Negative Feature Tuning)と呼ばれる新しい手法を提案する。
NFTは、事前訓練されたテキスト特徴に分布認識変換を適用し、正および負の特徴を異なる空間に効果的に分離する。
ImageNetデータセットから数発のサンプルをトレーニングすると、KR-NFTはID分類精度とOOD検出を改善するだけでなく、FPR95を5.44%削減する。
論文 参考訳(メタデータ) (2025-07-26T07:44:04Z) - Efficient Continual Learning through Frequency Decomposition and Integration [25.016256446470948]
本稿では周波数分割統合ネットワーク(FDINet)を提案する。
実験では、FDINetはバックボーンパラメータを78%削減し、最先端(SOTA)メソッドよりも7.49%精度を向上し、ピークメモリ使用量を80%削減している。
論文 参考訳(メタデータ) (2025-03-28T06:36:33Z) - What do neural networks learn in image classification? A frequency
shortcut perspective [3.9858496473361402]
本研究では,ニューラルネットワーク(NN)における周波数ショートカットの学習力学を実験的に研究する。
NNは、分類のための単純な解を見つける傾向があり、訓練中に最初に何を学ぶかは、最も特徴的な周波数特性に依存する。
本稿では,クラスワイズ周波数特性を測定するための指標と,周波数ショートカットの同定方法を提案する。
論文 参考訳(メタデータ) (2023-07-19T08:34:25Z) - Can pruning improve certified robustness of neural networks? [106.03070538582222]
ニューラルネット・プルーニングはディープ・ニューラル・ネットワーク(NN)の実証的ロバスト性を向上させることができることを示す。
実験の結果,NNを適切に刈り取ることで,その精度を8.2%まで向上させることができることがわかった。
さらに,認証された宝くじの存在が,従来の密集モデルの標準および認証された堅牢な精度に一致することを観察する。
論文 参考訳(メタデータ) (2022-06-15T05:48:51Z) - Generalizing Face Forgery Detection with High-frequency Features [63.33397573649408]
現在のCNNベースの検出器は、メソッド固有の色テクスチャに過度に適合するため、一般化に失敗する傾向にある。
フェースフォージェリ検出に高周波雑音を用いることを提案する。
1つは、複数のスケールで高周波ノイズを抽出するマルチスケールの高周波特徴抽出モジュールである。
2つ目は、低レベルRGB特徴抽出器を導く残差誘導空間注意モジュールで、新しい視点からフォージェリートレースにもっと集中する。
論文 参考訳(メタデータ) (2021-03-23T08:19:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。