論文の概要: Understanding Generalization through Decision Pattern Shift
- arxiv url: http://arxiv.org/abs/2605.13148v1
- Date: Wed, 13 May 2026 08:14:59 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-14 23:30:27.898778
- Title: Understanding Generalization through Decision Pattern Shift
- Title(参考訳): 決定パターンシフトによる一般化の理解
- Authors: Huiqi Deng, Yibo Li, Quanshi Zhang, Peng Zhang, Hongbin Pei, Xia Hu,
- Abstract要約: 決定パターンシフト(DPS)は、内部決定パターンの安定性を通じて一般化を定義する新しい視点である。
DPSは、トレーニング中に学んだものとの差分として、障害を定量化する。
これらの知見は,早期の一般化リスク検出,障害モード診断,チャネルレベルの欠陥局在の新たな可能性を開く。
- 参考スコア(独自算出の注目度): 46.36674063889302
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Understanding why deep neural networks (DNNs) fail to generalize to unseen samples remains a long-standing challenge. Existing studies mainly examine changes in externally observable factors such as data, representations, or outputs, yet offer limited insight into how a model's internal decision mechanism evolves from training to test. To address this gap, we introduce Decision Pattern Shift (DPS), a new perspective that defines generalization through the stability of internal decision patterns and quantifies failure as their deviation from those learned during training. Specifically, we represent each sample's decision pattern as a GradCAM-based channel-contribution vector, which captures how feature channels collectively support a prediction, and we propose the DPS metric to measure its discrepancy from the class-average pattern. Empirical analyses across multiple datasets and architectures show that, (i) decision patterns form a highly structured, class-consistent space with strong intra-class cohesion and low inter-class confusion, enabling direct analysis of a model's decision logic; (ii) the DPS magnitude correlates linearly with the generalization gap (nearly all Pearson r > 0.8), revealing generalization as a systematic drift in the model's internal decision mechanism; (iii) the DPS spectrum organizes diverse generalization degradation scenarios (covering ideal generalization, in-distribution degradation, domain shift, out-of-distribution, and shortcut learning) into a continuous trajectory, providing a unified explanation of their failure modes. These findings open up new possibilities for early generalization-risk detection, failure-mode diagnosis, and channel-level defect localization.
- Abstract(参考訳): ディープニューラルネットワーク(DNN)が未知のサンプルに一般化できない理由を理解することは、長年にわたる課題である。
既存の研究では、データ、表現、出力などの外部観測可能な要素の変化を主に調べているが、モデルの内部決定機構がトレーニングからテストまでどのように進化するかについての限られた洞察を与えている。
このギャップに対処するために、内的決定パターンの安定性による一般化を定義し、トレーニング中に学んだものとの差分として失敗を定量化する新しい視点であるDPS(Decision Pattern Shift)を導入する。
具体的には,各サンプルの判断パターンをGradCAMに基づくチャネル寄与ベクトルとして表現し,特徴チャネルが予測を総合的にサポートする様子を捉える。
複数のデータセットとアーキテクチャにまたがる経験的分析は、それを示しています。
(i)決定パターンは、強いクラス内凝集と低いクラス間混乱を有する高度に構造化されたクラス一貫性空間を形成し、モデルの決定論理を直接解析することができる。
(II) DPS の大きさは一般化ギャップ(ほぼすべてのピアソン r > 0.8)と線形に相関し、モデルの内部決定機構における体系的なドリフトとしての一般化を明らかにする。
3) DPSスペクトルは, 様々な一般化分解シナリオ(理想的な一般化, 分布内分解, ドメインシフト, 分布外分布, ショートカット学習)を連続的な軌道に整理し, 障害モードの統一的な説明を提供する。
これらの知見は,早期の一般化リスク検出,障害モード診断,チャネルレベルの欠陥局在の新たな可能性を開く。
関連論文リスト
- Learning to Trim: End-to-End Causal Graph Pruning with Dynamic Anatomical Feature Banks for Medical VQA [27.877350391080693]
本稿では,因果プルーニングとエンドツーエンド最適化を統合したLearningable Causal Trimming (LCT) フレームワークを提案する。
運動機構によって更新された動的解剖特徴銀行(DAFB)を導入し,頻繁な解剖学的および言語学的パターンのグローバルプロトタイプをキャプチャする。
VQA-RAD、SLAKE、SLAKE-CP、PathVQAの実験は、LCTが既存のデバイアス対策よりも頑健さと一般化を一貫して改善することを示した。
論文 参考訳(メタデータ) (2026-03-27T02:57:39Z) - Generalization Analysis and Method for Domain Generalization for a Family of Recurrent Neural Networks [11.316438734182931]
本稿では,リカレントニューラルネットワーク群(RNN)の解釈可能性とドメイン外一般化(OOD)を解析する手法を提案する。
具体的には、訓練されたRNN状態の進化を、未知の離散時間非線形閉ループフィードバックシステムとしてモデル化する。
OOD一般化誤差を低減し、分散シフトに対するロバスト性を改善するドメイン一般化法を提案する。
論文 参考訳(メタデータ) (2026-01-13T01:27:10Z) - Learning Time-Aware Causal Representation for Model Generalization in Evolving Domains [50.66049136093248]
動的因果要因と因果機構のドリフトを組み込んだ時間認識型構造因果モデル(SCM)を開発した。
本研究では,時間領域毎に最適な因果予測値が得られることを示す。
合成と実世界の両方のデータセットの結果から,SynCは時間的一般化性能に優れることが示された。
論文 参考訳(メタデータ) (2025-06-21T14:05:37Z) - Learning Divergence Fields for Shift-Robust Graph Representations [73.11818515795761]
本研究では,相互依存データに対する問題に対して,学習可能な分散場を持つ幾何学的拡散モデルを提案する。
因果推論によって新たな学習目標が導出され、ドメイン間で無神経な相互依存の一般化可能なパターンを学習するためのモデルが導出される。
論文 参考訳(メタデータ) (2024-06-07T14:29:21Z) - GEC: A Unified Framework for Interactive Decision Making in MDP, POMDP,
and Beyond [101.5329678997916]
対話型意思決定の一般的な枠組みの下で, サンプル高能率強化学習(RL)について検討した。
本稿では,探索とエクスプロイトの基本的なトレードオフを特徴付ける,新しい複雑性尺度である一般化エルダー係数(GEC)を提案する。
低 GEC の RL 問題は非常にリッチなクラスであり、これは低ベルマン楕円体次元問題、双線型クラス、低証人ランク問題、PO-双線型クラス、一般化正規PSR を仮定する。
論文 参考訳(メタデータ) (2022-11-03T16:42:40Z) - TsmoBN: Interventional Generalization for Unseen Clients in Federated
Learning [23.519212374186232]
本研究では,分散学習パラダイムにおけるモデル一般化の課題を説明するために,学習構造因果モデル(SCM)を構築した。
FLモデルをテストクライアントに一般化するために,テスト固有および運動量追跡バッチ正規化(TsmoBN)を用いた簡易かつ効果的な手法を提案する。
論文 参考訳(メタデータ) (2021-10-19T13:46:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。