論文の概要: Separating Shortcut Transition from Cross-Family OOD Failure in a Minimal Model
- arxiv url: http://arxiv.org/abs/2605.12945v1
- Date: Wed, 13 May 2026 03:28:37 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-14 23:30:27.786661
- Title: Separating Shortcut Transition from Cross-Family OOD Failure in a Minimal Model
- Title(参考訳): 最小モデルにおけるOOD故障からのショートカット遷移の分離
- Authors: Hongmin Li,
- Abstract要約: ショートカット機能は、アウト・オブ・ディストリビューション(OOD)障害を説明するためにしばしば呼び出されるが、トレーニングの相関、学習されたショートカットの使用、テスト時の失敗は一致しない。
1つの不変座標と1つの家族依存的ショートカット座標を持つ最小二項モデルについて検討する。
- 参考スコア(独自算出の注目度): 0.9805949492148788
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Shortcut features are often invoked to explain out-of-distribution (OOD) failure, but training correlation, learned shortcut use, and test-time failure need not coincide. We study a minimal binary model with one invariant coordinate and one family-dependent shortcut coordinate. In the deterministic regime, positive average shortcut correlation pulls logistic ERM toward positive shortcut weight, but ridge regularization keeps the classifier invariant-dominated and prevents deterministic OOD failure. When the invariant coordinate is noisy, ridge-logistic ERM switches to the shortcut rule once the training shortcut signal exceeds the invariant signal. Whether that transition causes failure depends on the held-out family: weaker shortcut correlation yields positive excess risk, and sign-flipped families yield above-chance error. Synthetic checks match these analytic regimes and show that the same training-side transition can have different held-out consequences. The model separates shortcut attraction, shortcut-rule transition, and cross-family OOD failure.
- Abstract(参考訳): ショートカット機能は、アウト・オブ・ディストリビューション(OOD)障害を説明するためにしばしば呼び出されるが、トレーニングの相関、学習されたショートカットの使用、テスト時の失敗は一致しない。
1つの不変座標と1つの家族依存的ショートカット座標を持つ最小二項モデルについて検討する。
決定論的状態においては、正の平均的ショートカット相関はロジスティックERMを正のショートカット重みに引き上げるが、リッジ正規化は分類器を不変に支配し、決定論的OOD失敗を防ぐ。
不変座標がノイズの多い場合、リッジロジスティックERMは、トレーニングショートカット信号が不変信号を超えるとショートカット規則に切り替える。
遷移が失敗を引き起こすかどうかは持たないファミリーに依存し、より弱いショートカット相関は正の過剰リスクをもたらし、サインフリップされたファミリーはオーバーチャンスエラーをもたらす。
合成チェックは、これらの分析体制と一致し、同じトレーニング側の遷移が異なる持続的な結果をもたらすことを示す。
このモデルはショートカットアトラクション、ショートカットルル遷移、家族間のOOD障害を分離する。
関連論文リスト
- Models Know Their Shortcuts: Deployment-Time Shortcut Mitigation [5.949467977832433]
Shortcut Guardrailは、オリジナルのトレーニングデータやショートカットアノテーションにアクセスせずに、トークンレベルのショートカットを緩和する。
ショートカットガードレールは、分布シフト中の未緩和モデルよりも全体的な精度と最悪のグループ精度を向上させる。
論文 参考訳(メタデータ) (2026-04-14T04:43:29Z) - Mitigating Shortcut Reasoning in Language Models: A Gradient-Aware Training Approach [31.233459232809608]
Shortcut-Aware Reasoning Training (SART)は、ショートカットプロモーションサンプルを検出し緩和する勾配対応フレームワークである。
本手法は, 評価目標と解答点濃度を併用して, 勾配補正によるショートカット信号の同定を行う。
論文 参考訳(メタデータ) (2026-03-21T18:17:17Z) - Norm-Hierarchy Transitions in Representation Learning: When and Why Neural Networks Abandon Shortcuts [0.0]
遅延表現学習を説明するNorm-Hierarchy Transition (NHT) フレームワークを紹介する。
我々は、遷移遅延がショートカットと構造化ノルムの比で対数的に増加することを示す厳密な境界を導出する。
論文 参考訳(メタデータ) (2026-03-07T20:07:16Z) - TopoCurate:Modeling Interaction Topology for Tool-Use Agent Training [53.93696896939915]
訓練用ツール使用エージェントは一般的に、パスレート選択されたタスクに対して、軌道変更の成功と強化学習(RL)に依存している。
TopoCurateは,同一タスクから多段階的なロールアウトを統一的な意味的商トポロジに投影する対話型フレームワークである。
TopoCurateは最先端のベースラインに対して4.2%(SFT)と6.9%(RL)という一貫したゲインを達成している。
論文 参考訳(メタデータ) (2026-03-02T10:38:54Z) - CARE What Fails: Contrastive Anchored-REflection for Verifiable Multimodal [84.71254539482369]
検証可能な報酬を伴うグループ相対的強化学習(RLVR)は、しばしば、すでに失敗している最も情報に富むデータを浪費する。
エラーを監督するマルチモーダル推論のための,障害中心のポストトレーニングフレームワークであるCAREを提案する。
CAREは正確さを改善し、スムーズさをトレーニングすると同時に、障害からの学習信号のシェアを明示的に増やします。
論文 参考訳(メタデータ) (2025-12-22T16:34:21Z) - Shortcut Invariance: Targeted Jacobian Regularization in Disentangled Latent Space [7.8904984750896885]
ディープニューラルネットワークはショートカットを学習しやすく、刺激的で容易に学習できる相関関係を持つ。
ショートカット信号に機能的に不変な分類器を簡易かつ効果的に描画する手法を提案する。
我々はこれを対象のヤコビ正規化として分析し、分類器は急激な特徴を無視し、より複雑なコアセマンティック信号に依存するように強制する。
論文 参考訳(メタデータ) (2025-11-24T07:09:08Z) - Rethinking Classifier Re-Training in Long-Tailed Recognition: A Simple
Logits Retargeting Approach [102.0769560460338]
我々は,クラスごとのサンプル数に関する事前知識を必要とせず,シンプルなロジットアプローチ(LORT)を開発した。
提案手法は,CIFAR100-LT, ImageNet-LT, iNaturalist 2018など,様々な不均衡データセットの最先端性能を実現する。
論文 参考訳(メタデータ) (2024-03-01T03:27:08Z) - Don't blame Dataset Shift! Shortcut Learning due to Gradients and Cross
Entropy [22.69591517487717]
マージンを最大化するためのデフォルトERMの好みは、安定機能よりもショートカットに依存するモデルにつながることを示す。
我々は、マージン制御(MARG-CTRL)と呼ばれる一様マージン解を促進する損失関数を開発する。
論文 参考訳(メタデータ) (2023-08-24T04:39:25Z) - Open Set Relation Extraction via Unknown-Aware Training [72.10462476890784]
負のインスタンスを動的に合成することでモデルを正規化する未知の学習手法を提案する。
テキストの敵対的攻撃に触発されて、我々は適応的に、小さいが重要な摂動を元のトレーニングインスタンスに適用する。
実験結果から, 既知の関係の分類を損なうことなく, 未知の関係検出を行うことができた。
論文 参考訳(メタデータ) (2023-06-08T05:45:25Z) - Software mitigation of coherent two-qubit gate errors [55.878249096379804]
2量子ゲートは量子コンピューティングの重要な構成要素である。
しかし、量子ビット間の不要な相互作用(いわゆる寄生ゲート)は、量子アプリケーションの性能を低下させる。
寄生性2ビットゲート誤差を軽減するための2つのソフトウェア手法を提案する。
論文 参考訳(メタデータ) (2021-11-08T17:37:27Z) - Causally-motivated Shortcut Removal Using Auxiliary Labels [63.686580185674195]
このようなリスク不変予測器の学習に重要な課題はショートカット学習である。
この課題に対処するために、フレキシブルで因果的なアプローチを提案する。
この因果的動機付けされた正規化スキームが堅牢な予測子を生み出すことを理論的および実証的に示す。
論文 参考訳(メタデータ) (2021-05-13T16:58:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。