Fugu-MT 論文翻訳(概要): The Matching Principle: A Geometric Theory of Loss Functions for Nuisance-Robust Representation Learning

論文の概要: The Matching Principle: A Geometric Theory of Loss Functions for Nuisance-Robust Representation Learning

arxiv url: http://arxiv.org/abs/2605.22800v2
Date: Sat, 23 May 2026 08:58:51 GMT
ステータス: 翻訳完了
システム内更新日: 2026-05-26 16:32:38.039871
Title: The Matching Principle: A Geometric Theory of Loss Functions for Nuisance-Robust Representation Learning
Title（参考訳）: マッチング原理:Nuisance-Robust表現学習における損失関数の幾何学的理論
Authors: Vishal Rajput,
Abstract要約: 線形ガウスモデル (Thm.A) における最適性を証明し, 展開のドリフトをゼロにする2次ペナルティに対する範囲被覆の必要性 (Thm.G) を示す。 13ブロック(MLからQwen2.5-7Bまで)のテストは、幾何と展開のドリフトに対する等方性対間違った方向の罰則と一致した。 Sigma_taskを推定し、Sigmaにマッチし、コントロールを実行し、タスクとジオメトリを別々にレポートする。
参考スコア（独自算出の注目度）: 0.5854803320592717
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Robustness, domain adaptation, photometric/occlusion invariance, sensor drift, and alignment style are treated as separate literatures with separate method families. Under label-preserving deployment shift they share one geometric object: the covariance Sigma_task = Cov_{Q_n}(n) of ways inputs can change without changing the label. CORAL, adversarial training, augmentation, metric learning, Jacobian penalties, and alignment constraints are not independent tricks--they are estimators of Sigma_task. Fix that object and the Jacobian penalty is pinned by a matrix Sigma' whose range must cover range(Sigma_task)--the matching principle. We prove optimality in a linear-Gaussian model (Thm. A), necessity of range coverage for any quadratic penalty that zeros deployment drift (Thm. G), and the same dichotomy at global minima (Thm. A*_global). Wrong-direction/signal-aligned controls (Lemma C; Cor. E/E*) and seven estimators (Lemmas D1--D7), plus label-free TDI, yield a falsifiable recipe when Sigma_task must be learned. Thirteen blocks (ML through Qwen2.5-7B) test matched vs isotropic vs wrong-direction penalties on geometry and deployment drift. Twelve match theory where identifiability holds; Office-31 is a named eigengap failure. Partial passes: geometry can improve without every headline task metric moving. A pilot 7B DPO run (one epoch, 240 pairs): matched style-PMH preserves Style TDI where standard DPO degrades it. We do not claim standard training reaches global minima (assumption (O) is open), that estimated Sigma_task is always identifiable, or dominance on every leaderboard. We claim a falsifiable design recipe: estimate Sigma_task, match Sigma', run the controls, report task and geometry separately.
Abstract（参考訳）: ロバストネス、ドメイン適応、測光/隠蔽不変性、センサドリフト、アライメントスタイルは、別々の方法ファミリーを持つ別々の文献として扱われる。ラベル保存配置シフトの下で、彼らは1つの幾何学的対象を共有する: 共分散 Sigma_task = Cov_{Q_n}(n) ラベルを変更することなく入力が変更できる方法。コーラル、逆行訓練、拡張学習、メートル法学習、ヤコビの罰則、アライメント制約は独立したトリックではない。それらはシグマ・タスクの推定者であり、その対象を固定し、ジャコビアン罰は範囲をカバーしなければならない行列シグマによって固定される(シグマ・タスク)。我々は,線形ガウスモデル (Thm.A) における最適性, 展開フローがゼロとなる2次ペナルティ (Thm.G) に対する範囲被覆の必要性, および大域的ミニマ (Thm.A*_global) における同じ二分法 (Thm.A*_global) の必要性を証明した。誤り指向/信号整列制御(Lemma C; Cor. E/E*)と7つの推定因子(Lemmas D1-D7)とラベルのないTDIは、Sigma_taskを学習しなければならないときに偽造可能なレシピを生成する。 13ブロック(MLからQwen2.5-7Bまで)のテストは、幾何と展開のドリフトに対する等方性対間違った方向の罰則と一致した。 Office-31 は固有ギャップ失敗と呼ばれる。部分パス: ジオメトリは、すべてのヘッドラインタスクメトリックを移動せずに改善できる。パイロット7B DPOラン(1エポック、240ペア):標準のDPOが分解したスタイルTDIをマッチしたスタイルPMHで保存する。 Sigma_task が常に識別可能であり、すべてのリーダーボードにおいて支配的であると見積もっている。 Sigma_taskを推定し、Sigmaにマッチし、コントロールを実行し、タスクとジオメトリを別々にレポートする。

関連論文リスト

Matrix-Decoupled Concentration for Autoregressive Sequences: Dimension-Free Guarantees for Sparse Long-Context Rewards [0.36260136172126667]
自己回帰型大規模言語モデルにおけるシーケンスレベル評価のための厳密な集中境界の確立方法を示す。厳密な因果関係の枠組み内で報酬の座標的間隔を保存することにより、長文推論の安定性に対する厳密な数学的正当性を提供する。
論文参考訳（メタデータ） (2026-05-07T11:12:59Z)
Too Correct to Learn: Reinforcement Learning on Saturated Reasoning Data [55.84428098924793]
構造保存探索を行うためのパラメータ自由復号法である Constrained Uniform Top-K Smpling (CUTS) を提案する。グループ内の利点分散を増幅するために、エクスプロイトと探索的なロールアウトを相乗化するためのトレーニングフレームワークであるMixed-CUTSに統合する。特にMixed-CUTSは、AIME25ベンチマークのPass@1の精度を標準のGRPOよりも15.1%向上している。
論文参考訳（メタデータ） (2026-04-20T16:43:28Z)
Overconfident Errors Need Stronger Correction: Asymmetric Confidence Penalties for Reinforcement Learning [17.384089089363382]
既存の手法が見落としている根本原因を同定する。現在のアプローチでは、グループ内のすべての誤ったロールアウトを同一に扱う。非対称信頼度を考慮した誤り罰(ACE)を提案する。
論文参考訳（メタデータ） (2026-02-24T22:46:43Z)
Stability and Generalization of Push-Sum Based Decentralized Optimization over Directed Graphs [55.77845440440496]
プッシュベースの分散通信は、情報交換が非対称である可能性のある通信ネットワークの最適化を可能にする。我々は、グラディエント・プッシュ(SGP)アルゴリズムのための統一的な一様安定性フレームワークを開発する。重要な技術的要素は、2つの量に束縛された不均衡認識の一般化である。
論文参考訳（メタデータ） (2026-02-24T05:32:03Z)
The Emergence of Lab-Driven Alignment Signatures: A Psychometric Framework for Auditing Latent Bias and Compounding Risk in Generative AI [0.0]
本稿では,不確実性の下での潜在特性推定を定量化する新しい監査フレームワークを提案する。この研究は最適化バイアス、Sycophancy、Status-Quo Legitimizationを含む9つの次元にわたる主要なモデルを監査している。
論文参考訳（メタデータ） (2026-02-19T06:56:01Z)
The Procrustean Bed of Time Series: The Optimization Bias of Point-wise Loss [53.542743390809356]
本稿では,最適化バイアス(EOB)の期待に関する第一原理解析を提案する。時間列が決定論的で構造化されるほど、ポイントワイドの損失関数によるバイアスがより厳しくなる。本稿では,DFTとDWTの両原理を同時に実現する具体的ソリューションを提案する。
論文参考訳（メタデータ） (2025-12-21T06:08:22Z)
Ordinal Label-Distribution Learning with Constrained Asymmetric Priors for Imbalanced Retinal Grading [9.147336466586017]
糖尿病網膜症は、本質的には順序性で長い尾を持つ。制約付き非対称先行ワッサースタインオートエンコーダ(CAP-WAE)を提案する。 CAP-WAEは、最先端の4重み付きカッパ、精度、マクロF1を一貫して達成する。
論文参考訳（メタデータ） (2025-09-30T11:58:49Z)
Towards Self-Supervised Covariance Estimation in Deep Heteroscedastic Regression [102.24287051757469]
深部異方性回帰における自己教師付き共分散推定について検討する。正規分布の間の2-ワッサーシュタイン距離の上界を導出する。幅広い合成データセットと実データセットに対する実験により、提案された2-ワッサーシュタインと擬似ラベルアノテーションが結合した結果、計算的に安価で正確な深部ヘテロ代用回帰が導かれることが示された。
論文参考訳（メタデータ） (2025-02-14T22:37:11Z)
Benign Overfitting of Constant-Stepsize SGD for Linear Regression [122.70478935214128]
帰納バイアスは経験的に過剰フィットを防げる中心的存在ですこの研究は、この問題を最も基本的な設定として考慮している: 線形回帰に対する定数ステップサイズ SGD。我々は、(正規化されていない)SGDで得られるアルゴリズム正則化と、通常の最小二乗よりも多くの顕著な違いを反映する。
論文参考訳（メタデータ） (2021-03-23T17:15:53Z)
A Unified Joint Maximum Mean Discrepancy for Domain Adaptation [73.44809425486767]
本論文は,最適化が容易なjmmdの統一形式を理論的に導出する。統合JMMDから、JMMDは分類に有利な特徴ラベル依存を低下させることを示す。本稿では,その依存を促進する新たなmmd行列を提案し,ラベル分布シフトにロバストな新しいラベルカーネルを考案する。
論文参考訳（メタデータ） (2021-01-25T09:46:14Z)
Unifying supervised learning and VAEs -- coverage, systematics and goodness-of-fit in normalizing-flow based neural network models for astro-particle reconstructions [0.0]
統計的不確実性、包括性、体系的不確実性、あるいは適度な尺度はしばしば計算されない。データとラベルの共分散のKL分割の目的は、教師付き学習と変分オートエンコーダの統合を可能にすることを示す。本稿では,特定の「基本順序」輪郭の数値積分を伴わずにカバレッジ確率を計算する方法について論じる。
論文参考訳（メタデータ） (2020-08-13T11:28:57Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。