論文の概要: General and Estimable Learning Bound Unifying Covariate and Concept Shifts
- arxiv url: http://arxiv.org/abs/2506.12829v1
- Date: Sun, 15 Jun 2025 12:18:05 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-17 17:28:46.986299
- Title: General and Estimable Learning Bound Unifying Covariate and Concept Shifts
- Title(参考訳): 共変量と概念シフトを統一する汎用的・最適学習境界
- Authors: Hongbo Chen, Li Charlie Xia,
- Abstract要約: 我々は、広い損失関数、ラベル空間、ラベル付けに適用される新しい統一誤差境界を開発することにより、理論と実践的応用のギャップを埋める。
また,ほとんどの分散シフトにおけるエラー境界を定量化するアルゴリズムを開発し,分散シフト下での学習エラーを分析するための厳密で汎用的なツールを開発した。
- 参考スコア(独自算出の注目度): 1.1077154107564848
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Generalization under distribution shift remains a core challenge in modern machine learning, yet existing learning bound theory is limited to narrow, idealized settings and is non-estimable from samples. In this paper, we bridge the gap between theory and practical applications. We first show that existing bounds become loose and non-estimable because their concept shift definition breaks when the source and target supports mismatch. Leveraging entropic optimal transport, we propose new support-agnostic definitions for covariate and concept shifts, and derive a novel unified error bound that applies to broad loss functions, label spaces, and stochastic labeling. We further develop estimators for these shifts with concentration guarantees, and the DataShifts algorithm, which can quantify distribution shifts and estimate the error bound in most applications -- a rigorous and general tool for analyzing learning error under distribution shift.
- Abstract(参考訳): 分散シフトの下での一般化は、現代の機械学習における中核的な課題であり続けているが、既存の学習境界理論は狭く理想化された設定に限られており、サンプルからは推定できない。
本稿では,理論と実用化のギャップを埋める。
まず、ソースとターゲットがミスマッチをサポートするときに、その概念シフト定義が壊れるため、既存のバウンダリがゆるく、推定不可能になることを示す。
エントロピー最適輸送を活用することで、共変量および概念シフトに対するサポート非依存の新たな定義を提案し、広い損失関数、ラベル空間、確率ラベリングに適用可能な新しい統一誤差境界を導出する。
さらに、濃度保証を伴うこれらのシフトの予測器を開発し、分散シフトを定量化し、ほとんどのアプリケーションで拘束されるエラーを推定するDataShiftsアルゴリズム(分散シフト下での学習エラーを分析するための厳密で一般的なツール)を開発します。
関連論文リスト
- Navigating Semantic Drift in Task-Agnostic Class-Incremental Learning [51.177789437682954]
クラスインクリメンタルラーニング(Class-incremental Learning, CIL)は、モデルが学習したクラスの知識を維持しつつ、新しいクラスを逐次学習できるようにすることを目的とする。
柔軟性と安定性のバランスをとることは、特にタスクIDが不明な場合には、依然として大きな課題である。
本研究では,平均シフト補償と共分散校正を組み合わせたセマンティックドリフト校正法を提案する。
論文 参考訳(メタデータ) (2025-02-11T13:57:30Z) - Towards Understanding Extrapolation: a Causal Lens [53.15488984371969]
我々は、外挿がいつ可能かを理論的に理解し、それを実現するための原則的な方法を提供する。
この定式化の下では、外挿問題を潜在変数識別問題にキャストする。
この理論は、基礎となる多様体の滑らかさとシフト特性の間の複雑な相互作用を明らかにする。
論文 参考訳(メタデータ) (2025-01-15T21:29:29Z) - When Invariant Representation Learning Meets Label Shift: Insufficiency and Theoretical Insights [16.72787996847537]
一般化ラベルシフト(GLS)は、シフト内の複雑な要因に対処する大きな可能性を示す最新の開発である。
主な結果は、不変表現学習が不十分であることを示し、一般化のためのGLS補正が不十分であること、および必要であることを証明した。
本稿では,カーネル埋め込みに基づく補正アルゴリズム(KECA)を提案する。
論文 参考訳(メタデータ) (2024-06-24T12:47:21Z) - Harnessing the Power of Vicinity-Informed Analysis for Classification under Covariate Shift [9.530897053573186]
本稿では,周辺情報,すなわちデータポイントの局所的構造を利用した新しい異種性尺度を提案する。
提案手法を用いて過大な誤差を特徴付けるとともに,従来の手法と比較して高速あるいは競合的な収束率を示す。
論文 参考訳(メタデータ) (2024-05-27T07:55:27Z) - Generalized Schrödinger Bridge Matching [54.171931505066]
一般化Schr"odinger Bridge (GSB) 問題設定は、機械学習の内外を問わず、多くの科学領域で一般的である。
我々は最近の進歩に触発された新しいマッチングアルゴリズムである一般化シュリンガーブリッジマッチング(GSBM)を提案する。
このような一般化は条件最適制御の解法として、変分近似を用いることができることを示す。
論文 参考訳(メタデータ) (2023-10-03T17:42:11Z) - Fairness Transferability Subject to Bounded Distribution Shift [5.62716254065607]
あるソース分布に「フェア」なアルゴリズム予測器が与えられたとしても、あるバウンダリ内のソースと異なる未知のターゲット分布上では、まだフェアなのか?
本研究では,有界分布シフトを考慮した機械学習予測器の統計的グループフェアネスの伝達可能性について検討する。
論文 参考訳(メタデータ) (2022-05-31T22:16:44Z) - An Information-theoretical Approach to Semi-supervised Learning under
Covariate-shift [24.061858945664856]
半教師あり学習における一般的な前提は、ラベル付き、ラベルなし、テストデータが同じ分布から引き出されることである。
本稿では,この問題に対処可能な半教師付き学習アルゴリズムを提案する。
また,このフレームワークはエントロピーの最小化や擬似ラベル付けなど,一般的な手法を復元する。
論文 参考訳(メタデータ) (2022-02-24T14:25:14Z) - Learning Invariant Representations and Risks for Semi-supervised Domain
Adaptation [109.73983088432364]
半教師付きドメイン適応(Semi-DA)の設定の下で不変表現とリスクを同時に学習することを目的とした最初の手法を提案する。
共同で textbfLearning textbfInvariant textbfRepresentations と textbfRisks の LIRR アルゴリズムを導入する。
論文 参考訳(メタデータ) (2020-10-09T15:42:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。