論文の概要: Semiparametric Learning from Open-Set Label Shift Data
- arxiv url: http://arxiv.org/abs/2509.14522v1
- Date: Thu, 18 Sep 2025 01:32:29 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-19 17:26:53.018846
- Title: Semiparametric Learning from Open-Set Label Shift Data
- Title(参考訳): オープンセットラベルシフトデータからのセミパラメトリック学習
- Authors: Siyan Liu, Yukun Liu, Qinglong Tian, Pengfei Li, Jing Qin,
- Abstract要約: オープンセットラベルシフト問題について検討し、テストデータにはトレーニングに欠席した新しいクラスが含まれる可能性がある。
この設定は、クラス比率と新しいクラスの分布の両方が余分な仮定なしでは識別できないため、難しい。
本稿では,新しいクラスと既知のクラス間の重なりを許容しながら,識別可能性を保証する半パラメトリック密度比モデルフレームワークを提案する。
- 参考スコア(独自算出の注目度): 14.537408547515627
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We study the open-set label shift problem, where the test data may include a novel class absent from training. This setting is challenging because both the class proportions and the distribution of the novel class are not identifiable without extra assumptions. Existing approaches often rely on restrictive separability conditions, prior knowledge, or computationally infeasible procedures, and some may lack theoretical guarantees. We propose a semiparametric density ratio model framework that ensures identifiability while allowing overlap between novel and known classes. Within this framework, we develop maximum empirical likelihood estimators and confidence intervals for class proportions, establish their asymptotic validity, and design a stable Expectation-Maximization algorithm for computation. We further construct an approximately optimal classifier based on posterior probabilities with theoretical guarantees. Simulations and a real data application confirm that our methods improve both estimation accuracy and classification performance compared with existing approaches.
- Abstract(参考訳): オープンセットラベルシフト問題について検討し、テストデータにはトレーニングに欠席した新しいクラスが含まれる可能性がある。
この設定は、クラス比率と新しいクラスの分布の両方が余分な仮定なしでは識別できないため、難しい。
既存のアプローチは、しばしば制限的な分離性条件、事前の知識、あるいは計算不可能な手順に依存しており、理論的な保証を欠いているものもある。
本稿では,新しいクラスと既知のクラス間の重なりを許容しながら,識別可能性を保証する半パラメトリック密度比モデルフレームワークを提案する。
本枠組みでは,クラス比に対する最大確率推定器と信頼区間を開発し,その漸近的妥当性を確立し,安定な予測最大化アルゴリズムを設計する。
さらに、理論的保証付き後続確率に基づく近似最適分類器を構築する。
シミュレーションと実データアプリケーションにより,提案手法は既存手法と比較して推定精度と分類性能の両方を向上することを確認した。
関連論文リスト
- SimPro: A Simple Probabilistic Framework Towards Realistic Long-Tailed Semi-Supervised Learning [49.94607673097326]
ラベルなしデータの分散に関する前提を前提としない、高度に適応可能なフレームワークをSimProとして提案する。
我々のフレームワークは確率モデルに基づいており、期待最大化アルゴリズムを革新的に洗練する。
本手法は,様々なベンチマークやデータ分散シナリオにまたがる一貫した最先端性能を示す。
論文 参考訳(メタデータ) (2024-02-21T03:39:04Z) - Scalable Marginal Likelihood Estimation for Model Selection in Deep
Learning [78.83598532168256]
階層型モデル選択は、推定困難のため、ディープラーニングではほとんど使われない。
本研究は,検証データが利用できない場合,限界的可能性によって一般化が向上し,有用であることを示す。
論文 参考訳(メタデータ) (2021-04-11T09:50:24Z) - Learning Prediction Intervals for Regression: Generalization and
Calibration [12.576284277353606]
不確実性定量のための回帰における予測間隔の生成について検討する。
我々は一般学習理論を用いて、リプシッツ連続性とVC-サブグラフクラスを含む最適性と実現可能性のトレードオフを特徴づける。
我々は既存のベンチマークと比べてテスト性能の点で、区間生成とキャリブレーションアルゴリズムの強みを実証的に示している。
論文 参考訳(メタデータ) (2021-02-26T17:55:30Z) - Progressive Identification of True Labels for Partial-Label Learning [112.94467491335611]
部分ラベル学習(Partial-label Learning, PLL)は、典型的な弱教師付き学習問題であり、各トレーニングインスタンスには、真のラベルである候補ラベルのセットが設けられている。
既存のほとんどの手法は、特定の方法で解決しなければならない制約付き最適化として精巧に設計されており、計算複雑性をビッグデータにスケールアップするボトルネックにしている。
本稿では,モデルと最適化アルゴリズムの柔軟性を備えた分類器の新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2020-02-19T08:35:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。