論文の概要: A generalized approach to label shift: the Conditional Probability Shift Model
- arxiv url: http://arxiv.org/abs/2503.02583v1
- Date: Tue, 04 Mar 2025 13:07:20 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-05 19:24:39.118369
- Title: A generalized approach to label shift: the Conditional Probability Shift Model
- Title(参考訳): ラベルシフトに対する一般化されたアプローチ:条件付き確率シフトモデル
- Authors: Paweł Teisseyre, Jan Mielniczuk,
- Abstract要約: Conditional Probability Shift (CPS) は、特定の特徴が変化したクラス変数の条件分布をキャプチャする。
多項回帰を用いたクラス変数の条件付き確率のモデル化に基づくCPSMを提案する。
CPSMの有効性は、合成データセットの実験およびMIMIC医療データベースを用いたケーススタディを通じて実証される。
- 参考スコア(独自算出の注目度): 0.8594140167290099
- License:
- Abstract: In many practical applications of machine learning, a discrepancy often arises between a source distribution from which labeled training examples are drawn and a target distribution for which only unlabeled data is observed. Traditionally, two main scenarios have been considered to address this issue: covariate shift (CS), where only the marginal distribution of features changes, and label shift (LS), which involves a change in the class variable's prior distribution. However, these frameworks do not encompass all forms of distributional shift. This paper introduces a new setting, Conditional Probability Shift (CPS), which captures the case when the conditional distribution of the class variable given some specific features changes while the distribution of remaining features given the specific features and the class is preserved. For this scenario we present the Conditional Probability Shift Model (CPSM) based on modeling the class variable's conditional probabilities using multinomial regression. Since the class variable is not observed for the target data, the parameters of the multinomial model for its distribution are estimated using the Expectation-Maximization algorithm. The proposed method is generic and can be combined with any probabilistic classifier. The effectiveness of CPSM is demonstrated through experiments on synthetic datasets and a case study using the MIMIC medical database, revealing its superior balanced classification accuracy on the target data compared to existing methods, particularly in situations situations of conditional distribution shift and no apriori distribution shift, which are not detected by LS-based methods.
- Abstract(参考訳): 機械学習の多くの実践的応用において、ラベル付きトレーニング例を描画するソース分布とラベルなしデータのみを観測するターゲット分布との間には、しばしば相違が生じている。
伝統的に、この問題に対処する2つの主要なシナリオは、特徴の限界分布だけを変更する共変量シフト(CS)と、クラス変数の以前の分布を変更するラベルシフト(LS)である。
しかし、これらのフレームワークは分布シフトの全ての形態を包含していない。
本稿では,特定の特徴が変化したクラス変数の条件分布と,特定の特徴とクラスが保存された残特徴の分布をキャプチャする条件付き確率シフト(Conditional Probability Shift, CPS)を提案する。
このシナリオでは,多項回帰を用いたクラス変数の条件付き確率をモデル化した条件付き確率シフトモデル(CPSM)を提案する。
クラス変数は対象データに対して観測されないため、その分布に対する多重項モデルのパラメータは期待最大化アルゴリズムを用いて推定される。
提案手法は汎用的であり,任意の確率的分類器と組み合わせることができる。
CPSMの有効性は,MIMICメディカルデータベースを用いた総合データセット実験およびケーススタディにより実証され,既存の手法,特にLS法では検出されない条件分布シフトやアプリオリ分布シフトの状況において,対象データに対するバランスの取れた分類精度が向上していることが明らかになった。
関連論文リスト
- SimPro: A Simple Probabilistic Framework Towards Realistic Long-Tailed Semi-Supervised Learning [49.94607673097326]
ラベルなしデータの分散に関する前提を前提としない、高度に適応可能なフレームワークをSimProとして提案する。
我々のフレームワークは確率モデルに基づいており、期待最大化アルゴリズムを革新的に洗練する。
本手法は,様々なベンチマークやデータ分散シナリオにまたがる一貫した最先端性能を示す。
論文 参考訳(メタデータ) (2024-02-21T03:39:04Z) - Class Probability Matching Using Kernel Methods for Label Shift
Adaptation [10.926835355554553]
ラベルシフト適応のためのtextitclass probability matching (textitCPM) という新しいフレームワークを提案する。
カーネルロジスティック回帰をCPMフレームワークに組み込んで条件付き確率を推定することにより,ラベルシフト適応のためのtextitCPMKM というアルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-12-12T13:59:37Z) - Invariance assumptions for class distribution estimation [1.3053649021965603]
本研究では,データセットシフトによるクラス分布推定の問題について検討する。
トレーニングデータセットでは、機能とクラスラベルの両方が観察され、テストデータセットでは、機能のみが観察される。
論文 参考訳(メタデータ) (2023-11-28T20:57:10Z) - Conformal Inference for Invariant Risk Minimization [12.049545417799125]
機械学習モデルの応用は、分布シフトの発生によって著しく阻害される可能性がある。
この問題を解決する一つの方法は、不変リスク最小化(IRM)のような不変学習を用いて不変表現を取得することである。
本稿では,不変表現に対する不確実性推定を記述するために,分布自由予測領域を得る手法を提案する。
論文 参考訳(メタデータ) (2023-05-22T03:48:38Z) - Variational Classification [51.2541371924591]
我々は,変分オートエンコーダの訓練に用いるエビデンスローバウンド(ELBO)に類似した,モデルの訓練を目的とした変分目的を導出する。
軟質マックス層への入力を潜伏変数のサンプルとして扱うことで, 抽象化された視点から, 潜在的な矛盾が明らかとなった。
我々は、標準ソフトマックス層に見られる暗黙の仮定の代わりに、選択された潜在分布を誘導する。
論文 参考訳(メタデータ) (2023-05-17T17:47:19Z) - Learnable Distribution Calibration for Few-Shot Class-Incremental
Learning [122.2241120474278]
FSCIL(Few-shot class-incremental Learning)は、古いクラス分布を記憶し、少数のトレーニングサンプルから新しいクラス分布を推定するという課題に直面している。
本稿では,これら2つの課題を統一フレームワークを用いて体系的に解決することを目的とした,学習可能な分布校正手法を提案する。
論文 参考訳(メタデータ) (2022-10-01T09:40:26Z) - Predicting Out-of-Domain Generalization with Neighborhood Invariance [59.05399533508682]
局所変換近傍における分類器の出力不変性の尺度を提案する。
私たちの測度は計算が簡単で、テストポイントの真のラベルに依存しません。
画像分類,感情分析,自然言語推論のベンチマーク実験において,我々の測定値と実際のOOD一般化との間に強い相関関係を示す。
論文 参考訳(メタデータ) (2022-07-05T14:55:16Z) - Causal Discovery in Heterogeneous Environments Under the Sparse
Mechanism Shift Hypothesis [7.895866278697778]
機械学習のアプローチは、一般に独立で同一に分散されたデータ(すなわち、d)の仮定に依存する。
実際、この仮定は環境間の分散シフトによってほとんど常に破られる。
そこで我々は,様々な経験的推定器に適用可能なスコアベースアプローチであるメカニズムシフトスコア(MSS)を提案する。
論文 参考訳(メタデータ) (2022-06-04T15:39:30Z) - Uncertainty Modeling for Out-of-Distribution Generalization [56.957731893992495]
特徴統計を適切に操作することで、ディープラーニングモデルの一般化能力を向上させることができると論じる。
一般的な手法では、特徴統計を学習した特徴から測定された決定論的値とみなすことが多い。
我々は、学習中に合成された特徴統計を用いて、領域シフトの不確かさをモデル化することにより、ネットワークの一般化能力を向上させる。
論文 参考訳(メタデータ) (2022-02-08T16:09:12Z) - When in Doubt: Improving Classification Performance with Alternating
Normalization [57.39356691967766]
分類のための非パラメトリック後処理ステップである交互正規化(CAN)を用いた分類を導入する。
CANは、予測されたクラス確率分布を再調整することで、挑戦的な例の分類精度を向上させる。
多様な分類課題にまたがってその効果を実証的に示す。
論文 参考訳(メタデータ) (2021-09-28T02:55:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。