論文の概要: A Robust Classifier Under Missing-Not-At-Random Sample Selection Bias
- arxiv url: http://arxiv.org/abs/2305.15641v1
- Date: Thu, 25 May 2023 01:39:51 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-26 18:03:08.472988
- Title: A Robust Classifier Under Missing-Not-At-Random Sample Selection Bias
- Title(参考訳): 欠落非ランダム標本選択バイアス下におけるロバスト分類器
- Authors: Huy Mai, Wen Huang, Wei Du, Xintao Wu
- Abstract要約: 統計学において、グリーンの手法は、このタイプのサンプル選択を予測モデルとしてロジスティック回帰を用いて定式化する。
元のトレーニングセットを変更することでグリーンの手法を改善するアルゴリズムであるBiasCorrを提案する。
グリーン法よりもバイアスの偏りを解析し,BiasCorrの改良を理論的に保証する。
- 参考スコア(独自算出の注目度): 15.628927478079913
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The shift between the training and testing distributions is commonly due to
sample selection bias, a type of bias caused by non-random sampling of examples
to be included in the training set. Although there are many approaches proposed
to learn a classifier under sample selection bias, few address the case where a
subset of labels in the training set are missing-not-at-random (MNAR) as a
result of the selection process. In statistics, Greene's method formulates this
type of sample selection with logistic regression as the prediction model.
However, we find that simply integrating this method into a robust
classification framework is not effective for this bias setting. In this paper,
we propose BiasCorr, an algorithm that improves on Greene's method by modifying
the original training set in order for a classifier to learn under MNAR sample
selection bias. We provide theoretical guarantee for the improvement of
BiasCorr over Greene's method by analyzing its bias. Experimental results on
real-world datasets demonstrate that BiasCorr produces robust classifiers and
can be extended to outperform state-of-the-art classifiers that have been
proposed to train under sample selection bias.
- Abstract(参考訳): トレーニングとテスト分布のシフトは、トレーニングセットに含まれるサンプルの非ランダムサンプリングによって引き起こされるバイアスであるサンプル選択バイアスに起因することが多い。
サンプル選択バイアスに基づく分類器の学習には多くのアプローチが提案されているが、選択プロセスの結果、トレーニングセット内のラベルのサブセットが欠落する(MNAR)場合に対処するケースはほとんどない。
統計学において、グリーンの手法は、このタイプのサンプル選択を予測モデルとしてロジスティック回帰を用いて定式化する。
しかし,この手法をロバストな分類フレームワークに統合することは,このバイアス設定には有効ではない。
本稿では,分類器がMNARサンプル選択バイアスの下で学習するために,元のトレーニングセットを変更することでグリーンの手法を改善するアルゴリズムであるBiasCorrを提案する。
グリーン法よりもバイアスの偏りを解析し,BiasCorrの改良を理論的に保証する。
実世界のデータセットにおける実験結果は、biascorrが堅牢な分類器を生成し、サンプル選択バイアスの下でトレーニングするために提案された最先端の分類器を上回るように拡張できることを示しています。
関連論文リスト
- CosFairNet:A Parameter-Space based Approach for Bias Free Learning [1.9116784879310025]
バイアス付きデータに基づいてトレーニングされたディープニューラルネットワークは、意図しない推論ルールを不注意に学習することが多い。
本稿では,モデルのパラメータ空間内で直接バイアスに対処する新しい手法を提案する。
各種合成および実世界のデータセットにおいて,分類精度の向上と偏りの低減効果を示す。
論文 参考訳(メタデータ) (2024-10-19T13:06:40Z) - Debiased Sample Selection for Combating Noisy Labels [24.296451733127956]
サンプル選択におけるバイアス学習のためのnoIse-Tolerant Expert Model (ITEM)を提案する。
具体的には、トレーニングバイアスを軽減するために、複数の専門家と統合した堅牢なネットワークアーキテクチャを設計します。
2つのクラス識別型ミニバッチの混合によるトレーニングにより、モデルが不均衡なトレーニングセットの効果を緩和する。
論文 参考訳(メタデータ) (2024-01-24T10:37:28Z) - Twice Class Bias Correction for Imbalanced Semi-Supervised Learning [59.90429949214134]
textbfTwice textbfClass textbfBias textbfCorrection (textbfTCBC) と呼ばれる新しいアプローチを導入する。
トレーニング過程におけるモデルパラメータのクラスバイアスを推定する。
非ラベル標本に対してモデルの擬似ラベルに二次補正を適用する。
論文 参考訳(メタデータ) (2023-12-27T15:06:36Z) - Echoes: Unsupervised Debiasing via Pseudo-bias Labeling in an Echo
Chamber [17.034228910493056]
本稿では,既存のバイアスモデルがトレーニングデータにおけるバイアス強調サンプルに過度に適合していることを明らかにする実験的検討を行った。
本研究では、バイアスモデルとターゲットモデルを異なる戦略で訓練するEchoesという、単純で効果的な手法を提案する。
提案手法は,既存の合成データセットと実世界のデータセットのベースラインと比較して,優れたデバイアス化結果が得られる。
論文 参考訳(メタデータ) (2023-05-06T13:13:18Z) - Feature-Level Debiased Natural Language Understanding [86.8751772146264]
既存の自然言語理解(NLU)モデルは、特定のデータセットで高いパフォーマンスを達成するために、データセットバイアスに依存することが多い。
本稿では, バイアスの潜在特性を緩和し, バイアスの動的性質を無視するために, DCT(Debiasing contrastive learning)を提案する。
DCTは、ディストリビューション内のパフォーマンスを維持しながら、アウトオブディストリビューションデータセットの最先端のベースラインを上回ります。
論文 参考訳(メタデータ) (2022-12-11T06:16:14Z) - Bias Mimicking: A Simple Sampling Approach for Bias Mitigation [57.17709477668213]
本稿では,新しいクラス条件サンプリング手法であるBias Mimickingを紹介する。
Bias Mimickingは、4つのベンチマークで3%の精度でサンプリングの精度を向上する。
論文 参考訳(メタデータ) (2022-09-30T17:33:00Z) - Learning from a Biased Sample [3.546358664345473]
本稿では,テスト分布のファミリーで発生する最悪のリスクを最小限に抑える決定ルールの学習方法を提案する。
本研究では,健康調査データからメンタルヘルススコアの予測を行うケーススタディにおいて,提案手法を実証的に検証した。
論文 参考訳(メタデータ) (2022-09-05T04:19:16Z) - Robust Fairness-aware Learning Under Sample Selection Bias [17.09665420515772]
サンプル選択バイアス下での頑健で公正な学習のための枠組みを提案する。
テストデータが利用可能で、利用できない場合に、サンプル選択バイアスを処理する2つのアルゴリズムを開発した。
論文 参考訳(メタデータ) (2021-05-24T23:23:36Z) - Understanding Classifier Mistakes with Generative Models [88.20470690631372]
ディープニューラルネットワークは教師付き学習タスクに有効であるが、脆弱であることが示されている。
本稿では、生成モデルを利用して、分類器が一般化に失敗するインスタンスを特定し、特徴付ける。
我々のアプローチは、トレーニングセットのクラスラベルに依存しないため、半教師付きでトレーニングされたモデルに適用できる。
論文 参考訳(メタデータ) (2020-10-05T22:13:21Z) - Individual Calibration with Randomized Forecasting [116.2086707626651]
予測値がランダムに設定された場合,各サンプルのキャリブレーションは回帰設定で可能であることを示す。
我々は、個別の校正を強制する訓練目標を設計し、それをランダム化された回帰関数の訓練に使用する。
論文 参考訳(メタデータ) (2020-06-18T05:53:10Z) - Certified Robustness to Label-Flipping Attacks via Randomized Smoothing [105.91827623768724]
機械学習アルゴリズムは、データ中毒攻撃の影響を受けやすい。
任意の関数に対するランダム化スムージングの統一的なビューを示す。
本稿では,一般的なデータ中毒攻撃に対して,ポイントワイズで確実に堅牢な分類器を構築するための新しい戦略を提案する。
論文 参考訳(メタデータ) (2020-02-07T21:28:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。