論文の概要: Fairness Under Group-Conditional Prior Probability Shift: Invariance, Drift, and Target-Aware Post-Processing
- arxiv url: http://arxiv.org/abs/2602.05144v1
- Date: Thu, 05 Feb 2026 00:01:02 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-06 18:49:08.674111
- Title: Fairness Under Group-Conditional Prior Probability Shift: Invariance, Drift, and Target-Aware Post-Processing
- Title(参考訳): グループ契約型事前確率シフトによる公正性:不変性, ドリフト性, ターゲット認識後処理
- Authors: Amir Asiaee, Kaveh Aryan,
- Abstract要約: 誤差率(等化確率)に基づく公平度基準はGPPSの下で構造的に不変であることを示す。
対象ラベルを使わずに,対象領域のリスクとフェアネスの指標が識別可能であることを示す。
本研究では,ラベルのない後処理アルゴリズムであるTAP-GPPSを提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Machine learning systems are often trained and evaluated for fairness on historical data, yet deployed in environments where conditions have shifted. A particularly common form of shift occurs when the prevalence of positive outcomes changes differently across demographic groups--for example, when disease rates rise faster in one population than another, or when economic conditions affect loan default rates unequally. We study group-conditional prior probability shift (GPPS), where the label prevalence $P(Y=1\mid A=a)$ may change between training and deployment while the feature-generation process $P(X\mid Y,A)$ remains stable. Our analysis yields three main contributions. First, we prove a fundamental dichotomy: fairness criteria based on error rates (equalized odds) are structurally invariant under GPPS, while acceptance-rate criteria (demographic parity) can drift--and we prove this drift is unavoidable for non-trivial classifiers (shift-robust impossibility). Second, we show that target-domain risk and fairness metrics are identifiable without target labels: the invariance of ROC quantities under GPPS enables consistent estimation from source labels and unlabeled target data alone, with finite-sample guarantees. Third, we propose TAP-GPPS, a label-free post-processing algorithm that estimates prevalences from unlabeled data, corrects posteriors, and selects thresholds to satisfy demographic parity in the target domain. Experiments validate our theoretical predictions and demonstrate that TAP-GPPS achieves target fairness with minimal utility loss.
- Abstract(参考訳): 機械学習システムは、歴史的データに対する公平性のためにトレーニングされ、評価されることが多いが、状況が変化した環境ではデプロイされる。
特に一般的な形態のシフトは、人口統計学的グループ間でポジティブな結果の頻度が異なる場合、例えば、病気率が他の集団よりも速く増加する場合、あるいは経済的条件がローンデフォルトレートに不平等に影響を及ぼす場合などである。
グループ条件付き事前確率シフト (GPPS) について検討し, ラベル精度$P(Y=1\mid A=a)$はトレーニングとデプロイメントの間に変化しうるが, 特徴生成プロセス$P(X\mid Y,A)$は安定である。
私たちの分析は3つの主な貢献をもたらす。
まず, 誤り率(等化確率)に基づく公平度基準はGPPSの下で構造的に不変であり, 受け入れ率基準(デミノグラフィーパリティ)はドリフト可能であり, このドリフトが非自明な分類器では避けられないことを示す。
第2に、ターゲット領域のリスクと公正度は、ターゲットラベルなしで識別可能であることを示し、GPPSの下でのROC量の分散は、有限サンプル保証で、ソースラベルと未ラベルのターゲットデータのみから一貫した推定を可能にする。
第3に,ラベルのない後処理アルゴリズムであるTAP-GPPSを提案する。
理論的予測を検証し,TAP-GPPSが最小限の効用損失で目標フェアネスを達成することを示す。
関連論文リスト
- Conditional Coverage Diagnostics for Conformal Prediction [47.93989136542648]
条件付きカバレッジ推定が分類問題であることを示す。
得られたメトリクスの族をターゲットカバレッジ(ERT)の過剰なリスクと呼びます。
ERTのオープンソースパッケージと、以前の条件付きカバレッジメトリクスをリリースしています。
論文 参考訳(メタデータ) (2025-12-12T18:47:39Z) - Regression-Based Estimation of Causal Effects in the Presence of Selection Bias and Confounding [52.1068936424622]
治療が介入によって設定された場合、対象変数$Y$に対して、予測因果効果$E[Y|do(X)]$を推定する問題を考える。
選択バイアスや欠点のない設定では、$E[Y|do(X)] = E[Y|X]$ となる。
選択バイアスとコンバウンディングの両方を組み込んだフレームワークを提案する。
論文 参考訳(メタデータ) (2025-03-26T13:43:37Z) - Classification under Nuisance Parameters and Generalized Label Shift in Likelihood-Free Inference [3.507509142413452]
本稿では,不確実性定量化のための新しい手法を提案する。
提案手法は,ドメイン適応能力を持つ事前学習型分類器を効果的に提供し,高出力を維持しながら有効な予測セットを返却する。
現実的な力学モデルから得られたデータを用いて、生物学と天体物理学における2つの挑戦的な科学的問題に対して、その性能を実証する。
論文 参考訳(メタデータ) (2024-02-08T00:12:18Z) - Equal Opportunity of Coverage in Fair Regression [50.76908018786335]
我々は、予測の不確実性の下で公正な機械学習(ML)を研究し、信頼性と信頼性のある意思決定を可能にする。
本研究は,(1)類似した結果の異なる集団に対するカバー率が近いこと,(2)人口全体のカバー率が一定水準にあること,の2つの特性を達成することを目的としたカバーの平等機会(EOC)を提案する。
論文 参考訳(メタデータ) (2023-11-03T21:19:59Z) - Adapting to Latent Subgroup Shifts via Concepts and Proxies [82.01141290360562]
最適ターゲット予測器は、ソースドメインでのみ利用できる概念とプロキシ変数の助けを借りて、非パラメトリックに識別可能であることを示す。
本研究では,データ生成プロセスに特有の潜在変数モデルを提案する。
論文 参考訳(メタデータ) (2022-12-21T18:30:22Z) - Domain Adaptation under Missingness Shift [38.650099178537864]
欠損度シフト(DAMS)下におけるドメイン適応問題について紹介する。
欠落したデータのレートは、しばしば記録保持ポリシーに依存するため、時間や場所によって変化する可能性がある。
合成データおよび半合成データの実験において,仮定が成立する際の手法の可能性を実証した。
論文 参考訳(メタデータ) (2022-11-03T18:49:38Z) - Delving into Probabilistic Uncertainty for Unsupervised Domain Adaptive
Person Re-Identification [54.174146346387204]
ドメイン適応型人物再識別のための確率的不確実性誘導プログレッシブラベル精錬(P$2$LR)という手法を提案する。
擬似ラベルの不確実性を測定し、ネットワークトレーニングを容易にする定量的基準を確立する。
本手法はDuke2Marketタスクではベースラインが6.5%,Market2MSMTタスクでは2.5%,最先端手法では2.5%を上回った。
論文 参考訳(メタデータ) (2021-12-28T07:40:12Z) - Distribution-free uncertainty quantification for classification under
label shift [105.27463615756733]
2つの経路による分類問題に対する不確実性定量化(UQ)に焦点を当てる。
まず、ラベルシフトはカバレッジとキャリブレーションの低下を示すことでuqを損なうと論じる。
これらの手法を, 理論上, 分散性のない枠組みで検討し, その優れた実用性を示す。
論文 参考訳(メタデータ) (2021-03-04T20:51:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。