論文の概要: Unbiased Subdata Selection for Fair Classification: A Unified Framework
and Scalable Algorithms
- arxiv url: http://arxiv.org/abs/2012.12356v2
- Date: Thu, 24 Dec 2020 05:20:18 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-26 07:41:16.223320
- Title: Unbiased Subdata Selection for Fair Classification: A Unified Framework
and Scalable Algorithms
- Title(参考訳): Unbiased Subdata Selection for Fair Classification: a Unified Framework and Scalable Algorithms
- Authors: Qing Ye and Weijun Xie
- Abstract要約: このフレームワーク内の多くの分類モデルが混合整数凸プログラムとして再キャストできることを示した。
そして,提案問題において,分類結果の「解決不能な部分データ選択」が強く解決可能であることを示す。
これにより、分類インスタンスを解決するための反復精錬戦略(IRS)の開発を動機付けます。
- 参考スコア(独自算出の注目度): 0.8376091455761261
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: As an important problem in modern data analytics, classification has
witnessed varieties of applications from different domains. Different from
conventional classification approaches, fair classification concerns the issues
of unintentional biases against the sensitive features (e.g., gender, race).
Due to high nonconvexity of fairness measures, existing methods are often
unable to model exact fairness, which can cause inferior fair classification
outcomes. This paper fills the gap by developing a novel unified framework to
jointly optimize accuracy and fairness. The proposed framework is versatile and
can incorporate different fairness measures studied in literature precisely as
well as can be applicable to many classifiers including deep classification
models. Specifically, in this paper, we first prove Fisher consistency of the
proposed framework. We then show that many classification models within this
framework can be recast as mixed-integer convex programs, which can be solved
effectively by off-the-shelf solvers when the instance sizes are moderate and
can be used as benchmarks to compare the efficiency of approximation
algorithms. We prove that in the proposed framework, when the classification
outcomes are known, the resulting problem, termed "unbiased subdata selection,"
is strongly polynomial-solvable and can be used to enhance the classification
fairness by selecting more representative data points. This motivates us to
develop an iterative refining strategy (IRS) to solve the large-scale
instances, where we improve the classification accuracy and conduct the
unbiased subdata selection in an alternating fashion. We study the convergence
property of IRS and derive its approximation bound. More broadly, this
framework can be leveraged to improve classification models with unbalanced
data by taking F1 score into consideration.
- Abstract(参考訳): 現代のデータ分析における重要な問題として、分類は異なるドメインの様々なアプリケーションを見てきた。
従来の分類アプローチとは異なり、公正な分類は、敏感な特徴(例えば性別、人種)に対する意図しない偏見の問題に関係している。
公平度尺度の非凸性が高いため、既存の手法では正確な公平度をモデル化できない場合が多く、公平度分類の結果が劣ることがある。
本稿では,精度と公平性を共同で最適化する新しい統一フレームワークの開発により,そのギャップを埋める。
提案手法は多種多様であり,文献に精通した様々な公正度尺度を組み込むことが可能であり,深い分類モデルを含む多くの分類器にも適用可能である。
具体的には、提案したフレームワークのフィッシャー整合性を最初に証明する。
次に,本フレームワーク内の多くの分類モデルが混合整数凸プログラムとして再キャスト可能であり,インスタンスサイズが中程度であればオフ・ザ・シェルソルバによって効果的に解くことができ,近似アルゴリズムの効率を比較するベンチマークとして使用できることを示す。
提案手法では, 分類結果が分かっている場合, 「偏りのない部分データ選択」 と呼ばれる結果問題は非常に多項式解決可能であり, より代表的データポイントの選択による分類公平性の向上に利用できることを示す。
これにより、大規模インスタンスを解決するために反復精錬戦略(IRS)を開発する動機となり、分類精度を改善し、非バイアスのサブデータ選択を交互に行う。
我々は、IRSの収束特性を研究し、近似境界を導出する。
より広範に、このフレームワークはF1スコアを考慮して不均衡なデータによる分類モデルを改善するために利用することができる。
関連論文リスト
- Optimal Group Fair Classifiers from Linear Post-Processing [10.615965454674901]
本稿では,グループフェアネス基準の統一されたファミリーの下でモデルバイアスを緩和するフェア分類のためのポストプロセッシングアルゴリズムを提案する。
与えられたベースモデルの出力スコアを、(予測された)グループのメンバシップの線形結合である「公正コスト」で再計算することで、公平性を達成する。
論文 参考訳(メタデータ) (2024-05-07T05:58:44Z) - Balanced Classification: A Unified Framework for Long-Tailed Object
Detection [74.94216414011326]
従来の検出器は、分類バイアスによる長期データを扱う際の性能劣化に悩まされる。
本稿では,カテゴリ分布の格差に起因する不平等の適応的是正を可能にする,BAlanced CLassification (BACL) と呼ばれる統一フレームワークを提案する。
BACLは、さまざまなバックボーンとアーキテクチャを持つさまざまなデータセット間で、一貫してパフォーマンス改善を実現している。
論文 参考訳(メタデータ) (2023-08-04T09:11:07Z) - Bipartite Ranking Fairness through a Model Agnostic Ordering Adjustment [54.179859639868646]
本稿では,二部類ランキングにおける公平性を実現するためのモデルに依存しない後処理フレームワークxOrderを提案する。
xOrderは、教師なしおよび教師なしの公正度メトリックを含む、さまざまな分類モデルとランキングフェアネスメトリクスと互換性がある。
提案アルゴリズムを,4つのベンチマークデータセットと2つの実世界の患者電子健康記録リポジトリ上で評価した。
論文 参考訳(メタデータ) (2023-07-27T07:42:44Z) - Parametric Classification for Generalized Category Discovery: A Baseline
Study [70.73212959385387]
Generalized Category Discovery (GCD)は、ラベル付きサンプルから学習した知識を用いて、ラベルなしデータセットで新しいカテゴリを発見することを目的としている。
パラメトリック分類器の故障を調査し,高品質な監視が可能であった場合の過去の設計選択の有効性を検証し,信頼性の低い疑似ラベルを重要課題として同定する。
エントロピー正規化の利点を生かし、複数のGCDベンチマークにおける最先端性能を実現し、未知のクラス数に対して強いロバスト性を示す、単純で効果的なパラメトリック分類法を提案する。
論文 参考訳(メタデータ) (2022-11-21T18:47:11Z) - Fair and Optimal Classification via Post-Processing [10.163721748735801]
本稿では、分類問題における人口統計学の特質的トレードオフの完全な評価について述べる。
ランダム化および属性認識フェア分類器によって達成可能な最小誤差率は、ワッサーシュタイン・バリセンタ問題の最適値によって与えられることを示す。
論文 参考訳(メタデータ) (2022-11-03T00:04:04Z) - Exploring Category-correlated Feature for Few-shot Image Classification [27.13708881431794]
本稿では,従来の知識として,新しいクラスとベースクラスのカテゴリ相関を探索し,シンプルで効果的な特徴補正手法を提案する。
提案手法は, 広く使用されている3つのベンチマークにおいて, 一定の性能向上が得られる。
論文 参考訳(メタデータ) (2021-12-14T08:25:24Z) - When in Doubt: Improving Classification Performance with Alternating
Normalization [57.39356691967766]
分類のための非パラメトリック後処理ステップである交互正規化(CAN)を用いた分類を導入する。
CANは、予測されたクラス確率分布を再調整することで、挑戦的な例の分類精度を向上させる。
多様な分類課題にまたがってその効果を実証的に示す。
論文 参考訳(メタデータ) (2021-09-28T02:55:42Z) - No Fear of Heterogeneity: Classifier Calibration for Federated Learning
with Non-IID Data [78.69828864672978]
実世界のフェデレーションシステムにおける分類モデルのトレーニングにおける中心的な課題は、非IIDデータによる学習である。
このアルゴリズムは, 近似されたssian混合モデルからサンプリングした仮想表現を用いて分類器を調整する。
実験の結果,CIFAR-10,CIFAR-100,CINIC-10など,一般的なフェデレーション学習ベンチマークにおけるCCVRの現状が示された。
論文 参考訳(メタデータ) (2021-06-09T12:02:29Z) - Fairness with Overlapping Groups [15.154984899546333]
標準的なゴールは、複数の重なり合うグループ間での公平度メトリクスの平等を保証することである。
本稿では、確率論的人口分析を用いて、この標準公正分類問題を再考する。
提案手法は,既存のグループフェア分類手法を統一し,様々な非分解性性能指標と公正度尺度の拡張を可能にする。
論文 参考訳(メタデータ) (2020-06-24T05:01:10Z) - Towards Model-Agnostic Post-Hoc Adjustment for Balancing Ranking
Fairness and Algorithm Utility [54.179859639868646]
Bipartiteランキングは、ラベル付きデータから正の個人よりも上位の個人をランク付けするスコアリング機能を学ぶことを目的としている。
学習したスコアリング機能が、異なる保護グループ間で体系的な格差を引き起こすのではないかという懸念が高まっている。
本稿では、二部構成のランキングシナリオにおいて、それらのバランスをとるためのモデル後処理フレームワークを提案する。
論文 参考訳(メタデータ) (2020-06-15T10:08:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。