論文の概要: Through the Data Management Lens: Experimental Analysis and Evaluation
of Fair Classification
- arxiv url: http://arxiv.org/abs/2101.07361v1
- Date: Mon, 18 Jan 2021 22:55:40 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-27 05:43:58.187588
- Title: Through the Data Management Lens: Experimental Analysis and Evaluation
of Fair Classification
- Title(参考訳): データ管理レンズを通して:公正な分類の実験的分析と評価
- Authors: Maliha Tashfia Islam, Anna Fariha, Alexandra Meliou
- Abstract要約: データ管理研究は、データとアルゴリズムの公平性に関連するトピックに対する存在感と関心が高まっている。
我々は,その正しさ,公平性,効率性,スケーラビリティ,安定性よりも,13の公正な分類アプローチと追加の変種を幅広く分析している。
我々の分析は、異なるメトリクスとハイレベルなアプローチ特性がパフォーマンスの異なる側面に与える影響に関する新しい洞察を強調します。
- 参考スコア(独自算出の注目度): 75.49600684537117
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Classification, a heavily-studied data-driven machine learning task, drives
an increasing number of prediction systems involving critical human decisions
such as loan approval and criminal risk assessment. However, classifiers often
demonstrate discriminatory behavior, especially when presented with biased
data. Consequently, fairness in classification has emerged as a high-priority
research area. Data management research is showing an increasing presence and
interest in topics related to data and algorithmic fairness, including the
topic of fair classification. The interdisciplinary efforts in fair
classification, with machine learning research having the largest presence,
have resulted in a large number of fairness notions and a wide range of
approaches that have not been systematically evaluated and compared. In this
paper, we contribute a broad analysis of 13 fair classification approaches and
additional variants, over their correctness, fairness, efficiency, scalability,
and stability, using a variety of metrics and real-world datasets. Our analysis
highlights novel insights on the impact of different metrics and high-level
approach characteristics on different aspects of performance. We also discuss
general principles for choosing approaches suitable for different practical
settings, and identify areas where data-management-centric solutions are likely
to have the most impact.
- Abstract(参考訳): データ駆動機械学習タスクである分類は、ローン承認や犯罪リスク評価といった重要な人間の判断を含む予測システムの増加を推進している。
しかし、分類器はしばしば識別行動を示し、特にバイアスデータで示される場合である。
その結果、分類の公平性は高優先度の研究領域として浮上した。
データ管理研究は、公正分類のトピックを含む、データとアルゴリズムの公平性に関連するトピックの存在と関心を示している。
公平な分類における学際的な取り組みは、機械学習の研究が最大の存在感を持ち、多くの公平性概念と、体系的に評価・比較されていない幅広いアプローチを生み出した。
本稿では,その正確性,公平性,効率性,スケーラビリティ,安定性について,さまざまなメトリクスと実世界のデータセットを用いて,13の公正な分類アプローチと,さらに別のバリエーションを幅広く分析する。
我々の分析は、異なるメトリクスとハイレベルなアプローチ特性がパフォーマンスの異なる側面に与える影響に関する新しい洞察を強調します。
また、異なる実践的設定に適したアプローチを選択するための一般的な原則を議論し、データ管理中心のソリューションが最も影響を与える可能性のある領域を特定する。
関連論文リスト
- Bridging the Gap: Protocol Towards Fair and Consistent Affect Analysis [24.737468736951374]
日々の生活における機械学習アルゴリズムの統合の増加は、その展開における公平性と公平性の重要性を浮き彫りにしている。
既存のデータベースと方法論は均一性に欠けており、バイアスのある評価につながっている。
この研究は、6つの感情的なデータベースを分析し、属性を注釈付けし、データベース分割のための共通のプロトコルを提案することで、これらの問題に対処する。
論文 参考訳(メタデータ) (2024-05-10T22:40:01Z) - A Large-Scale Empirical Study on Improving the Fairness of Image Classification Models [22.522156479335706]
本稿では,現在ある最先端の公正性向上技術の性能を比較するための,最初の大規模実証的研究を行う。
その結果,各手法の性能は,データセットや属性によって大きく異なることがわかった。
異なる公平度評価指標は、その異なる焦点のために、明らかに異なる評価結果をもたらす。
論文 参考訳(メタデータ) (2024-01-08T06:53:33Z) - Fairness meets Cross-Domain Learning: a new perspective on Models and
Metrics [80.07271410743806]
クロスドメイン学習(CD)とモデルフェアネスの関係について検討する。
いくつかの人口集団にまたがる顔画像と医療画像のベンチマークと、分類とローカライゼーションタスクについて紹介する。
本研究は,3つの最先端フェアネスアルゴリズムとともに,14のCDアプローチをカバーし,前者が後者に勝ることを示す。
論文 参考訳(メタデータ) (2023-03-25T09:34:05Z) - Systematic Evaluation of Predictive Fairness [60.0947291284978]
バイアス付きデータセットのトレーニングにおけるバイアスの緩和は、重要なオープンな問題である。
複数のタスクにまたがる様々なデバイアス化手法の性能について検討する。
データ条件が相対モデルの性能に強い影響を与えることがわかった。
論文 参考訳(メタデータ) (2022-10-17T05:40:13Z) - Selecting the suitable resampling strategy for imbalanced data
classification regarding dataset properties [62.997667081978825]
医学、情報検索、サイバーセキュリティ、ソーシャルメディアなどの多くのアプリケーションドメインでは、分類モデルの導入に使用されるデータセットは、各クラスのインスタンスの不平等な分布を持つことが多い。
この状況は不均衡データ分類と呼ばれ、少数民族の例では予測性能が低い。
オーバーサンプリングとアンダーサンプリングの技術は、各クラスの例の数とバランスをとることでこの問題に対処する、よく知られた戦略である。
論文 参考訳(メタデータ) (2021-12-15T18:56:39Z) - A survey on datasets for fairness-aware machine learning [6.962333053044713]
多くのフェアネス対応機械学習ソリューションが提案されている。
本稿では,フェアネスを意識した機械学習に使用される実世界のデータセットについて概説する。
データセットのバイアスと公平性についてより深く理解するために、探索分析を用いて興味深い関係を考察する。
論文 参考訳(メタデータ) (2021-10-01T16:54:04Z) - MultiFair: Multi-Group Fairness in Machine Learning [52.24956510371455]
機械学習におけるマルチグループフェアネスの研究(MultiFair)
この問題を解決するために,汎用的なエンドツーエンドのアルゴリズムフレームワークを提案する。
提案するフレームワークは多くの異なる設定に一般化可能である。
論文 参考訳(メタデータ) (2021-05-24T02:30:22Z) - Causal Feature Selection for Algorithmic Fairness [61.767399505764736]
データ管理の統合コンポーネントにおける公平性について検討する。
本稿では,データセットの公平性を保証する特徴のサブコレクションを同定する手法を提案する。
論文 参考訳(メタデータ) (2020-06-10T20:20:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。