論文の概要: Fair Feature Subset Selection using Multiobjective Genetic Algorithm
- arxiv url: http://arxiv.org/abs/2205.01512v1
- Date: Sat, 30 Apr 2022 22:51:19 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-05 05:16:58.738648
- Title: Fair Feature Subset Selection using Multiobjective Genetic Algorithm
- Title(参考訳): 多目的遺伝的アルゴリズムを用いた特徴量選択
- Authors: Ayaz Ur Rehman, Anas Nadeem, Muhammad Zubair Malik
- Abstract要約: フェアネスと精度を両立させる特徴部分選択手法を提案する。
モデル性能の指標としてF1-Scoreを用いる。
最も一般的なフェアネスベンチマークデータセットの実験では、進化的アルゴリズムを用いることで、フェアネスと精度のトレードオフを効果的に探索できることが示されている。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The feature subset selection problem aims at selecting the relevant subset of
features to improve the performance of a Machine Learning (ML) algorithm on
training data. Some features in data can be inherently noisy, costly to
compute, improperly scaled, or correlated to other features, and they can
adversely affect the accuracy, cost, and complexity of the induced algorithm.
The goal of traditional feature selection approaches has been to remove such
irrelevant features. In recent years ML is making a noticeable impact on the
decision-making processes of our everyday lives. We want to ensure that these
decisions do not reflect biased behavior towards certain groups or individuals
based on protected attributes such as age, sex, or race. In this paper, we
present a feature subset selection approach that improves both fairness and
accuracy objectives and computes Pareto-optimal solutions using the NSGA-II
algorithm. We use statistical disparity as a fairness metric and F1-Score as a
metric for model performance. Our experiments on the most commonly used
fairness benchmark datasets with three different machine learning algorithms
show that using the evolutionary algorithm we can effectively explore the
trade-off between fairness and accuracy.
- Abstract(参考訳): 機能サブセット選択問題は、関連する機能のサブセットを選択して、トレーニングデータに対する機械学習(ML)アルゴリズムのパフォーマンスを改善することを目的としている。
データ内のいくつかの機能は本質的にノイズが多く、計算コストが高く、不適切にスケールされ、他の機能と関連付けられ、誘導アルゴリズムの精度、コスト、複雑さに悪影響を及ぼす可能性がある。
従来の機能選択アプローチの目標は、そのような無関係な機能を削除することだ。
近年、MLは私たちの日常生活の意思決定プロセスに顕著な影響を与えています。
私たちは、これらの決定が、年齢、性別、人種といった保護された属性に基づいて、特定のグループや個人に対する偏った行動を反映しないようにしたいと考えています。
本稿では,妥当性と精度の両方を向上し,NSGA-IIアルゴリズムを用いてパレート最適解を計算する特徴部分選択手法を提案する。
統計的不一致を公平度指標とし,f1-scoreをモデル性能指標とする。
3つの異なる機械学習アルゴリズムを用いた最もよく使われるフェアネスベンチマークデータセットの実験により、進化的アルゴリズムを用いることで、フェアネスと精度のトレードオフを効果的に探索できることが示された。
関連論文リスト
- Switchable Decision: Dynamic Neural Generation Networks [98.61113699324429]
本稿では,各データインスタンスのリソースを動的に割り当てることで,推論を高速化するスイッチブルな決定を提案する。
提案手法は, 同一の精度を維持しながら, 推論時のコスト低減に有効である。
論文 参考訳(メタデータ) (2024-05-07T17:44:54Z) - Dual-stage optimizer for systematic overestimation adjustment applied to
multi-objective genetic algorithms for biomarker selection [0.18648070031379424]
特徴選択法を用いたバイオマーカー同定は,特徴数における予測能力とパシモニーのトレードオフを伴う多目的問題として扱うことができる。
提案するDOSA-MOは多目的最適化ラッパーアルゴリズムで,元の推定値,分散度,および解の特徴セットサイズが過大評価を予測する。
論文 参考訳(メタデータ) (2023-12-27T16:13:14Z) - Causal Feature Selection via Transfer Entropy [59.999594949050596]
因果発見は、観察データによる特徴間の因果関係を特定することを目的としている。
本稿では,前向きと後向きの機能選択に依存する新たな因果的特徴選択手法を提案する。
精度および有限サンプルの場合の回帰誤差と分類誤差について理論的に保証する。
論文 参考訳(メタデータ) (2023-10-17T08:04:45Z) - Improved Algorithms for Neural Active Learning [74.89097665112621]
非パラメトリックストリーミング設定のためのニューラルネットワーク(NN)ベースの能動学習アルゴリズムの理論的および経験的性能を改善する。
本研究では,SOTA(State-of-the-art (State-the-art)) 関連研究で使用されるものよりも,アクティブラーニングに適する人口減少を最小化することにより,2つの後悔の指標を導入する。
論文 参考訳(メタデータ) (2022-10-02T05:03:38Z) - Sequential Attention for Feature Selection [12.89764845700709]
本稿では,ニューラルネットワークの最先端な実験結果を実現するSequential Attentionと呼ばれる特徴選択アルゴリズムを提案する。
この設定への適応が古典的直交整合探索(OMP)アルゴリズムと等価であることを示すことによって、線形回帰のためのアルゴリズムの理論的な洞察を与える。
論文 参考訳(メタデータ) (2022-09-29T15:49:06Z) - Compactness Score: A Fast Filter Method for Unsupervised Feature
Selection [66.84571085643928]
本稿では,CSUFS (Compactness Score) と呼ばれる高速な教師なし特徴選択手法を提案する。
提案アルゴリズムは既存のアルゴリズムよりも正確で効率的である。
論文 参考訳(メタデータ) (2022-01-31T13:01:37Z) - Can Active Learning Preemptively Mitigate Fairness Issues? [66.84854430781097]
データセットバイアスは、機械学習における不公平な原因の1つです。
不確実性に基づくALで訓練されたモデルが保護クラスの決定において公平であるかどうかを検討する。
また,勾配反転(GRAD)やBALDなどのアルゴリズム的公正性手法の相互作用についても検討する。
論文 参考訳(メタデータ) (2021-04-14T14:20:22Z) - Feature Selection Using Reinforcement Learning [0.0]
特定の関心の予測因子を特徴付けるために使用できる変数や特徴の空間は指数関数的に増大し続けている。
モデルのバイアスを損なうことなく分散を最小化する最も特徴的な特徴を特定することは、マシンラーニングモデルのトレーニングを成功させる上で非常に重要です。
論文 参考訳(メタデータ) (2021-01-23T09:24:37Z) - A Novel Community Detection Based Genetic Algorithm for Feature
Selection [3.8848561367220276]
著者らは3つのステップで機能するコミュニティ検出に基づく遺伝的アルゴリズムを提案する。
提案手法の性能から,9つのベンチマーク分類問題を解析した。
論文 参考訳(メタデータ) (2020-08-08T15:39:30Z) - Landscape-Aware Fixed-Budget Performance Regression and Algorithm
Selection for Modular CMA-ES Variants [1.0965065178451106]
市販の教師あり学習手法を用いて,高品質な性能予測が可能であることを示す。
このアプローチを,モジュール型CMA-ESアルゴリズム群から選択した,非常に類似したアルゴリズムのポートフォリオ上でテストする。
論文 参考訳(メタデータ) (2020-06-17T13:34:57Z) - Stepwise Model Selection for Sequence Prediction via Deep Kernel
Learning [100.83444258562263]
本稿では,モデル選択の課題を解決するために,新しいベイズ最適化(BO)アルゴリズムを提案する。
結果として得られる複数のブラックボックス関数の最適化問題を協調的かつ効率的に解くために,ブラックボックス関数間の潜在的な相関を利用する。
我々は、シーケンス予測のための段階的モデル選択(SMS)の問題を初めて定式化し、この目的のために効率的な共同学習アルゴリズムを設計し、実証する。
論文 参考訳(メタデータ) (2020-01-12T09:42:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。