論文の概要: Fairness-Aware Streaming Feature Selection with Causal Graphs
- arxiv url: http://arxiv.org/abs/2408.12665v1
- Date: Sat, 17 Aug 2024 00:41:02 GMT
- ステータス: 処理完了
- システム内更新日: 2024-09-01 17:02:13.124456
- Title: Fairness-Aware Streaming Feature Selection with Causal Graphs
- Title(参考訳): 因果グラフを用いた公平なストリーミング特徴選択
- Authors: Leizhen Zhang, Lusi Li, Di Wu, Sheng Chen, Yi He,
- Abstract要約: Streaming Feature Selection with Causal Fairness build causal graphs egocentric to predict label and protected feature。
ストリーミング機能研究で広く使われている5つのデータセットに対して、SFCFをベンチマークする。
- 参考スコア(独自算出の注目度): 10.644488289941021
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Its crux lies in the optimization of a tradeoff between accuracy and fairness of resultant models on the selected feature subset. The technical challenge of our setting is twofold: 1) streaming feature inputs, such that an informative feature may become obsolete or redundant for prediction if its information has been covered by other similar features that arrived prior to it, and 2) non-associational feature correlation, such that bias may be leaked from those seemingly admissible, non-protected features. To overcome this, we propose Streaming Feature Selection with Causal Fairness (SFCF) that builds two causal graphs egocentric to prediction label and protected feature, respectively, striving to model the complex correlation structure among streaming features, labels, and protected information. As such, bias can be eradicated from predictive modeling by removing those features being causally correlated with the protected feature yet independent to the labels. We theorize that the originally redundant features for prediction can later become admissible, when the learning accuracy is compromised by the large number of removed features (non-protected but can be used to reconstruct bias information). We benchmark SFCF\ on five datasets widely used in streaming feature research, and the results substantiate its performance superiority over six rival models in terms of efficiency and sparsity of feature selection and equalized odds of the resultant predictive models.
- Abstract(参考訳): その欠点は、選択された特徴部分集合上の結果モデルの正確性と公平性の間のトレードオフの最適化にある。
私たちの設定の技術的な課題は2つあります。
1)報知的特徴が先行する他の類似特徴によってその情報がカバーされた場合、予測のために陳腐化したり冗長になったりするようなストリーミング特徴入力
2)非連想的特徴相関は,非保護的と思われる特徴からバイアスが漏れる可能性がある。
そこで本稿では,予測ラベルと保護特徴に自覚的な2つの因果グラフを構築し,ストリーミング特徴,ラベル,保護情報間の複雑な相関構造をモデル化することを目的とした,因果フェアネス付きストリーミング特徴選択(SFCF)を提案する。
そのため、ラベルに依存しない保護された特徴と因果関係にある特徴を除去することにより、予測モデルからバイアスを除去することができる。
学習精度が多数の削除された特徴(非保護だがバイアス情報の再構成に使用できる)によって損なわれる場合、予測のための元の冗長な特徴が後に許容可能であることを理論化する。
ストリーミング機能研究で広く使われている5つのデータセットに対してSFCF\をベンチマークし、その結果、特徴選択の効率性や空間性、結果の予測モデルに等しい確率で、6つの競合モデルよりも性能上の優位性を実証した。
関連論文リスト
- Towards Robust Text Classification: Mitigating Spurious Correlations with Causal Learning [2.7813683000222653]
本稿では,因果関係へのモデル依存を軽減するために,因果相関ロバスト (CCR) を提案する。
CCRは、逆確率重み付け(IPW)損失関数とともに、反ファクト推論に基づく因果的特徴選択法を統合する。
グループラベルを持たないメソッド間でのCCRの最先端性能を示し、場合によってはグループラベルを利用するモデルと競合する。
論文 参考訳(メタデータ) (2024-11-01T21:29:07Z) - Spurious Feature Eraser: Stabilizing Test-Time Adaptation for Vision-Language Foundation Model [86.9619638550683]
視覚言語基礎モデルは、画像とテキストのペアデータに拡張性があるため、多数の下流タスクで顕著な成功を収めている。
しかし、これらのモデルは、決定ショートカットの結果、きめ細かな画像分類などの下流タスクに適用した場合に重大な制限を呈する」。
論文 参考訳(メタデータ) (2024-03-01T09:01:53Z) - On the Foundations of Shortcut Learning [20.53986437152018]
予測と可用性が形状モデルの特徴的利用とどのように相互作用するかを考察する。
線形モデルは比較的偏りがないが、ReLUやTanhの単位を持つ単一の隠蔽層を導入するとバイアスが生じる。
論文 参考訳(メタデータ) (2023-10-24T22:54:05Z) - Causal Feature Selection via Transfer Entropy [59.999594949050596]
因果発見は、観察データによる特徴間の因果関係を特定することを目的としている。
本稿では,前向きと後向きの機能選択に依存する新たな因果的特徴選択手法を提案する。
精度および有限サンプルの場合の回帰誤差と分類誤差について理論的に保証する。
論文 参考訳(メタデータ) (2023-10-17T08:04:45Z) - Stubborn Lexical Bias in Data and Models [50.79738900885665]
我々は、データに基づいてトレーニングされたモデルに、データのスプリアスパターンが現れるかどうかを調べるために、新しい統計手法を用いる。
トレーニングデータに*reweight*に最適化アプローチを適用し、数千のスプリアス相関を低減します。
驚くべきことに、この方法ではトレーニングデータの語彙バイアスを低減できますが、トレーニングされたモデルで対応するバイアスの強い証拠がまだ見つかっていません。
論文 参考訳(メタデータ) (2023-06-03T20:12:27Z) - On the utility of feature selection in building two-tier decision trees [0.0]
2層決定木構築における相補的特徴の相補的効果は,他の特徴によって阻害されることが示されている。
干渉機能を取り除いたり、取り除いたりすることで、最大24倍の性能を向上させることができる。
これにより、データや計算資源が十分である場合に、機能選択手法の範囲を広げることができると結論付けている。
論文 参考訳(メタデータ) (2022-12-29T20:10:45Z) - Simultaneous Improvement of ML Model Fairness and Performance by
Identifying Bias in Data [1.76179873429447]
トレーニング前にデータセットから削除すべき特定の種類のバイアスを記述したインスタンスを検出できるデータ前処理手法を提案する。
特に、類似した特徴を持つインスタンスが存在するが、保護属性の変動に起因するラベルが異なる問題設定では、固有のバイアスがデータセット内で引き起こされる、と主張する。
論文 参考訳(メタデータ) (2022-10-24T13:04:07Z) - Understanding Interlocking Dynamics of Cooperative Rationalization [90.6863969334526]
選択的合理化(Selective rationalization)は、ニューラルネットワークの出力を予測するのに十分な入力の小さなサブセットを見つけることによって、複雑なニューラルネットワークの予測を説明する。
このような合理化パラダイムでは,モデルインターロックという大きな問題が浮かび上がっている。
A2Rと呼ばれる新しい合理化フレームワークを提案し、アーキテクチャに第3のコンポーネントを導入し、選択とは対照的にソフトアテンションによって駆動される予測器を提案する。
論文 参考訳(メタデータ) (2021-10-26T17:39:18Z) - Removing Spurious Features can Hurt Accuracy and Affect Groups
Disproportionately [83.68135652247496]
自然な修正は、モデルからスプリアスな特徴を取り除くことである。
誘導バイアスによる突発的特徴の除去は精度を低下させる可能性が示唆された。
また,ロバストな自己学習によって,全体的な正確性に影響を与えずにスプリアスな特徴を除去できることを示した。
論文 参考訳(メタデータ) (2020-12-07T23:08:59Z) - Learning Causal Models Online [103.87959747047158]
予測モデルは、予測を行うためにデータの急激な相関に依存することができる。
強い一般化を達成するための一つの解決策は、モデルに因果構造を組み込むことである。
本稿では,突発的特徴を継続的に検出・除去するオンラインアルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-06-12T20:49:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。