論文の概要: Fair Data Pre-Processing with Imperfect Attribute Space
- arxiv url: http://arxiv.org/abs/2603.26456v1
- Date: Fri, 27 Mar 2026 14:27:13 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-30 21:49:48.537097
- Title: Fair Data Pre-Processing with Imperfect Attribute Space
- Title(参考訳): 不完全な属性空間による公正なデータ事前処理
- Authors: Ying Zheng, Yangfan Jiang, Kian-Lee Tan,
- Abstract要約: LatentPreは、実用的な設定で、原則付きで堅牢な公正なデータ処理を可能にする新しいフレームワークである。
LatentPreは、必須だが微妙な信号をキャプチャする潜在属性でフェアネスポリシーを強化する。
実験によると、LatentPreはさまざまなシナリオで強い公平性とユーティリティのトレードオフを一貫して達成している。
- 参考スコア(独自算出の注目度): 9.017721212703352
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Fair data pre-processing is a widely used strategy for mitigating bias in machine learning. A promising line of research focuses on calibrating datasets to satisfy a designed fairness policy so that sensitive attributes influence outcomes only through clearly specified legitimate causal pathways. While effective on clean and information-rich data, these methods often break down in real-world scenarios with imperfect attribute spaces, where decision-relevant factors may be deemed unusable or even missing. To address this gap, we propose LatentPre, a novel framework that enables principled and robust fair data processing in practical settings. Instead of relying solely on observed attributes, LatentPre augments the fairness policy with latent attributes that capture essential but subtle signals, enabling the framework to operate as if the attribute space were perfect. These latent attributes are strategically introduced to guarantee identifiability and are estimated using a tailored expectation-maximization paradigm. The raw data is then carefully refined to conform to this latent-augmented policy, effectively removing biased patterns while preserving justifiable ones. Extensive experiments demonstrate that LatentPre consistently achieves strong fairness-utility trade-offs across diverse scenarios, advancing practical fairness-aware data management.
- Abstract(参考訳): 公正なデータ前処理は、機械学習におけるバイアスを軽減するために広く利用されている戦略である。
有望な研究のラインは、デザインされた公正性ポリシーを満たすためにデータセットを校正することに焦点を当て、センシティブな属性が明確な因果経路を通してのみ結果に影響を与えるようにしている。
クリーンで情報豊富なデータに効果があるが、これらの手法は不完全な属性空間を持つ現実世界のシナリオでしばしば分解される。
このギャップに対処するため,本研究では,実践的な設定において,原則的かつ堅牢な公正データ処理を可能にする新しいフレームワークであるLatentPreを提案する。
LatentPreは、観察された属性のみに頼る代わりに、必須だが微妙なシグナルをキャプチャする潜在属性でフェアネスポリシーを拡張し、フレームワークがまるで属性空間が完璧であるかのように動作するようにする。
これらの潜在属性は、識別可能性を保証するために戦略的に導入され、調整された期待-最大化パラダイムを用いて推定される。
生データは、この潜伏増強されたポリシーに適合するように慎重に精査され、正当性のあるものを保持しながら、バイアスパターンを効果的に除去する。
大規模な実験では、LatentPreはさまざまなシナリオで強い公正性とユーティリティのトレードオフを一貫して達成し、実践的公正を意識したデータ管理を推進している。
関連論文リスト
- Understanding Fairness and Prediction Error through Subspace Decomposition and Influence Analysis [20.446739075831722]
本稿では,データ表現を調整し,予測ユーティリティと公正性のバランスをとるためのフレームワークを提案する。
本稿では,共有部分空間が付加されるにつれて,予測誤差と公平性ギャップがどのように進化するかを理論的に分析する。
提案手法は, 予測性能を維持しつつ, 公平性を効果的に向上することを示す。
論文 参考訳(メタデータ) (2025-10-27T23:38:00Z) - Targeted Learning for Data Fairness [52.59573714151884]
データ生成プロセス自体の公平性を評価することにより、公平性推論を拡張する。
我々は、人口統計学的平等、平等機会、条件付き相互情報から推定する。
提案手法を検証するため,いくつかのシミュレーションを行い,実データに適用する。
論文 参考訳(メタデータ) (2025-02-06T18:51:28Z) - Identifying and Mitigating Social Bias Knowledge in Language Models [52.52955281662332]
個々人の社会的偏見をきめ細かなキャリブレーションを可能にする新しいデバイアス・アプローチであるFairness Stamp(FAST)を提案する。
FASTは最先端のベースラインを超え、デバイアス性能が優れている。
これは、大きな言語モデルにおける公平性を達成するためのきめ細かいデバイアス戦略の可能性を強調している。
論文 参考訳(メタデータ) (2024-08-07T17:14:58Z) - A Sequentially Fair Mechanism for Multiple Sensitive Attributes [0.46040036610482665]
アルゴリズムフェアネスの標準的なユースケースでは、感度変数と対応するスコアの関係を排除することが目標である。
センシティブな特徴の集合にまたがって、段階的に公平性を達成できるシーケンシャルなフレームワークを提案する。
当社のアプローチは、リスクと不公平の間のトレードオフを緩和するフレームワークを包含することで、公平性をシームレスに拡張します。
論文 参考訳(メタデータ) (2023-09-12T22:31:57Z) - Fairness Under Demographic Scarce Regime [7.523105080786704]
フェアネスと精度のトレードオフを改善する属性分類器を構築するためのフレームワークを提案する。
不確実な感度特性を持つ試料に公正性制約を課すことは、公正性-正確性トレードオフに悪影響を及ぼす可能性があることを示す。
我々のフレームワークは、ほとんどのベンチマークで真に敏感な属性に対する公平性制約で訓練されたモデルより優れている。
論文 参考訳(メタデータ) (2023-07-24T19:07:34Z) - Learning for Counterfactual Fairness from Observational Data [62.43249746968616]
公正な機械学習は、人種、性別、年齢などの特定の保護された(感受性のある)属性によって記述されるある種のサブグループに対して、学習モデルのバイアスを取り除くことを目的としている。
カウンターファクトフェアネスを達成するための既存の手法の前提条件は、データに対する因果モデルの事前の人間の知識である。
本研究では,新しいフレームワークCLAIREを提案することにより,因果関係を付与せずに観測データから対実的に公正な予測を行う問題に対処する。
論文 参考訳(メタデータ) (2023-07-17T04:08:29Z) - Towards Assumption-free Bias Mitigation [47.5131072745805]
本稿では,バイアス緩和のための特徴相互作用をモデル化することにより,関連する属性を自動的に検出する仮定フリーフレームワークを提案する。
4つの実世界のデータセットに対する実験結果から,提案手法が不公平な予測行動を著しく軽減できることが示された。
論文 参考訳(メタデータ) (2023-07-09T05:55:25Z) - Practical Approaches for Fair Learning with Multitype and Multivariate
Sensitive Attributes [70.6326967720747]
現実世界に展開された機械学習アルゴリズムが不公平さや意図しない社会的結果をもたらすことはないことを保証することが重要である。
本稿では,カーネルHilbert Spacesの相互共分散演算子上に構築されたフェアネス尺度であるFairCOCCOを紹介する。
実世界のデータセットにおける予測能力と公正性のバランスをとる上で、最先端技術に対する一貫した改善を実証的に示す。
論文 参考訳(メタデータ) (2022-11-11T11:28:46Z) - Causal Feature Selection for Algorithmic Fairness [61.767399505764736]
データ管理の統合コンポーネントにおける公平性について検討する。
本稿では,データセットの公平性を保証する特徴のサブコレクションを同定する手法を提案する。
論文 参考訳(メタデータ) (2020-06-10T20:20:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。