論文の概要: Do Fair Models Reason Fairly? Counterfactual Explanation Consistency for Procedural Fairness in Credit Decisions
- arxiv url: http://arxiv.org/abs/2605.12701v1
- Date: Tue, 12 May 2026 19:54:25 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-14 23:30:27.65636
- Title: Do Fair Models Reason Fairly? Counterfactual Explanation Consistency for Procedural Fairness in Credit Decisions
- Title(参考訳): フェアモデルは公正か?信用決定における手続き的フェアネスの対実的説明整合性
- Authors: Gideon Popoola, John Sheppard,
- Abstract要約: 既存の結果フェアモデルは、個人に対して根本的に異なる推論を適用可能であることを示す。
本稿では,このバイアスを検出し緩和するフレームワークであるCECを提案する。
主なコントリビューションには、最寄りのカウンターファクト生成方法、統合勾配比較のための修正ベースライン、およびそれに対応するトレーニング損失が含まれる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Machine learning algorithms in socially sensitive domains (e.g., credit decisions) often focus on equalizing predictive outcomes. However, satisfying these metrics does not guarantee that models use the same reasoning for different groups. We show that existing outcome-fair models can still apply fundamentally different reasoning to individuals, a ``hidden procedural bias'' missed by standard fairness metrics and algorithms. We propose Counterfactual Explanation Consistency (CEC), a framework that detects and mitigates this bias by aligning feature attributions between individuals and their counterfactual counterparts. Key contributions include a nearest-neighbor counterfactual generation method, a modified baseline for integrated gradient comparisons, an individual-level procedural fairness metric, and a corresponding training loss. We introduce a taxonomy identifying ``Regime B'' (same outcome, different reasoning) as a critical blind spot. Experiments on synthetic data, German Credit, Adult Income, and HMDA mortgage data demonstrate that outcome-fair baselines exhibit substantial hidden bias, while CEC substantially reduces it with modest utility cost.
- Abstract(参考訳): 社会的に敏感なドメイン(例えば信用決定)における機械学習アルゴリズムは、予測結果の等化に重点を置いていることが多い。
しかし、これらの指標を満たすことは、モデルが異なるグループに対して同じ推論を使用することを保証しない。
既存の結果フェアモデルは、標準的な公正度指標やアルゴリズムが見逃した‘隠れた手続きバイアス’である、個人に対して根本的に異なる推論を適用可能であることを示す。
本稿では, 個人と相手の属性を一致させることにより, このバイアスを検出し緩和するフレームワークであるCECを提案する。
主な貢献は、最寄りの対実生成方法、統合的な勾配比較のための修正ベースライン、個別レベルの手続き的公正度メートル法、およびそれに対応するトレーニング損失である。
そこで我々は,<regime B''(結果,異なる推論)を重要な盲点とみなす分類法を導入する。
合成データ、ドイツ信用、アダルト所得、およびHMDA住宅ローンに関する実験は、結果公正基準線がかなり隠れたバイアスを示す一方で、CECは質素なユーティリティコストでそれを大幅に削減することを示した。
関連論文リスト
- CDRRM: Contrast-Driven Rubric Generation for Reliable and Interpretable Reward Modeling [61.75914342638658]
CDRRM(Contrast-Driven Reward Model)は、高品質なルーリック生成と優先判断のためのフレームワークである。
この作業は、報酬モデリングのためのスケーラブルで解釈可能で、データ効率のよいパスを提供する。
論文 参考訳(メタデータ) (2026-03-09T07:15:23Z) - On the use of graph models to achieve individual and group fairness [0.6299766708197883]
我々は、動的システムとホモロジーに基づくツールを活用して公平性をモデル化するための、せん断拡散に基づく理論的枠組みを提供する。
本稿では,異なる公平度尺度を扱うネットワークトポロジの集合について述べる。
本稿では,提案モデルの性能を,精度と公平性の観点から示す。
論文 参考訳(メタデータ) (2026-01-13T18:17:43Z) - Identifying and Mitigating Social Bias Knowledge in Language Models [52.52955281662332]
個々人の社会的偏見をきめ細かなキャリブレーションを可能にする新しいデバイアス・アプローチであるFairness Stamp(FAST)を提案する。
FASTは最先端のベースラインを超え、デバイアス性能が優れている。
これは、大きな言語モデルにおける公平性を達成するためのきめ細かいデバイアス戦略の可能性を強調している。
論文 参考訳(メタデータ) (2024-08-07T17:14:58Z) - Evaluating the Fairness of Discriminative Foundation Models in Computer
Vision [51.176061115977774]
本稿では,CLIP (Contrastive Language-Pretraining) などの差別基盤モデルのバイアス評価のための新しい分類法を提案する。
そして、これらのモデルにおけるバイアスを緩和するための既存の手法を分類学に関して体系的に評価する。
具体的には,ゼロショット分類,画像検索,画像キャプションなど,OpenAIのCLIPとOpenCLIPモデルをキーアプリケーションとして評価する。
論文 参考訳(メタデータ) (2023-10-18T10:32:39Z) - DualFair: Fair Representation Learning at Both Group and Individual
Levels via Contrastive Self-supervision [73.80009454050858]
この研究は、DualFairと呼ばれる自己教師型モデルを提示し、学習された表現から性別や人種などのセンシティブな属性をデバイアスすることができる。
我々のモデルは、グループフェアネスと対実フェアネスという2つのフェアネス基準を共同で最適化する。
論文 参考訳(メタデータ) (2023-03-15T07:13:54Z) - Arbitrariness and Social Prediction: The Confounding Role of Variance in
Fair Classification [31.392067805022414]
異なる訓練されたモデル間での予測のばらつきは、公正なバイナリ分類における重要な、未探索のエラーの原因である。
実際には、いくつかのデータ例のばらつきは非常に大きいので、決定を効果的に任意にすることができる。
予測が任意である場合に分類を省略するアンサンブルアルゴリズムを開発した。
論文 参考訳(メタデータ) (2023-01-27T06:52:04Z) - D-BIAS: A Causality-Based Human-in-the-Loop System for Tackling
Algorithmic Bias [57.87117733071416]
D-BIASは、人間のループ内AIアプローチを具現化し、社会的バイアスを監査し軽減する視覚対話型ツールである。
ユーザは、因果ネットワークにおける不公平な因果関係を識別することにより、グループに対する偏見の存在を検出することができる。
それぞれのインタラクション、例えばバイアスのある因果縁の弱体化/削除は、新しい(偏りのある)データセットをシミュレートするために、新しい方法を用いている。
論文 参考訳(メタデータ) (2022-08-10T03:41:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。