論文の概要: Auditing Discriminatory Patterns in Mortgage Lending Through Association Rules and Fair Binning
- arxiv url: http://arxiv.org/abs/2606.12435v1
- Date: Sat, 16 May 2026 03:35:51 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-15 07:09:36.897426
- Title: Auditing Discriminatory Patterns in Mortgage Lending Through Association Rules and Fair Binning
- Title(参考訳): アソシエーション・ルールとフェア・バインニングによるモルゲンジ・レンディングの識別パターンの監査
- Authors: Archit Rathod, Dhwani Chande, Het Nagda,
- Abstract要約: 我々は、下流パターンマイニングにおいて、標準的なデータ前処理ステップ、特にバイナリ化が人種と性別の格差を増幅するかどうかを検討する。
我々の標準ビンニングは、前回の調査で報告された8-10%と一致する9.63%の人種的偏見を示している。
7つのレースグループによるフェアバイニングはエプシロン3では不可能であり、エプシロン8でのみ成功し、フェアネスの価格は29.4%である。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Mortgage lending in the United States exhibits persistent racial and gender disparities. We investigate whether standard data preprocessing steps, specifically attribute binning, amplify these disparities in downstream pattern mining. Using 103,481 cleaned mortgage applications from the HMDA 2023 dataset (Chicago metropolitan area), we build a three-stage pipeline: (1) a PySpark data cleaning and binning pipeline that implements both standard equal-frequency binning and the epsilon-biased fair binning algorithm from Asudeh et al. [1], (2) FP-Growth association rule mining that compares denial patterns under both binning regimes, and (3) K-Means clustering with a per-cluster disparate impact audit. Our standard binning shows 9.63% racial bias in income discretization, consistent with the 8-10% reported in prior work. Fair binning with seven race groups is infeasible at epsilon=0.03 and only succeeds at epsilon=0.08 with a Price of Fairness of 29.4%. FP-Growth reveals that high debt-to-income ratio is the dominant denial predictor (67.2% confidence, 2.81 lift), while racial bias does not appear as explicit high-support rules. However, K-Means clustering followed by a disparate impact audit flags 10 out of 45 cluster-group pairs, showing that Black applicants face significantly higher denial rates than White applicants even among financially similar groups.
- Abstract(参考訳): アメリカ合衆国における住宅ローンは、人種と性別の相違が続いている。
我々は、下流パターンマイニングにおけるこれらの格差を増幅する標準データ前処理ステップ、特に属性ビンニングについて検討する。
HMDA 2023データセット(シカゴ大都市圏)からの103,481個のクリーン化住宅ローンアプリケーションを用いて,(1)標準等周波数バイニングとエプシロンバイアスドフェアバイニングアルゴリズムの両方を実装したPySparkデータクリーニング・バイニングパイプライン,(2)FP-グロースアソシエーションルールマイニング,(3)クラスタごとの異なるインパクト監査を備えたK-Meansクラスタリングの3段階パイプラインを構築した。
我々の標準ビンニングは、前回の調査で報告された8-10%と一致する9.63%の人種的偏見を示している。
7つのレースグループによるフェアバイニングはエプシロン=0.03で実現できず、エプシロン=0.08でのみ成功し、フェアネスの価格は29.4%である。
FP-グロースは、高い債務対所得比率が支配的な否定的予測因子(67.2%の信頼、2.81の上昇)であることを明らかにし、一方、人種差別バイアスは明確な高支持ルールとして現れない。
しかし、K-Meansクラスタリングに続いて、45組のクラスタグループのうち10組の異なるインパクト監査フラグが発行され、黒人申請者は、経済的に類似したグループであっても、白人申請者よりもはるかに高い否定率に直面していることが示された。
関連論文リスト
- Knowledge Index of Noah's Ark [63.143852586221534]
KINAは,261分野にわたる899項目のベンチマークである。
ボーナス・オン・バートーナメントがFOSDを弱く支配していることを示す。
トップモデルであるGemini-3.1-Pro-Previewは53.17%、Claude-Opus-4.6は49.92%、GPT-5.4は48.55%に達した。
論文 参考訳(メタデータ) (2026-06-03T17:06:49Z) - Socio-Conformal Calibration in Complex Survey Data: Marginal Validity Is Not Enough for Subgroup Reliability [1.089614199781423]
我々は,Pew American Trends Panel上での5段階のAI態度予測の順序性予測について検討した。
標準コンフォメーションは4つのベース予測器全てに対して名目上の限界範囲を達成しているが、重み付けされたサブグループギャップは13ポイントである。
最強の予測者(XGBoost)にとって、モンドリアンは公平性と効率性のトレードオフを悪化させる。
グループしきい値を大域量子化に向けて縮小する正規化コンパレータは、この不安定性を緩和する。
論文 参考訳(メタデータ) (2026-05-07T01:10:48Z) - The Alignment Tax: Response Homogenization in Aligned LLMs and Its Implications for Uncertainty Estimation [1.8345614451086532]
RLHF 対応言語モデルは TruthfulQA 上で応答均質化を示す。
40-79%の質問は、10のi.i.d.サンプルに対して単一のセマンティッククラスタを生成する。
論文 参考訳(メタデータ) (2026-03-25T09:35:15Z) - When Names Change Verdicts: Intervention Consistency Reveals Systematic Bias in LLM Decision-Making [0.0]
ICE-Guardは、3種類の突発的な機能依存を検出するために介入整合性テストを適用するフレームワークである。
10領域にわたる11大言語モデル(LLM)を評価した。
本研究では,ICE誘導型検出・診断・緩和・検証ループを用いて,累積78%のバイアス低減を実現した。
論文 参考訳(メタデータ) (2026-03-19T06:21:08Z) - AttentiveGRUAE: An Attention-Based GRU Autoencoder for Temporal Clustering and Behavioral Characterization of Depression from Wearable Data [46.262619407930266]
本稿では,時間的クラスタリングと縦型ウェアラブルデータによる結果の予測を目的とした,新しい注意型ゲートリカレントユニット(GRU)オートエンコーダであるAttentiveGRUAEを提案する。
372名(GLOBEM 2018-2019)の長期睡眠データからAttentiveGRUAEを評価する。
これは、クラスタリングの品質と抑うつの分類の両方において、ベースラインクラスタリング、ドメイン指向の自己教師付きモデル、および改善されたモデルよりも優れたパフォーマンスを示す。
論文 参考訳(メタデータ) (2025-10-02T20:52:16Z) - An Auditable Pipeline for Fuzzy Full-Text Screening in Systematic Reviews: Integrating Contrastive Semantic Highlighting and LLM Judgment [0.0]
フルテキストのスクリーニングは、体系的なレビューの大きなボトルネックです。
私たちは、ファジィな決定問題として包摂/排除を再設計する、スケーラブルで監査可能なパイプラインを提示します。
論文 参考訳(メタデータ) (2025-08-17T17:41:50Z) - Latent Imitator: Generating Natural Individual Discriminatory Instances
for Black-Box Fairness Testing [45.183849487268496]
本稿では、より自然な個人識別インスタンスを生成するために、LIMI(Latent Imitator)というフレームワークを提案する。
まず、対象モデルの決定境界を近似するために、代理線形境界を導出する。
次に、1ステップの運動で代理境界にランダムな潜伏ベクトルを演算し、さらにベクトル計算を行い、2つの潜在的な識別候補を探索する。
論文 参考訳(メタデータ) (2023-05-19T11:29:13Z) - On Comparing Fair Classifiers under Data Bias [42.43344286660331]
本研究では,データ偏差の変化が公正分類器の精度と公平性に及ぼす影響について検討する。
我々の実験は、既存のフェアネスダッシュボードにデータバイアスリスクの尺度を統合する方法を示している。
論文 参考訳(メタデータ) (2023-02-12T13:04:46Z) - Algorithmic Fairness and Vertical Equity: Income Fairness with IRS Tax
Audit Models [73.24381010980606]
本研究は、IRSによる税務監査選択を通知するシステムの文脈におけるアルゴリズムフェアネスの問題について検討する。
監査を選択するための柔軟な機械学習手法が、垂直エクイティにどのように影響するかを示す。
この結果は,公共セクター全体でのアルゴリズムツールの設計に影響を及ぼす。
論文 参考訳(メタデータ) (2022-06-20T16:27:06Z) - Counterfactual Fairness in Mortgage Lending via Matching and
Randomization [0.0]
我々は、反ファクトフェアネスの枠組みを使って、公正な機械学習モデルを訓練する。
マッチングを用いてバランスの取れたデータを持つことは、完全な反ファクトフェアネスを保証するものではないことを示す。
論文 参考訳(メタデータ) (2021-12-03T21:59:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。