論文の概要: Fairness Audits of Institutional Risk Models in Deployed ML Pipelines
- arxiv url: http://arxiv.org/abs/2604.19468v1
- Date: Tue, 21 Apr 2026 13:50:43 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-22 22:41:49.792402
- Title: Fairness Audits of Institutional Risk Models in Deployed ML Pipelines
- Title(参考訳): 展開MLパイプラインにおける施設リスクモデルの公正監査
- Authors: Kelly McConvey, Dipto Das, Maya Ghai, Angelina Zhai, Rosa Lee, Shion Guha,
- Abstract要約: 本稿では,制度的なトレーニングデータと設計仕様を用いたEWS(Early Warning System)のレプリカベースの監査について述べる。
本研究は,全パイプラインにおける性別,年齢,居住状況による格差を評価した。
後処理は、不均一な確率をパーセンタイルベースのリスク層に分解することで、これらの格差を増幅する。
- 参考スコア(独自算出の注目度): 17.015521443271115
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Fairness audits of institutional risk models are critical for understanding how deployed machine learning pipelines allocate resources. Drawing on multi-year collaboration with Centennial College, where our prior ethnographic work introduced the ASP-HEI Cycle, we present a replica-based audit of a deployed Early Warning System (EWS), replicating its model using institutional training data and design specifications. We evaluate disparities by gender, age, and residency status across the full pipeline (training data, model predictions, and post-processing) using standard fairness metrics. Our audit reveals systematic misallocation: younger, male, and international students are disproportionately flagged for support, even when many ultimately succeed, while older and female students with comparable dropout risk are under-identified. Post-processing amplifies these disparities by collapsing heterogeneous probabilities into percentile-based risk tiers. This work provides a replicable methodology for auditing institutional ML systems and shows how disparities emerge and compound across stages, highlighting the importance of evaluating construct validity alongside statistical fairness. It contributes one empirical thread to a broader program investigating algorithms, student data, and power in higher education.
- Abstract(参考訳): 機関的リスクモデルの公正監査は、デプロイされた機械学習パイプラインがリソースを割り当てる方法を理解する上で重要である。
我々は,ASP-HEIサイクルを導入したセンテニアル・カレッジとの複数年にわたるコラボレーションに基づいて,EWS(Early Warning System)のレプリカベースの監査を行い,制度的なトレーニングデータと設計仕様を用いてモデルを複製した。
標準的な公正度指標を用いて、全パイプライン(トレーニングデータ、モデル予測、後処理)における性別、年齢、居住状況による格差を評価する。
若年、男性、および海外の学生は、最終的に多くの学生が成功したとしても、サポートのために不当にフラグを立てている一方、ドロップアウトリスクに匹敵する高齢者と女子の学生は、未確認のままである。
後処理は、不均一な確率をパーセンタイルベースのリスク層に分解することで、これらの格差を増幅する。
本研究は,制度的MLシステム監査のための再現可能な方法論を提供し,統計的公正性とともに構成妥当性を評価することの重要性を強調した。
これは、高等教育におけるアルゴリズム、学生データ、パワーを調査する広範なプログラムに、実証的な一スレッドを貢献する。
関連論文リスト
- Reliable and Reproducible Demographic Inference for Fairness in Face Analysis [63.46525489354455]
本稿では、従来のエンドツーエンドトレーニングをモジュラートランスファー学習アプローチで置き換える、完全に再現可能なDAIパイプラインを提案する。
このパイプラインは、正確性、公正性、そしてアイデンティティ内整合性によって定義される、新たに導入された堅牢性の概念の3つの次元にわたって監査する。
以上の結果から,提案手法は特に民族性において,強い基準線を上回り,その特性はより困難であることが示唆された。
論文 参考訳(メタデータ) (2025-10-23T12:22:02Z) - Evaluating Federated Learning for At-Risk Student Prediction: A Comparative Analysis of Model Complexity and Data Balancing [0.07161783472741748]
本研究は,リスクの高い学生を積極的に識別するフェデレートラーニング(FL)フレームワークを提案し,検証する。
FLは、学生データ主権を本質的に尊重する早期警戒システムのための実用的でスケーラブルなソリューションである。
論文 参考訳(メタデータ) (2025-08-23T19:58:16Z) - Modelling higher education dropouts using sparse and interpretable post-clustering logistic regression [0.8437187555622164]
高等教育のドロップアウトは、世界中の第三次教育システムにとって重要な課題である。
本稿では,ロジスティック回帰の特殊形式として,大学ドロップアウト分析の文脈に特化して導入したモデルについて述べる。
論文 参考訳(メタデータ) (2025-05-12T14:05:23Z) - Data vs. Model Machine Learning Fairness Testing: An Empirical Study [23.535630175567146]
モデルトレーニング前後の公平性をテストすることによって、より包括的なアプローチを評価するための第一歩を踏み出します。
モデル依存度と独立公平度の関係を実証的に分析し,提案手法の有効性を評価する。
以上の結果から, トレーニング前の公平性テストは, バイアスデータ収集プロセスの早期取得において, より安価かつ効果的な手段であることが示唆された。
論文 参考訳(メタデータ) (2024-01-15T14:14:16Z) - Bias and Fairness in Large Language Models: A Survey [73.87651986156006]
本稿では,大規模言語モデル(LLM)のバイアス評価と緩和手法に関する総合的な調査を行う。
まず、自然言語処理における社会的偏見と公平性の概念を統合し、形式化し、拡張する。
次に,3つの直感的な2つのバイアス評価法と1つの緩和法を提案し,文献を統一する。
論文 参考訳(メタデータ) (2023-09-02T00:32:55Z) - Cross-Institutional Transfer Learning for Educational Models:
Implications for Model Performance, Fairness, and Equity [8.762925492954777]
本研究では,高等教育における経験的ケーススタディを通したクロス・インスティカル・ラーニングについて検討する。
実世界のデータ共有制約とモデル共有制約の下でのクロス機関間転送の実現可能性について検討する。
数十のモデルと転送スキームで評価された公正さと正確さのトレードオフの証拠は見つからない。
論文 参考訳(メタデータ) (2023-05-01T16:27:49Z) - A Domain-Agnostic Approach for Characterization of Lifelong Learning
Systems [128.63953314853327]
「生涯学習」システムには,1)継続的学習,2)伝達と適応,3)拡張性があります。
この一連のメトリクスは、様々な複雑な生涯学習システムの開発に役立てることができることを示す。
論文 参考訳(メタデータ) (2023-01-18T21:58:54Z) - Investigating Fairness Disparities in Peer Review: A Language Model
Enhanced Approach [77.61131357420201]
我々は、大規模言語モデル(LM)の助けを借りて、ピアレビューにおける公平性格差の徹底した厳密な研究を行う。
我々は、2017年から現在までのICLR(International Conference on Learning Representations)カンファレンスで、包括的なリレーショナルデータベースを収集、組み立て、維持しています。
我々は、著作者性別、地理、著作者、機関的名声など、興味のある複数の保護属性に対する公平性の違いを仮定し、研究する。
論文 参考訳(メタデータ) (2022-11-07T16:19:42Z) - Detecting discriminatory risk through data annotation based on Bayesian
inferences [5.017973966200985]
本稿では,与えられたデータセットの判別結果のリスクについて警告することを目的としたデータアノテーション手法を提案する。
機械学習コミュニティが一般的にアクセスする3つのデータセット上で,我々のシステムを実証的にテストする。
論文 参考訳(メタデータ) (2021-01-27T12:43:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。