論文の概要: FairTree: Subgroup Fairness Auditing of Machine Learning Models with Bias-Variance Decomposition
- arxiv url: http://arxiv.org/abs/2604.19357v1
- Date: Tue, 21 Apr 2026 11:38:59 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-22 22:41:49.745687
- Title: FairTree: Subgroup Fairness Auditing of Machine Learning Models with Bias-Variance Decomposition
- Title(参考訳): FairTree: バイアス分散を考慮した機械学習モデルのサブグループフェアネス監査
- Authors: Rudolf Debelak,
- Abstract要約: 心理学的不変性テストに適応した新しいアルゴリズムであるFairTreeを紹介する。
識別することなく、連続的、分類的、順序的な特徴を扱う。
性能格差を系統的バイアスと分散に分解し、アルゴリズム性能の変化の分類を可能にする。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The evaluation of machine learning models typically relies mainly on performance metrics based on loss functions, which risk to overlook changes in performance in relevant subgroups. Auditing tools such as SliceFinder and SliceLine were proposed to detect such groups, but usually have conceptual disadvantages, such as the inability to directly address continuous covariates. In this paper, we introduce FairTree, a novel algorithm adapted from psychometric invariance testing. Unlike SliceFinder and related algorithms, FairTree directly handles continuous, categorical, and ordinal features without discretization. It further decomposes performance disparities into systematic bias and variance, allowing a categorization of changes in algorithm performance. We propose and evaluate two variations of the algorithm: a permutation-based approach, which is conceptually closer to SliceFinder, and a fluctuation test. Through simulation studies that include a direct comparison with SliceLine, we demonstrate that both approaches have a satisfactory rate of false-positive results, but that the fluctuation approach has relatively higher power. We further illustrate the method on the UCI Adult Census dataset. The proposed algorithms provide a flexible framework for the statistical evaluation of the performance and aspects of fairness of machine learning models in a wide range of applications even in relatively small data.
- Abstract(参考訳): 機械学習モデルの評価は、主に損失関数に基づくパフォーマンス指標に依存しており、関連するサブグループのパフォーマンスの変化を見逃すリスクがある。
SliceFinderやSliceLineのような監査ツールはそのようなグループを検出するために提案されたが、通常は連続した共変量に直接対処できないような概念上の欠点がある。
本稿では,心理学的不変性テストに適応した新しいアルゴリズムであるFairTreeを紹介する。
SliceFinderや関連するアルゴリズムとは異なり、FairTreeは離散化せずに、連続的、分類的、順序的な機能を直接処理する。
さらに、性能格差を体系的なバイアスと分散に分解し、アルゴリズム性能の変化の分類を可能にする。
本稿では,SliceFinderに近い置換型アプローチと揺らぎテストという,アルゴリズムの2つのバリエーションを提案し,評価する。
SliceLineと直接比較するシミュレーション研究を通じて、どちらの手法も偽陽性の結果の満足度が高いが、揺らぎアプローチは比較的高いパワーを持つことを示した。
さらに,UCIアダルト・センサス・データセットの手法について述べる。
提案アルゴリズムは、比較的小さなデータであっても、幅広いアプリケーションにおいて機械学習モデルの性能と公平性の統計的評価のための柔軟なフレームワークを提供する。
関連論文リスト
- An Enhanced Projection Pursuit Tree Classifier with Visual Methods for Assessing Algorithmic Improvements [0.3610948254980783]
視覚的診断手法を開発し,拡張が意図通りに機能することを確認する。
インタラクティブなWebアプリケーションにより、ユーザーは制御されたシナリオの下で、オリジナルと拡張された分類器の両方の振る舞いを探索できる。
論文 参考訳(メタデータ) (2026-02-24T17:27:17Z) - Dynamic Classification: Leveraging Self-Supervised Classification to Enhance Prediction Performance [2.2736104746143355]
本稿では,ゼロミス検出と最小偽陽性を実現することを目的とした,革新的な動的分類アルゴリズムを提案する。
このアルゴリズムはデータを自己教師付き学習生成方式で分割し、モデルがトレーニングセットから学習できるようにする。
実験結果から,データ分割誤差が最小限であれば,アルゴリズムは例外的な性能を達成できることがわかった。
論文 参考訳(メタデータ) (2025-02-26T07:11:12Z) - RHiOTS: A Framework for Evaluating Hierarchical Time Series Forecasting Algorithms [0.393259574660092]
RHiOTSは、階層的な時系列予測モデルとアルゴリズムを実世界のデータセット上で堅牢性を評価するように設計されている。
RHiOTSは、複雑な多次元ロバストネス評価結果を直感的で容易に解釈可能なビジュアルに変換する革新的な可視化コンポーネントを組み込んでいる。
従来の統計的手法は、変換効果が非常に破壊的である場合を除き、最先端のディープラーニングアルゴリズムよりも頑健であることを示す。
論文 参考訳(メタデータ) (2024-08-06T18:52:15Z) - Bipartite Ranking Fairness through a Model Agnostic Ordering Adjustment [54.179859639868646]
本稿では,二部類ランキングにおける公平性を実現するためのモデルに依存しない後処理フレームワークxOrderを提案する。
xOrderは、教師なしおよび教師なしの公正度メトリックを含む、さまざまな分類モデルとランキングフェアネスメトリクスと互換性がある。
提案アルゴリズムを,4つのベンチマークデータセットと2つの実世界の患者電子健康記録リポジトリ上で評価した。
論文 参考訳(メタデータ) (2023-07-27T07:42:44Z) - Towards Diverse Evaluation of Class Incremental Learning: A Representation Learning Perspective [67.45111837188685]
クラスインクリメンタル学習(CIL)アルゴリズムは、インクリメンタルに到着したデータから新しいオブジェクトクラスを継続的に学習することを目的としている。
表現学習における様々な評価プロトコルを用いて,CILアルゴリズムによって訓練されたニューラルネットワークモデルを実験的に解析する。
論文 参考訳(メタデータ) (2022-06-16T11:44:11Z) - Scalable Personalised Item Ranking through Parametric Density Estimation [53.44830012414444]
暗黙のフィードバックから学ぶことは、一流問題の難しい性質のために困難です。
ほとんどの従来の方法は、一級問題に対処するためにペアワイズランキングアプローチとネガティブサンプラーを使用します。
本論文では,ポイントワイズと同等の収束速度を実現する学習対ランクアプローチを提案する。
論文 参考訳(メタデータ) (2021-05-11T03:38:16Z) - Can Active Learning Preemptively Mitigate Fairness Issues? [66.84854430781097]
データセットバイアスは、機械学習における不公平な原因の1つです。
不確実性に基づくALで訓練されたモデルが保護クラスの決定において公平であるかどうかを検討する。
また,勾配反転(GRAD)やBALDなどのアルゴリズム的公正性手法の相互作用についても検討する。
論文 参考訳(メタデータ) (2021-04-14T14:20:22Z) - Greedy Search Algorithms for Unsupervised Variable Selection: A
Comparative Study [3.4888132404740797]
本稿では,非監視変数選択に基づく次元還元について述べる。
本稿では,7つの非監視勾配変数選択アルゴリズムの臨界評価について述べる。
本稿では,FSCA(Forward selection component analysis)アルゴリズムで説明された分散の遅延実装を初めて導入し,評価する。
論文 参考訳(メタデータ) (2021-03-03T21:10:26Z) - Theoretical Insights Into Multiclass Classification: A High-dimensional
Asymptotic View [82.80085730891126]
線形多クラス分類の最初の現代的精度解析を行う。
分析の結果,分類精度は分布に依存していることがわかった。
得られた洞察は、他の分類アルゴリズムの正確な理解の道を開くかもしれない。
論文 参考訳(メタデータ) (2020-11-16T05:17:29Z) - Towards Model-Agnostic Post-Hoc Adjustment for Balancing Ranking
Fairness and Algorithm Utility [54.179859639868646]
Bipartiteランキングは、ラベル付きデータから正の個人よりも上位の個人をランク付けするスコアリング機能を学ぶことを目的としている。
学習したスコアリング機能が、異なる保護グループ間で体系的な格差を引き起こすのではないかという懸念が高まっている。
本稿では、二部構成のランキングシナリオにおいて、それらのバランスをとるためのモデル後処理フレームワークを提案する。
論文 参考訳(メタデータ) (2020-06-15T10:08:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。