論文の概要: Identifying Biased Subgroups in Ranking and Classification
- arxiv url: http://arxiv.org/abs/2108.07450v1
- Date: Tue, 17 Aug 2021 05:26:11 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-18 13:05:09.254452
- Title: Identifying Biased Subgroups in Ranking and Classification
- Title(参考訳): ランク付け・分類におけるバイアス付き部分群の同定
- Authors: Eliana Pastor, Luca de Alfaro, Elena Baralis
- Abstract要約: 性能差を測定するために分散の概念を導入する。
我々は、(i)分類モデルと(ii)ランキングアプリケーションという文脈でこれを活用します。
我々は,データサブグループ内のすべての属性の分散挙動への寄与を,シェープリー値を用いて定量化する。
- 参考スコア(独自算出の注目度): 12.268135088806613
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: When analyzing the behavior of machine learning algorithms, it is important
to identify specific data subgroups for which the considered algorithm shows
different performance with respect to the entire dataset. The intervention of
domain experts is normally required to identify relevant attributes that define
these subgroups.
We introduce the notion of divergence to measure this performance difference
and we exploit it in the context of (i) classification models and (ii) ranking
applications to automatically detect data subgroups showing a significant
deviation in their behavior. Furthermore, we quantify the contribution of all
attributes in the data subgroup to the divergent behavior by means of Shapley
values, thus allowing the identification of the most impacting attributes.
- Abstract(参考訳): 機械学習アルゴリズムの振る舞いを分析する際には,そのアルゴリズムがデータセット全体に対して異なる性能を示す特定のデータサブグループを特定することが重要である。
ドメインエキスパートの介入は通常、これらのサブグループを定義する関連する属性を特定する必要がある。
この性能差を測定するために発散の概念を導入し, (i) 分類モデルと (ii) ランク付けアプリケーションを用いて, 行動に著しい偏差を示すデータサブグループを自動的に検出する。
さらに,shapley値を用いて,データサブグループ内のすべての属性の分散行動への寄与度を定量化し,最も影響の大きい属性の同定を可能にする。
関連論文リスト
- From A-to-Z Review of Clustering Validation Indices [4.08908337437878]
我々は、最も一般的なクラスタリングアルゴリズムを用いて、内部および外部クラスタリング検証指標の性能をレビューし、評価する。
内部クラスタリング検証と外部クラスタリング検証の両方の機能を調べるための分類フレームワークを提案する。
論文 参考訳(メタデータ) (2024-07-18T13:52:02Z) - A structured regression approach for evaluating model performance across intersectional subgroups [53.91682617836498]
分散評価(disaggregated evaluation)は、AIフェアネスアセスメントにおける中心的なタスクであり、AIシステムのさまざまなサブグループ間でのパフォーマンスを測定することを目的としている。
非常に小さなサブグループであっても,信頼性の高いシステム性能推定値が得られることを示す。
論文 参考訳(メタデータ) (2024-01-26T14:21:45Z) - Outlier detection using flexible categorisation and interrogative
agendas [42.321011564731585]
与えられたオブジェクトの集合を分類する方法は、それらを分類するのに使用される機能の集合の選択に依存する。
まず,異なるアジェンダから生じる分類を用いて,外乱検出のための単純な教師なしFCAベースのアルゴリズムを開発する。
次に、重みや質量の異なる特徴の集合として分類する適切なアジェンダを学習するための教師付きメタ学習アルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-12-19T10:05:09Z) - Leveraging Structure for Improved Classification of Grouped Biased Data [8.121462458089143]
データポイントが自然にグループ化されるアプリケーションに対する半教師付きバイナリ分類を検討する。
我々は、この構造を明示的に活用し、最適、グループ対応、確率出力の分類器を学習する半教師付きアルゴリズムを導出する。
論文 参考訳(メタデータ) (2022-12-07T15:18:21Z) - Subgroup Discovery in Unstructured Data [7.6323763630645285]
サブグループ発見は知識発見と仮説生成に多くの応用がある。
サブグループ対応変分オートエンコーダは、より高い品質のサブグループにつながる非構造化データの表現を学習する。
論文 参考訳(メタデータ) (2022-07-15T23:13:54Z) - Estimating Structural Disparities for Face Models [54.062512989859265]
機械学習では、異なるサブ人口間でのモデルの性能や結果の差を測定することで、しばしば異質度の測定が定義される。
本研究では、人間の顔に訓練されたコンピュータビジョンモデルや、顔属性予測や影響推定などのタスクについて、そのような分析を行う。
論文 参考訳(メタデータ) (2022-04-13T05:30:53Z) - Towards Group Robustness in the presence of Partial Group Labels [61.33713547766866]
入力サンプルとターゲットラベルの間に 急激な相関関係がある ニューラルネットワークの予測を誤った方向に導く
本稿では,制約セットから最悪のグループ割り当てを最適化するアルゴリズムを提案する。
グループ間で総合的な集計精度を維持しつつ,少数集団のパフォーマンス向上を示す。
論文 参考訳(メタデータ) (2022-01-10T22:04:48Z) - Representation Matters: Assessing the Importance of Subgroup Allocations
in Training Data [85.43008636875345]
訓練データにおける多様な表現は,サブグループのパフォーマンス向上と集団レベルの目標達成の鍵である。
分析と実験は、データセット構成がパフォーマンスにどのように影響するかを説明し、既存のデータにおけるトレンドとドメイン知識を用いて、意図的かつ客観的なデータセット設計を導くのに役立つ構成結果を提供する。
論文 参考訳(メタデータ) (2021-03-05T00:27:08Z) - Through the Data Management Lens: Experimental Analysis and Evaluation
of Fair Classification [75.49600684537117]
データ管理研究は、データとアルゴリズムの公平性に関連するトピックに対する存在感と関心が高まっている。
我々は,その正しさ,公平性,効率性,スケーラビリティ,安定性よりも,13の公正な分類アプローチと追加の変種を幅広く分析している。
我々の分析は、異なるメトリクスとハイレベルなアプローチ特性がパフォーマンスの異なる側面に与える影響に関する新しい洞察を強調します。
論文 参考訳(メタデータ) (2021-01-18T22:55:40Z) - Adaptive Object Detection with Dual Multi-Label Prediction [78.69064917947624]
本稿では,適応オブジェクト検出のための新しいエンド・ツー・エンドの非教師付き深部ドメイン適応モデルを提案する。
モデルはマルチラベル予測を利用して、各画像内の対象カテゴリ情報を明らかにする。
本稿では,オブジェクト検出を支援するための予測整合正則化機構を提案する。
論文 参考訳(メタデータ) (2020-03-29T04:23:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。