論文の概要: Decomposing Global AUC into Cluster-Level Contributions for Localized Model Diagnostics
- arxiv url: http://arxiv.org/abs/2508.07495v1
- Date: Sun, 10 Aug 2025 21:58:47 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-12 21:23:28.884741
- Title: Decomposing Global AUC into Cluster-Level Contributions for Localized Model Diagnostics
- Title(参考訳): 局所モデル診断のためのグローバルAUCをクラスタレベルに分解する
- Authors: Agus Sudjianto, Alice J. Liu,
- Abstract要約: Area Under the ROC Curve (AUC) はバイナリ分類器のパフォーマンス指標として広く使われている。
信用承認や不正検出といった高度なアプリケーションでは、これらの弱点は金融リスクや運用上の失敗につながる可能性がある。
本稿では,グローバルAUCをクラスタ内およびクラスタ間コンポーネントに形式的に分解する。
- 参考スコア(独自算出の注目度): 1.104960878651584
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The Area Under the ROC Curve (AUC) is a widely used performance metric for binary classifiers. However, as a global ranking statistic, the AUC aggregates model behavior over the entire dataset, masking localized weaknesses in specific subpopulations. In high-stakes applications such as credit approval and fraud detection, these weaknesses can lead to financial risk or operational failures. In this paper, we introduce a formal decomposition of global AUC into intra- and inter-cluster components. This allows practitioners to evaluate classifier performance within and across clusters of data, enabling granular diagnostics and subgroup analysis. We also compare the AUC with additive performance metrics such as the Brier score and log loss, which support decomposability and direct attribution. Our framework enhances model development and validation practice by providing additional insights to detect model weakness for model risk management.
- Abstract(参考訳): ROC曲線下の領域 (AUC) は二項分類器のパフォーマンス指標として広く使われている。
しかしながら、グローバルランキング統計として、AUCはデータセット全体のモデル挙動を集約し、特定のサブ人口の局所的な弱点を隠蔽する。
信用承認や不正検出といった高度なアプリケーションでは、これらの弱点は金融リスクや運用上の失敗につながる可能性がある。
本稿では,グローバルAUCをクラスタ内およびクラスタ間コンポーネントに形式的に分解する手法を提案する。
これにより、データクラスタ内およびデータクラスタ間の分類器のパフォーマンスを評価し、粒度の診断とサブグループ分析を可能にする。
また、AUCとBrierスコアやログ損失などの付加的なパフォーマンス指標を比較し、分解可能性と直接帰属性をサポートします。
我々のフレームワークは、モデルリスク管理のためのモデル弱点を検出するための追加の洞察を提供することで、モデル開発と検証の実践を強化する。
関連論文リスト
- CLIP Meets Diffusion: A Synergistic Approach to Anomaly Detection [54.85000884785013]
異常検出は、異常の定義の曖昧さ、異常型の多様性、トレーニングデータの不足による複雑な問題である。
識別的基盤モデルと生成的基礎モデルの両方を活用するCLIPfusionを提案する。
本手法は, 異常検出の多面的課題に対処する上で, マルチモーダル・マルチモデル融合の有効性を裏付けるものである。
論文 参考訳(メタデータ) (2025-06-13T13:30:15Z) - SubROC: AUC-Based Discovery of Exceptional Subgroup Performance for Binary Classifiers [1.533848041901807]
SubROCはモデルマイニングに基づくフレームワークで、分類モデルの長所と短所を確実かつ効率的に見つけることができる。
共通評価尺度(ROCとPR AUC)、高速で徹底的なサブグループ探索のための効率的な探索空間プルーニング、クラス不均衡の制御、冗長なパターンの調整、重要度テストなどが組み込まれている。
論文 参考訳(メタデータ) (2025-05-16T14:18:40Z) - Generative Classifier for Domain Generalization [84.92088101715116]
ドメインの一般化は、分散シフトに対するコンピュータビジョンモデルの一般化性を目的としている。
生成駆動型ドメイン一般化(GCDG)を提案する。
GCDGは3つの重要なモジュールから構成される: 異種性学習(HLC)、純粋相関(SCB)、横成分バランス(DCB)。
論文 参考訳(メタデータ) (2025-04-03T04:38:33Z) - Combating Financial Crimes with Unsupervised Learning Techniques:
Clustering and Dimensionality Reduction for Anti-Money Laundering [0.0]
AML(Anti-Money Laundering)は、金融システムの整合性を確保するための重要なタスクである。
教師なし学習、特にクラスタリングは、このタスクにとって有望なソリューションです。
本稿では,クラスタリング手法の集約的階層クラスタリングと4次元縮小手法の併用の有効性について検討する。
論文 参考訳(メタデータ) (2024-02-14T17:31:29Z) - GREAT Score: Global Robustness Evaluation of Adversarial Perturbation using Generative Models [60.48306899271866]
GREATスコア(GREAT Score)と呼ばれる新しいフレームワークを提案する。
我々は,ロバストベンチにおける攻撃ベースモデルと比較し,高い相関性を示し,GREATスコアのコストを大幅に削減した。
GREAT Scoreは、プライバシーに敏感なブラックボックスモデルのリモート監査に使用することができる。
論文 参考訳(メタデータ) (2023-04-19T14:58:27Z) - Clustering Validation with The Area Under Precision-Recall Curves [0.0]
クラスタリングバリデーションインデックス(CVI)は、実際のアプリケーションシナリオにおけるクラスタリングバリデーションを可能にする。
我々はこれらがCVIとして適切であるだけでなく、クラスタ不均衡の存在においても好ましいことを示します。
提案したCVIと最先端のCVIを、実データおよびシミュレーションデータセット上で総合的に評価する。
論文 参考訳(メタデータ) (2023-04-04T01:49:57Z) - Multi-class Classification Based Anomaly Detection of Insider Activities [18.739091829480234]
生成モデルと教師付き学習を組み合わせて,深層学習を用いたマルチクラス分類を行う手法を提案する。
generative adversarial network (gan) ベースのインサイダー検出モデルでは、条件付きジェネレーショナルadversarial network (cgan) を導入し、マイノリティクラスサンプルを豊かにする。
ベンチマークデータセットで実施した総合的な実験は、GAN派生合成データの導入の有効性を示す。
論文 参考訳(メタデータ) (2021-02-15T00:08:39Z) - Towards Uncovering the Intrinsic Data Structures for Unsupervised Domain
Adaptation using Structurally Regularized Deep Clustering [119.88565565454378]
Unsupervised Domain Adapt (UDA) は、ターゲットドメイン上のラベルなしデータの予測を行う分類モデルを学ぶことである。
本稿では,対象データの正規化判別クラスタリングと生成クラスタリングを統合する構造的正規化深層クラスタリングのハイブリッドモデルを提案する。
提案するH-SRDCは, インダクティブ設定とトランスダクティブ設定の両方において, 既存の手法よりも優れている。
論文 参考訳(メタデータ) (2020-12-08T08:52:00Z) - The Area Under the ROC Curve as a Measure of Clustering Quality [0.0]
Area Under the Curve for Clustering (AUCC) はクラスタリングの品質の内/相対的な尺度である。
AUCC はベーカー・アンド・ヒューバート (1975) によるガンマ基準の線型変換である。
論文 参考訳(メタデータ) (2020-09-04T21:34:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。