論文の概要: Concentration Inequalities for Two-Sample Rank Processes with
Application to Bipartite Ranking
- arxiv url: http://arxiv.org/abs/2104.02943v1
- Date: Wed, 7 Apr 2021 06:31:06 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-08 12:36:33.576739
- Title: Concentration Inequalities for Two-Sample Rank Processes with
Application to Bipartite Ranking
- Title(参考訳): 二段ランク法における濃度不等式と二段ランク法への応用
- Authors: St\'ephan Cl\'emen\c{c}on (LTCI), Myrto Limnios (CB), Nicolas Vayatis
(CB)
- Abstract要約: ROC曲線は、テスト/スコアリング統計のパフォーマンスを測定するための金の標準です。
スコアリング/ランク付けアプリケーションで使用される実践的なパフォーマンス指標は、ROC曲線の要約と見なすことができる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The ROC curve is the gold standard for measuring the performance of a
test/scoring statistic regarding its capacity to discriminate between two
statistical populations in a wide variety of applications, ranging from anomaly
detection in signal processing to information retrieval, through medical
diagnosis. Most practical performance measures used in scoring/ranking
applications such as the AUC, the local AUC, the p-norm push, the DCG and
others, can be viewed as summaries of the ROC curve. In this paper, the fact
that most of these empirical criteria can be expressed as two-sample linear
rank statistics is highlighted and concentration inequalities for collections
of such random variables, referred to as two-sample rank processes here, are
proved, when indexed by VC classes of scoring functions. Based on these
nonasymptotic bounds, the generalization capacity of empirical maximizers of a
wide class of ranking performance criteria is next investigated from a
theoretical perspective. It is also supported by empirical evidence through
convincing numerical experiments.
- Abstract(参考訳): ROC曲線(英: ROC curve)は、信号処理における異常検出から情報検索まで幅広い用途において、2つの統計集団を識別する能力に関するテスト/スコア統計の性能を測定するための金の標準である。
AUC、ローカルAUC、p-ノルムプッシュ、DCGなどのスコアリング/ランク付けアプリケーションで使用される最も実用的なパフォーマンス対策は、ROC曲線の要約と見なすことができる。
本稿では,これらの経験的基準のほとんどを2-sample linear rank statisticsとして表現できることを強調し,ここでは2-sample rank processと呼ばれる確率変数の集合に対する濃度不等式を,スコアリング関数のvcクラスによって索引付けされた場合に証明する。
これらの漸近的境界に基づいて、幅広いランク付け性能基準の経験的最大値の一般化能力について理論的観点から検討する。
また、実証的な数値実験によっても支持されている。
関連論文リスト
- Kernel Density Estimation for Multiclass Quantification [52.419589623702336]
量子化は、クラス有病率の正確な予測値を取得することに関する教師付き機械学習タスクである。
分散マッチング(DM)アプローチは、これまでの文献で提案されている定量化手法の中で、最も重要なファミリーの1つである。
カーネル密度推定(KDE)によりモデル化した多変量密度に基づく新しい表現機構を提案する。
論文 参考訳(メタデータ) (2023-12-31T13:19:27Z) - Analysis of Diagnostics (Part I): Prevalence, Uncertainty Quantification, and Machine Learning [0.0]
この写本は、分類理論と有病率のより深い関係を研究する二部作の最初のものである。
そこで本稿では,有病率重み付き経験誤差を最小化することにより,Bstar (q)$を推定する数値ホモトピーアルゴリズムを提案する。
合成データとSARS-CoV-2酵素結合免疫測定法(ELISA)を用いて本法の有効性を検証した。
論文 参考訳(メタデータ) (2023-08-30T13:26:49Z) - Spectral Ranking Inferences based on General Multiway Comparisons [7.222667862159246]
本研究では,2段階のスペクトル法により,最大近似エスタと同じバニラ効率が得られることを示す。
有効な2サンプルランク試験法が提案されたのはこれが初めてである。
論文 参考訳(メタデータ) (2023-08-05T16:31:32Z) - Learning disentangled representations for explainable chest X-ray
classification using Dirichlet VAEs [68.73427163074015]
本研究では,胸部X線像の非絡み合った潜在表現の学習にDirVAE(Dirichlet Variational Autoencoder)を用いることを検討した。
DirVAEモデルにより学習された多モード潜在表現の予測能力について,補助的多ラベル分類タスクの実装により検討した。
論文 参考訳(メタデータ) (2023-02-06T18:10:08Z) - Parametric Classification for Generalized Category Discovery: A Baseline
Study [70.73212959385387]
Generalized Category Discovery (GCD)は、ラベル付きサンプルから学習した知識を用いて、ラベルなしデータセットで新しいカテゴリを発見することを目的としている。
パラメトリック分類器の故障を調査し,高品質な監視が可能であった場合の過去の設計選択の有効性を検証し,信頼性の低い疑似ラベルを重要課題として同定する。
エントロピー正規化の利点を生かし、複数のGCDベンチマークにおける最先端性能を実現し、未知のクラス数に対して強いロバスト性を示す、単純で効果的なパラメトリック分類法を提案する。
論文 参考訳(メタデータ) (2022-11-21T18:47:11Z) - Hierarchical Semi-Supervised Contrastive Learning for
Contamination-Resistant Anomaly Detection [81.07346419422605]
異常検出は、通常のデータ分布から逸脱したサンプルを特定することを目的としている。
コントラスト学習は、異常の効果的な識別を可能にする表現のサンプル化に成功している。
汚染耐性異常検出のための新しい階層型半教師付きコントラスト学習フレームワークを提案する。
論文 参考訳(メタデータ) (2022-07-24T18:49:26Z) - Understanding the impact of class imbalance on the performance of chest
x-ray image classifiers [13.593336529221613]
本研究の目的は,胸部X線分類器の性能に及ぼすクラス不均衡の影響を理解することである。
本稿では,システムの性能をよりよく反映した,精度・リコール曲線とバランスド・ブライアスコアの2つの代替指標を提案する。
論文 参考訳(メタデータ) (2021-12-23T20:57:47Z) - Learning to Rank Anomalies: Scalar Performance Criteria and Maximization
of Two-Sample Rank Statistics [0.0]
本稿では,観測結果の異常度を反映した特徴空間上で定義されたデータ駆動スコアリング関数を提案する。
このスコアリング関数は、よく設計された二項分類問題を通じて学習される。
本稿では,予備的な数値実験による方法論について解説する。
論文 参考訳(メタデータ) (2021-09-20T14:45:56Z) - Towards Model-Agnostic Post-Hoc Adjustment for Balancing Ranking
Fairness and Algorithm Utility [54.179859639868646]
Bipartiteランキングは、ラベル付きデータから正の個人よりも上位の個人をランク付けするスコアリング機能を学ぶことを目的としている。
学習したスコアリング機能が、異なる保護グループ間で体系的な格差を引き起こすのではないかという懸念が高まっている。
本稿では、二部構成のランキングシナリオにおいて、それらのバランスをとるためのモデル後処理フレームワークを提案する。
論文 参考訳(メタデータ) (2020-06-15T10:08:39Z) - Learning Fair Scoring Functions: Bipartite Ranking under ROC-based
Fairness Constraints [2.0263791972068628]
2値ラベル付きデータからスコアリング関数を学習する際の公平性について検討する。
AUC と ROC 曲線に基づくフェアネス定義の一般族を紹介する。
このような制約の下で学習したスコアリング関数の有界一般化を確立する。
論文 参考訳(メタデータ) (2020-02-19T13:17:39Z) - A Survey on Causal Inference [64.45536158710014]
因果推論は統計学、コンピュータ科学、教育、公共政策、経済学など、多くの分野において重要な研究トピックである。
観測データに対する様々な因果効果推定法が誕生した。
論文 参考訳(メタデータ) (2020-02-05T21:35:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。