論文の概要: Convex Calibrated Surrogates for the Multi-Label F-Measure
- arxiv url: http://arxiv.org/abs/2009.07801v1
- Date: Wed, 16 Sep 2020 16:50:55 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-17 23:19:51.798418
- Title: Convex Calibrated Surrogates for the Multi-Label F-Measure
- Title(参考訳): マルチラベルf測定のための凸キャリブレーションサーロゲート
- Authors: Mingyuan Zhang, Harish G. Ramaswamy, Shivani Agarwal
- Abstract要約: F尺度は多ラベル分類において広く用いられる性能尺度である。
損失行列の 2s 倍の 2s であると見なされるような$s$ラベル問題に対する F 測度は,最大で $s2+1$ であることを示す。
結果として生じるサロゲートリスク最小化アルゴリズムは、マルチラベルF測度学習問題を$s2+1$のバイナリクラス確率推定問題に分解したものと見なすことができる。
- 参考スコア(独自算出の注目度): 22.22122367004946
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The F-measure is a widely used performance measure for multi-label
classification, where multiple labels can be active in an instance
simultaneously (e.g. in image tagging, multiple tags can be active in any
image). In particular, the F-measure explicitly balances recall (fraction of
active labels predicted to be active) and precision (fraction of labels
predicted to be active that are actually so), both of which are important in
evaluating the overall performance of a multi-label classifier. As with most
discrete prediction problems, however, directly optimizing the F-measure is
computationally hard. In this paper, we explore the question of designing
convex surrogate losses that are calibrated for the F-measure -- specifically,
that have the property that minimizing the surrogate loss yields (in the limit
of sufficient data) a Bayes optimal multi-label classifier for the F-measure.
We show that the F-measure for an $s$-label problem, when viewed as a $2^s
\times 2^s$ loss matrix, has rank at most $s^2+1$, and apply a result of
Ramaswamy et al. (2014) to design a family of convex calibrated surrogates for
the F-measure. The resulting surrogate risk minimization algorithms can be
viewed as decomposing the multi-label F-measure learning problem into $s^2+1$
binary class probability estimation problems. We also provide a quantitative
regret transfer bound for our surrogates, which allows any regret guarantees
for the binary problems to be transferred to regret guarantees for the overall
F-measure problem, and discuss a connection with the algorithm of Dembczynski
et al. (2013). Our experiments confirm our theoretical findings.
- Abstract(参考訳): f-measureはマルチラベル分類において広く使われているパフォーマンス指標であり、複数のラベルを同時にインスタンスで動作させることができる(例えば、画像タグ付けでは、任意のイメージで複数のタグがアクティブになる)。
特に、F尺度は、リコール(アクティブであると予測されるアクティブラベルの区切り)と精度(実際にアクティブであると予測されるラベルの区切り)を明示的にバランスさせ、どちらもマルチラベル分類器の全体的な性能を評価する上で重要である。
しかし、ほとんどの離散予測問題と同様に、f-測定を直接最適化することは計算的に難しい。
本稿では,f-measureに最適化された凸サーロゲート損失の設計の問題,具体的には,f-measureに対するベイズ最適マルチラベル分類器(baies optimal multi-label classifier)のサーロゲート損失を最小化する特性について検討する。
損失行列を2^s \times 2^s$とみなす場合の$s$-label問題に対するF測度は、最大で$s^2+1$であり、F測度に対する凸校正サロゲートの族を設計するためにRamaswamy et al. (2014) の結果を適用する。
結果として生じるリスク最小化アルゴリズムは、マルチラベルf-測定学習問題を$s^2+1$バイナリクラス確率推定問題に分解すると見なすことができる。
また,f-measure問題全体に対する後悔保証を行うために,バイナリ問題の後悔保証を行うことができるサロゲートの量的後悔伝達バウンドを提供し,dembczynski et al. (2013) のアルゴリズムとの関連について考察した。
我々の実験は理論的な結果を確認する。
関連論文リスト
- Semiparametric conformal prediction [79.6147286161434]
リスクに敏感なアプリケーションは、複数の、潜在的に相関したターゲット変数に対して、よく校正された予測セットを必要とする。
スコアをランダムなベクトルとして扱い、それらの連接関係構造を考慮した予測セットを構築することを目的とする。
実世界のレグレッション問題に対して,所望のカバレッジと競争効率について報告する。
論文 参考訳(メタデータ) (2024-11-04T14:29:02Z) - On Computationally Efficient Multi-Class Calibration [9.032290717007065]
プロジェクトのキャリブレーションは、下流の意思決定者全員に強い保証を与えます。
これは、ラベルに割り当てられた確率を$T$にまとめることで予測される確率が、完全に校正されたバイナリ予測器に近いことを保証している。
論文 参考訳(メタデータ) (2024-02-12T17:25:23Z) - Generating Unbiased Pseudo-labels via a Theoretically Guaranteed
Chebyshev Constraint to Unify Semi-supervised Classification and Regression [57.17120203327993]
分類におけるしきい値と擬似ラベルプロセス(T2L)は、ラベルの品質を決定するために信頼性を使用する。
本質的には、レグレッションは高品質なラベルを生成するためにバイアスのない方法も必要である。
チェビシェフの不等式に基づく不偏ラベルを生成するための理論的に保証された制約を提案する。
論文 参考訳(メタデータ) (2023-11-03T08:39:35Z) - Multi-Label Noise Transition Matrix Estimation with Label Correlations:
Theory and Algorithm [73.94839250910977]
ノイズの多いマルチラベル学習は、大規模な正確なラベルの収集によって生じる課題により、注目を集めている。
遷移行列の導入は、マルチラベルノイズをモデル化し、統計的に一貫したアルゴリズムの開発に役立つ。
そこで本稿では, アンカーポイントを必要とせずに, ラベル相関を利用した新しい推定器を提案する。
論文 参考訳(メタデータ) (2023-09-22T08:35:38Z) - Multi-Label Quantification [78.83284164605473]
定量化とは、教師なしデータサンプルにおいて、興味あるクラスの相対周波数の予測子を生成する教師付き学習課題である。
本研究では,その相対頻度をより正確に予測するために,興味あるクラス間の依存関係を活用しようとするクラス有病率値の推定手法を提案する。
論文 参考訳(メタデータ) (2022-11-15T11:29:59Z) - Unbiased Loss Functions for Multilabel Classification with Missing
Labels [2.1549398927094874]
欠落ラベルは、極端なマルチラベル分類(XMC)タスクにおいてユビキタスな現象である。
本稿では,異なるマルチラベルリダクションに対する特異な非バイアス推定器を導出する。
論文 参考訳(メタデータ) (2021-09-23T10:39:02Z) - sigmoidF1: A Smooth F1 Score Surrogate Loss for Multilabel
Classification [42.37189502220329]
マルチラベル分類評価の複雑さを考慮した損失関数 sigmoidF1 を提案する。
SigmoidF1は4つのデータセットといくつかのメトリクスで他の損失関数よりも優れていることを示す。
論文 参考訳(メタデータ) (2021-08-24T08:11:33Z) - A Unified Joint Maximum Mean Discrepancy for Domain Adaptation [73.44809425486767]
本論文は,最適化が容易なjmmdの統一形式を理論的に導出する。
統合JMMDから、JMMDは分類に有利な特徴ラベル依存を低下させることを示す。
本稿では,その依存を促進する新たなmmd行列を提案し,ラベル分布シフトにロバストな新しいラベルカーネルを考案する。
論文 参考訳(メタデータ) (2021-01-25T09:46:14Z) - Classifier-independent Lower-Bounds for Adversarial Robustness [13.247278149124757]
理論的には、テストタイムの逆数と雑音の分類例に対するロバスト性の限界を解析する。
最適輸送理論を用いて、与えられた分類問題に対して分類器ができるベイズ最適誤差の変分式を導出する。
一般的な距離ベース攻撃の場合,ベイズ最適誤差に対して明らかな下限を導出する。
論文 参考訳(メタデータ) (2020-06-17T16:46:39Z) - Provable tradeoffs in adversarially robust classification [96.48180210364893]
我々は、ロバストなイソペリメトリに関する確率論の最近のブレークスルーを含む、新しいツールを開発し、活用する。
この結果から,データの不均衡時に増加する標準精度とロバスト精度の基本的なトレードオフが明らかになった。
論文 参考訳(メタデータ) (2020-06-09T09:58:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。