論文の概要: Multi-Label Quantification
- arxiv url: http://arxiv.org/abs/2211.08063v1
- Date: Tue, 15 Nov 2022 11:29:59 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-16 15:30:04.017292
- Title: Multi-Label Quantification
- Title(参考訳): マルチラベル量子化
- Authors: Alejandro Moreo and Manuel Francisco and Fabrizio Sebastiani
- Abstract要約: 定量化とは、教師なしデータサンプルにおいて、興味あるクラスの相対周波数の予測子を生成する教師付き学習課題である。
本研究では,その相対頻度をより正確に予測するために,興味あるクラス間の依存関係を活用しようとするクラス有病率値の推定手法を提案する。
- 参考スコア(独自算出の注目度): 78.83284164605473
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Quantification, variously called "supervised prevalence estimation" or
"learning to quantify", is the supervised learning task of generating
predictors of the relative frequencies (a.k.a. "prevalence values") of the
classes of interest in unlabelled data samples. While many quantification
methods have been proposed in the past for binary problems and, to a lesser
extent, single-label multiclass problems, the multi-label setting (i.e., the
scenario in which the classes of interest are not mutually exclusive) remains
by and large unexplored. A straightforward solution to the multi-label
quantification problem could simply consist of recasting the problem as a set
of independent binary quantification problems. Such a solution is simple but
na\"ive, since the independence assumption upon which it rests is, in most
cases, not satisfied. In these cases, knowing the relative frequency of one
class could be of help in determining the prevalence of other related classes.
We propose the first truly multi-label quantification methods, i.e., methods
for inferring estimators of class prevalence values that strive to leverage the
stochastic dependencies among the classes of interest in order to predict their
relative frequencies more accurately. We show empirical evidence that natively
multi-label solutions outperform the na\"ive approaches by a large margin. The
code to reproduce all our experiments is available online.
- Abstract(参考訳): 定量化(英: quantification)とは、非ラベルデータサンプルに関心のあるクラスの相対周波数(すなわち「前値」)の予測子を生成する教師付き学習タスクである。
かつてはバイナリ問題に対して多くの定量化法が提案されてきたが、より少ない範囲では、マルチラベル設定(つまり、興味のあるクラスが互いに排他的でないシナリオ)はいまだ大きな未探索のままである。
マルチラベル量子化問題の簡単な解法は、単に独立なバイナリ量子化問題の集合として問題を再キャストすることである。
このような解は単純だがna\"iveである。なぜなら、それが収まる独立な仮定は、ほとんどの場合、満足できないからである。
これらの場合、あるクラスの相対周波数を知ることは、他の関連するクラスの頻度を決定するのに役立つ。
本稿では,興味のあるクラス間の確率的依存関係を活用し,その相対周波数をより正確に予測するための,最初の真のマルチラベル量化手法,すなわちクラス有病率の推定法を提案する。
我々は,ネイティブにマルチラベルの解がna\" のアプローチよりも大きなマージンで勝るという実証的な証拠を示す。
すべての実験を再現するコードはオンラインで利用可能です。
関連論文リスト
- Probably Approximately Precision and Recall Learning [62.912015491907994]
精度とリコールは機械学習の基本的な指標である。
一方的なフィードバック – トレーニング中にのみ肯定的な例が観察される – は,多くの実践的な問題に固有のものだ。
PAC学習フレームワークでは,各仮説をグラフで表現し,エッジは肯定的な相互作用を示す。
論文 参考訳(メタデータ) (2024-11-20T04:21:07Z) - Trusted Multi-view Learning with Label Noise [17.458306450909316]
マルチビュー学習手法は、意思決定の不確実性を無視しながら、意思決定精度の向上に焦点を当てることが多い。
本稿では,この問題を解決するため,信頼度の高いマルチビューノイズ修正手法を提案する。
我々は,TMNRと最先端のマルチビュー学習,および5つの公開データセットに基づくラベルノイズ学習ベースラインを実証的に比較した。
論文 参考訳(メタデータ) (2024-04-18T06:47:30Z) - Multi-Label Noise Transition Matrix Estimation with Label Correlations:
Theory and Algorithm [73.94839250910977]
ノイズの多いマルチラベル学習は、大規模な正確なラベルの収集によって生じる課題により、注目を集めている。
遷移行列の導入は、マルチラベルノイズをモデル化し、統計的に一貫したアルゴリズムの開発に役立つ。
そこで本稿では, アンカーポイントを必要とせずに, ラベル相関を利用した新しい推定器を提案する。
論文 参考訳(メタデータ) (2023-09-22T08:35:38Z) - Class-Distribution-Aware Pseudo Labeling for Semi-Supervised Multi-Label
Learning [97.88458953075205]
Pseudo-labelingは、ラベルなしデータを利用するための人気で効果的なアプローチとして登場した。
本稿では,クラスアウェアの擬似ラベル処理を行うCAP(Class-Aware Pseudo-Labeling)という新しい手法を提案する。
論文 参考訳(メタデータ) (2023-05-04T12:52:18Z) - Centrality and Consistency: Two-Stage Clean Samples Identification for
Learning with Instance-Dependent Noisy Labels [87.48541631675889]
本稿では,2段階のクリーンサンプル識別手法を提案する。
まず,クリーンサンプルの早期同定にクラスレベルの特徴クラスタリング手法を用いる。
次に, 基底真理クラス境界に近い残余のクリーンサンプルについて, 一貫性に基づく新しい分類法を提案する。
論文 参考訳(メタデータ) (2022-07-29T04:54:57Z) - Learning from Multiple Unlabeled Datasets with Partial Risk
Regularization [80.54710259664698]
本稿では,クラスラベルを使わずに正確な分類器を学習することを目的とする。
まず、与えられたラベルのない集合から推定できる分類リスクの偏りのない推定器を導出する。
その結果、経験的リスクがトレーニング中に負になるにつれて、分類器が過度に適合する傾向があることが判明した。
実験により,本手法は,複数の未ラベル集合から学習する最先端の手法を効果的に緩和し,性能を向上することを示した。
論文 参考訳(メタデータ) (2022-07-04T16:22:44Z) - Multi-class Probabilistic Bounds for Self-learning [13.875239300089861]
Pseudo-labelingはエラーを起こしやすいため、ラベルなしのトレーニングデータにノイズのあるラベルを追加するリスクがある。
本稿では,多クラス分類シナリオにおける自己学習を部分的にラベル付きデータで分析する確率的枠組みを提案する。
論文 参考訳(メタデータ) (2021-09-29T13:57:37Z) - Unbiased Loss Functions for Multilabel Classification with Missing
Labels [2.1549398927094874]
欠落ラベルは、極端なマルチラベル分類(XMC)タスクにおいてユビキタスな現象である。
本稿では,異なるマルチラベルリダクションに対する特異な非バイアス推定器を導出する。
論文 参考訳(メタデータ) (2021-09-23T10:39:02Z) - CCMN: A General Framework for Learning with Class-Conditional
Multi-Label Noise [40.46921277898713]
クラス条件ノイズは一般的に機械学習タスクに存在し、クラスラベルは基底値に応じて確率で破壊される。
本稿では,この問題をCCMN(Class-Conditional Multi-label Noise)を用いた学習の一般的な枠組みとして形式化する。
我々は,ccmn問題を解くための誤差境界を持つ2つの非バイアス推定器を確立し,これらが一般的なマルチラベル損失関数と一致することを証明した。
論文 参考訳(メタデータ) (2021-05-16T03:24:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。