論文の概要: Label Embedding via Low-Coherence Matrices
- arxiv url: http://arxiv.org/abs/2305.19470v3
- Date: Thu, 26 Oct 2023 14:59:16 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-28 01:38:38.457422
- Title: Label Embedding via Low-Coherence Matrices
- Title(参考訳): 低コヒーレンス行列によるラベル埋め込み
- Authors: Jianxin Zhang and Clayton Scott
- Abstract要約: 極端多クラス分類の文脈におけるラベル埋め込みの分析を行い、クラス数$C$は非常に大きいことを示す。
我々は,Massartノイズ条件下では,ラベル埋め込みの統計的ペナルティが十分に低いコヒーレンスで消失することを示した。
本分析は, 単純でスケーラブルで並列化が容易なアルゴリズムをサポートし, 大規模アプリケーションにおいてその有効性を実証する実験結果である。
- 参考スコア(独自算出の注目度): 19.2069941303755
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Label embedding is a framework for multiclass classification problems where
each label is represented by a distinct vector of some fixed dimension, and
training involves matching model output to the vector representing the correct
label. While label embedding has been successfully applied in extreme
classification and zero-shot learning, and offers both computational and
statistical advantages, its theoretical foundations remain poorly understood.
This work presents an analysis of label embedding in the context of extreme
multiclass classification, where the number of classes $C$ is very large. We
present an excess risk bound that reveals a trade-off between computational and
statistical efficiency, quantified via the coherence of the embedding matrix.
We further show that under the Massart noise condition, the statistical penalty
for label embedding vanishes with sufficiently low coherence. Our analysis
supports an algorithm that is simple, scalable, and easily parallelizable, and
experimental results demonstrate its effectiveness in large-scale applications.
- Abstract(参考訳): ラベル埋め込みは、各ラベルをある固定次元の別個のベクトルで表現し、トレーニングは正しいラベルを表すベクトルとモデル出力をマッチングする多クラス分類問題のためのフレームワークである。
ラベル埋め込みは極端な分類とゼロショット学習にうまく適用され、計算と統計の両方の利点を提供しているが、その理論的基礎はよく分かっていない。
この研究は、極端多クラス分類の文脈におけるラベル埋め込みの分析を示し、クラス数$C$は非常に大きい。
埋め込み行列のコヒーレンスによって定量化される計算効率と統計効率のトレードオフを明らかにする過剰なリスク境界を示す。
さらに,Massartノイズ条件下では,ラベル埋め込みに対する統計的ペナルティが十分に低いコヒーレンスで消失することを示す。
本解析は,単純でスケーラブルで容易に並列化可能なアルゴリズムをサポートし,大規模アプリケーションでの有効性を実験的に実証する。
関連論文リスト
- Class-Distribution-Aware Pseudo Labeling for Semi-Supervised Multi-Label
Learning [97.88458953075205]
Pseudo-labelingは、ラベルなしデータを利用するための人気で効果的なアプローチとして登場した。
本稿では,クラスアウェアの擬似ラベル処理を行うCAP(Class-Aware Pseudo-Labeling)という新しい手法を提案する。
論文 参考訳(メタデータ) (2023-05-04T12:52:18Z) - One Positive Label is Sufficient: Single-Positive Multi-Label Learning
with Label Enhancement [71.9401831465908]
本研究では,SPMLL (Single- positive multi-label learning) について検討した。
ラベルエンハンスメントを用いた単陽性MultIラベル学習という新しい手法を提案する。
ベンチマークデータセットの実験により,提案手法の有効性が検証された。
論文 参考訳(メタデータ) (2022-06-01T14:26:30Z) - Learning with Proper Partial Labels [87.65718705642819]
部分ラベル学習は、不正確なラベルを持つ弱い教師付き学習の一種である。
この適切な部分ラベル学習フレームワークには,従来の部分ラベル学習設定が数多く含まれていることを示す。
次に、分類リスクの統一的非バイアス推定器を導出する。
論文 参考訳(メタデータ) (2021-12-23T01:37:03Z) - Gradient-based Label Binning in Multi-label Classification [0.0]
多ラベル分類において、ラベル間の依存関係をモデル化する能力は、非分解性評価尺度を効果的に最適化するために重要である。
最近の多くのブースティングアプローチで使われている2階微分の利用は、分解不能な損失の最小化を導くのに役立つ。
本研究では,新しい近似手法を高速化手法に統合することにより,そのような手法の計算ボトルネックに対処する。
論文 参考訳(メタデータ) (2021-06-22T11:48:48Z) - Disentangling Sampling and Labeling Bias for Learning in Large-Output
Spaces [64.23172847182109]
異なる負のサンプリングスキームが支配的ラベルと稀なラベルで暗黙的にトレードオフパフォーマンスを示す。
すべてのラベルのサブセットで作業することで生じるサンプリングバイアスと、ラベルの不均衡に起因するデータ固有のラベルバイアスの両方に明示的に対処する統一された手段を提供する。
論文 参考訳(メタデータ) (2021-05-12T15:40:13Z) - Semi-supervised Active Learning for Instance Segmentation via Scoring
Predictions [25.408505612498423]
インスタンスセグメンテーションのための新規かつ原則的な半教師付きアクティブ学習フレームワークを提案する。
具体的には,クラス,バウンディングボックス,マスクの手がかりを明示的に評価するトリプレットスコア予測(tsp)という不確実性サンプリング戦略を提案する。
医用画像データセットを用いた結果から,提案手法が有意義な方法で利用可能なデータから知識を具現化することを示す。
論文 参考訳(メタデータ) (2020-12-09T02:36:52Z) - A Flexible Class of Dependence-aware Multi-Label Loss Functions [4.265467042008983]
本稿では,多ラベル分類のための新しいクラス損失関数を提案する。
これは、ハミングやサブセット0/1のような一般的に使用される損失のデメリットを克服する。
これらの損失の観点からのマルチラベルの評価は、実証的研究で示される。
論文 参考訳(メタデータ) (2020-11-02T07:42:15Z) - Structured Prediction with Partial Labelling through the Infimum Loss [85.4940853372503]
弱い監督の目標は、収集コストの安いラベル付け形式のみを使用してモデルを学習できるようにすることである。
これは、各データポイントに対して、実際のものを含むラベルのセットとして、監督がキャストされる不完全なアノテーションの一種です。
本稿では、構造化された予測と、部分的なラベリングを扱うための無限損失の概念に基づく統一的なフレームワークを提供する。
論文 参考訳(メタデータ) (2020-03-02T13:59:41Z) - Progressive Identification of True Labels for Partial-Label Learning [112.94467491335611]
部分ラベル学習(Partial-label Learning, PLL)は、典型的な弱教師付き学習問題であり、各トレーニングインスタンスには、真のラベルである候補ラベルのセットが設けられている。
既存のほとんどの手法は、特定の方法で解決しなければならない制約付き最適化として精巧に設計されており、計算複雑性をビッグデータにスケールアップするボトルネックにしている。
本稿では,モデルと最適化アルゴリズムの柔軟性を備えた分類器の新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2020-02-19T08:35:15Z) - An interpretable semi-supervised classifier using two different
strategies for amended self-labeling [0.0]
半教師付き分類技術は、学習期間中にラベル付きデータとラベルなしデータを組み合わせる。
ブラックボックスを用いて,不足するクラスラベルとホワイトボックスを推定し,最終的な予測を説明する,解釈可能な自己ラベル付きグレーボックス分類器を提案する。
論文 参考訳(メタデータ) (2020-01-26T19:37:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。