論文の概要: Extreme Multi-label Classification from Aggregated Labels
- arxiv url: http://arxiv.org/abs/2004.00198v1
- Date: Wed, 1 Apr 2020 02:13:09 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-17 18:01:44.221544
- Title: Extreme Multi-label Classification from Aggregated Labels
- Title(参考訳): 集約ラベルからの極端多重ラベル分類
- Authors: Yanyao Shen, Hsiang-fu Yu, Sujay Sanghavi, Inderjit Dhillon
- Abstract要約: XMC(Extreme Multi-label classification)は、非常に大きなラベルのラベルから入力の関連ラベルを見つける問題である。
我々は,グループラベルから個々のサンプルラベルをインプットする,新しいスケーラブルなアルゴリズムを開発した。
これは既存のXMC法と組み合わせて集計ラベル問題を解くことができる。
- 参考スコア(独自算出の注目度): 27.330826185375415
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Extreme multi-label classification (XMC) is the problem of finding the
relevant labels for an input, from a very large universe of possible labels. We
consider XMC in the setting where labels are available only for groups of
samples - but not for individual ones. Current XMC approaches are not built for
such multi-instance multi-label (MIML) training data, and MIML approaches do
not scale to XMC sizes. We develop a new and scalable algorithm to impute
individual-sample labels from the group labels; this can be paired with any
existing XMC method to solve the aggregated label problem. We characterize the
statistical properties of our algorithm under mild assumptions, and provide a
new end-to-end framework for MIML as an extension. Experiments on both
aggregated label XMC and MIML tasks show the advantages over existing
approaches.
- Abstract(参考訳): 極端多重ラベル分類 (extreme multi-label classification, xmc) は、可能なラベルの非常に大きな宇宙から、入力の関連するラベルを見つける問題である。
xmcは、サンプルのグループのみにラベルを利用できるが、個々のグループにはない設定だと考えています。
現在のXMCアプローチは、Multi-instance Multi-label(MIML)トレーニングデータに対して構築されておらず、MIMLアプローチはXMCサイズにスケールしない。
我々は,グループラベルから個々のサンプルラベルをインプットする,新しいスケーラブルなアルゴリズムを開発した。
軽度仮定下でのアルゴリズムの統計的特性を特徴付け,mimlの新たなエンドツーエンドフレームワークを拡張として提供する。
XMCタスクとMIMLタスクを集約した実験は、既存のアプローチよりも優れていることを示す。
関連論文リスト
- Learning label-label correlations in Extreme Multi-label Classification via Label Features [44.00852282861121]
Extreme Multi-label Text Classification (XMC)は、数百万のラベル選択から最も関連性の高いラベルのサブセットで入力を割り当てることができる分類器を学習する。
ラベル機能付き短文XMCは、検索広告におけるクエリ・ツー・アド・フレーズマッチング、タイトルベースの製品推薦、関連する検索の予測など、多くの分野に応用されている。
本稿では,ラベル共起グラフを用いてラベル特徴を付加データポイントとして活用し,トレーニング分布を補完する新しい手法であるガンダルフを提案する。
論文 参考訳(メタデータ) (2024-05-03T21:18:43Z) - Scalable Label Distribution Learning for Multi-Label Classification [47.55261224881677]
マルチラベル分類(MLC、Multi-label classification)とは、あるインスタンスに関連ラベルのセットをタグ付けする問題を指す。
既存のMLC手法の多くはラベル数に関連する学習プロセスを設計しており、大規模な出力空間にスケールアップする際の計算複雑性をボトルネックにしている。
本稿では,多ラベル分類のためのスケーラブルラベル分散学習(SLDL)と呼ばれる新しいMLC学習手法を提案する。
論文 参考訳(メタデータ) (2023-11-28T06:52:53Z) - PINA: Leveraging Side Information in eXtreme Multi-label Classification
via Predicted Instance Neighborhood Aggregation [105.52660004082766]
eXtreme Multi-label Classification(XMC)問題は、非常に大きなラベル空間から関連するラベルを見つけることを目指している。
一般XMC問題に対するデータ強化手法であるPINA(Predicted Instance Neighborhood Aggregation)を提案する。
ラベルと入力インスタンスを機能のないインジケータと独立したエントリとして扱う既存のほとんどのXMCフレームワークとは異なり、PINAはラベルメタデータとトレーニングインスタンス間の相関関係から情報を抽出する。
論文 参考訳(メタデータ) (2023-05-21T05:00:40Z) - Complementary to Multiple Labels: A Correlation-Aware Correction
Approach [65.59584909436259]
理論上, マルチクラスCLLにおける遷移行列が, 複数ラベルの場合どのように歪むかを示す。
候補ラベルから遷移行列を推定する2段階の手法を提案する。
論文 参考訳(メタデータ) (2023-02-25T04:48:48Z) - Large Loss Matters in Weakly Supervised Multi-Label Classification [50.262533546999045]
まず、観測されていないラベルを負のラベルとみなし、Wタスクをノイズの多いマルチラベル分類にキャストする。
ノイズラベルを記憶しないために,大規模な損失サンプルを拒絶または補正する新しいW法を提案する。
提案手法は, 弱教師付きマルチラベル分類において, 大きな損失を適切に処理することが重要であることを検証した。
論文 参考訳(メタデータ) (2022-06-08T08:30:24Z) - Open Vocabulary Extreme Classification Using Generative Models [24.17018785195843]
極端なマルチラベル分類(XMC)タスクは、非常に大きなラベルセットからラベルのサブセットでコンテンツをタグ付けすることを目的としている。
本稿では, ラベルの集合をフラットシーケンスとして生成し, 予測されたラベル順序に依存しない新たな損失を用いて訓練する GROOV を提案する。
提案手法の有効性を実証し,GROOVが与えられた語彙の外で有意なラベルを予測できるようなXMCデータセットを用いて実験を行った。
論文 参考訳(メタデータ) (2022-05-12T00:33:49Z) - Extreme Zero-Shot Learning for Extreme Text Classification [80.95271050744624]
極端ゼロショットXMC (EZ-XMC) とフーショットXMC (FS-XMC) について検討した。
自己教師付きコントラスト損失のあるトランスフォーマーベースのエンコーダの事前訓練を提案する。
我々は,多スケール適応クラスタリング,ラベル正規化,擬陽性ペアによる自己学習などの手法を用いて,生テキストを徹底的に活用する事前学習手法MACLRを開発した。
論文 参考訳(メタデータ) (2021-12-16T06:06:42Z) - Label Disentanglement in Partition-based Extreme Multilabel
Classification [111.25321342479491]
分割型XMCにおけるラベル割り当て問題を最適化問題として定式化できることを示す。
提案手法はマルチモーダルラベルのアンタングル化に成功し、4つのXMCベンチマークでSOTA(State-of-the-art)結果が得られた。
論文 参考訳(メタデータ) (2021-06-24T03:24:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。