論文の概要: DECAF: Deep Extreme Classification with Label Features
- arxiv url: http://arxiv.org/abs/2108.00368v1
- Date: Sun, 1 Aug 2021 05:36:05 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-03 15:32:03.113318
- Title: DECAF: Deep Extreme Classification with Label Features
- Title(参考訳): DECAF:ラベル機能を備えたディープエクストリーム分類
- Authors: Anshul Mittal, Kunal Dahiya, Sheshansh Agrawal, Deepak Saini, Sumeet
Agarwal, Purushottam Kar, Manik Varma
- Abstract要約: 極端なマルチラベル分類(XML)では、非常に大きなラベルセットから最も関連性の高いラベルのサブセットにデータポイントをタグ付けする。
リードXMLアルゴリズムは数百万のラベルにスケールするが、ラベルのテキスト記述のようなラベルメタデータは無視される。
本稿では,ラベルメタデータに富んだ学習モデルを用いて,これらの課題に対処するDECAFアルゴリズムを開発した。
- 参考スコア(独自算出の注目度): 9.768907751312396
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Extreme multi-label classification (XML) involves tagging a data point with
its most relevant subset of labels from an extremely large label set, with
several applications such as product-to-product recommendation with millions of
products. Although leading XML algorithms scale to millions of labels, they
largely ignore label meta-data such as textual descriptions of the labels. On
the other hand, classical techniques that can utilize label metadata via
representation learning using deep networks struggle in extreme settings. This
paper develops the DECAF algorithm that addresses these challenges by learning
models enriched by label metadata that jointly learn model parameters and
feature representations using deep networks and offer accurate classification
at the scale of millions of labels. DECAF makes specific contributions to model
architecture design, initialization, and training, enabling it to offer up to
2-6% more accurate prediction than leading extreme classifiers on publicly
available benchmark product-to-product recommendation datasets, such as
LF-AmazonTitles-1.3M. At the same time, DECAF was found to be up to 22x faster
at inference than leading deep extreme classifiers, which makes it suitable for
real-time applications that require predictions within a few milliseconds. The
code for DECAF is available at the following URL
https://github.com/Extreme-classification/DECAF.
- Abstract(参考訳): 極端な多重ラベル分類(xml)は、非常に大きなラベルセットから最も関連するラベルのサブセットでデータポイントをタグ付けすることを含み、何百万もの製品で製品間リコメンデーション(product-to-product recommendation)などいくつかのアプリケーションがある。
主要なXMLアルゴリズムは数百万のラベルにスケールするが、ラベルのテキスト記述のようなラベルメタデータは無視している。
一方、ディープネットワークを用いた表現学習によってラベルメタデータを活用できる古典的手法では、極端な設定が困難である。
本稿では,ディープネットワークを用いてモデルパラメータと特徴表現を共同で学習し,数百万のラベルの規模で正確な分類を行うラベルメタデータにより,これらの課題に対処するDECAFアルゴリズムを開発した。
DECAFは、モデルアーキテクチャ設計、初期化、トレーニングに特定の貢献をしており、LF-AmazonTitles-1.3Mのような、一般公開されている製品間推奨データセットにおいて、極端な分類器を導くよりも最大2-6%正確な予測を提供することができる。
同時に、DeCAFは深い極端分類器よりも最大22倍高速な推論が可能であり、数ミリ秒以内の予測を必要とするリアルタイムアプリケーションに適していることが判明した。
DECAFのコードは以下のURL https://github.com/Extreme-classification/DECAFで利用可能である。
関連論文リスト
- Open-world Multi-label Text Classification with Extremely Weak Supervision [30.85235057480158]
極弱監督(XWS)下でのオープンワールドマルチラベルテキスト分類について検討する。
まず、ユーザ記述を利用して、原文書のサブセットのキーフレーズに対して大きな言語モデル(LLM)をプロンプトし、クラスタリングによりラベル空間を構築する。
次に、ゼロショットのマルチラベル分類器を適用して、予測スコアが小さい文書を見つけることで、より長いテールラベルに対する主要なキーフレーズを再検討する。
X-MLClassは、様々なデータセットにおいて、地平線ラベルの空間カバレッジが顕著に増加している。
論文 参考訳(メタデータ) (2024-07-08T04:52:49Z) - Learning label-label correlations in Extreme Multi-label Classification via Label Features [44.00852282861121]
Extreme Multi-label Text Classification (XMC)は、数百万のラベル選択から最も関連性の高いラベルのサブセットで入力を割り当てることができる分類器を学習する。
ラベル機能付き短文XMCは、検索広告におけるクエリ・ツー・アド・フレーズマッチング、タイトルベースの製品推薦、関連する検索の予測など、多くの分野に応用されている。
本稿では,ラベル共起グラフを用いてラベル特徴を付加データポイントとして活用し,トレーニング分布を補完する新しい手法であるガンダルフを提案する。
論文 参考訳(メタデータ) (2024-05-03T21:18:43Z) - Description-Enhanced Label Embedding Contrastive Learning for Text
Classification [65.01077813330559]
モデル学習プロセスにおける自己監督型学習(SSL)と新しい自己監督型関係関係(R2)分類タスクの設計
テキスト分類とR2分類を最適化対象として扱うテキスト分類のための関係学習ネットワーク(R2-Net)の関係について検討する。
ラベルセマンティックラーニングのためのマルチアスペクト記述を得るためのWordNetからの外部知識。
論文 参考訳(メタデータ) (2023-06-15T02:19:34Z) - Binary Classification with Positive Labeling Sources [71.37692084951355]
WEAPOは、負のラベル付け源を使わずにトレーニングラベルを作成するための、シンプルで競争力のあるWS手法である。
We show WEAPO achieve the highest averaged performance on 10 benchmark datasets。
論文 参考訳(メタデータ) (2022-08-02T19:32:08Z) - Semantic-Aware Representation Blending for Multi-Label Image Recognition
with Partial Labels [86.17081952197788]
そこで我々は,未知のラベルを補うために,異なる画像にカテゴリ固有の表現をブレンドして,既知のラベルの情報を伝達することを提案する。
MS-COCO、Visual Genome、Pascal VOC 2007データセットの実験は、提案されたSARBフレームワークが、現在の主要な競合相手よりも優れたパフォーマンスを得ることを示している。
論文 参考訳(メタデータ) (2022-03-04T07:56:16Z) - ECLARE: Extreme Classification with Label Graph Correlations [13.429436351837653]
本稿では,ラベルテキストだけでなくラベル相関も組み込んだスケーラブルなディープラーニングアーキテクチャECLAREを提案し,数ミリ秒以内の正確なリアルタイム予測を実現する。
ECLAREは、Bing検索エンジンからソースされた関連製品レコメンデーションタスク用のプロプライエタリデータセットと同様に、公開可能なベンチマークデータセットの両方で2~14%精度の予測を提供する。
論文 参考訳(メタデータ) (2021-07-31T15:13:13Z) - MATCH: Metadata-Aware Text Classification in A Large Hierarchy [60.59183151617578]
MATCHはメタデータと階層情報の両方を利用するエンドツーエンドのフレームワークである。
親による各子ラベルのパラメータと出力確率を正規化するさまざまな方法を提案します。
大規模なラベル階層を持つ2つの大規模なテキストデータセットの実験は、MATCHの有効性を示しています。
論文 参考訳(メタデータ) (2021-02-15T05:23:08Z) - LightXML: Transformer with Dynamic Negative Sampling for
High-Performance Extreme Multi-label Text Classification [27.80266694835677]
Extreme Multi-label text Classification (XMC) は、大きなラベルセットから最も関連性の高いラベルを見つけるタスクである。
エンドツーエンドのトレーニングと動的負ラベルサンプリングを採用したLightXMLを提案する。
実験では、LightXMLは5つの極端なマルチラベルデータセットで最先端のメソッドより優れています。
論文 参考訳(メタデータ) (2021-01-09T07:04:18Z) - GNN-XML: Graph Neural Networks for Extreme Multi-label Text
Classification [23.79498916023468]
extreme multi-label text classification (xmtc) は、非常に大きなラベルセットから最も関連するラベルのサブセットでテキストインスタンスをタグ付けすることを目的としている。
GNN-XMLはXMTC問題に適したスケーラブルなグラフニューラルネットワークフレームワークである。
論文 参考訳(メタデータ) (2020-12-10T18:18:34Z) - A Study on the Autoregressive and non-Autoregressive Multi-label
Learning [77.11075863067131]
本稿では,ラベルとラベルの依存関係を共同で抽出する自己アテンションに基づく変分エンコーダモデルを提案する。
したがって、ラベルラベルとラベル機能の両方の依存関係を保ちながら、すべてのラベルを並列に予測することができる。
論文 参考訳(メタデータ) (2020-12-03T05:41:44Z) - An Empirical Study on Large-Scale Multi-Label Text Classification
Including Few and Zero-Shot Labels [49.036212158261215]
大規模なMulti-label Text Classification (LMTC) は、幅広い自然言語処理 (NLP) アプリケーションを持つ。
Label-Wise Attention Networks (LWANs) を用いた最新のLMTCモデル
確率的ラベル木(PLT)に基づく階層的手法がLWANより優れていることを示す。
BERTとLWANを組み合わせた最先端手法を提案する。
論文 参考訳(メタデータ) (2020-10-04T18:55:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。