Fugu-MT 論文翻訳(概要): Embedding Convolutions for Short Text Extreme Classification with Millions of Labels

論文の概要: Embedding Convolutions for Short Text Extreme Classification with Millions of Labels

arxiv url: http://arxiv.org/abs/2109.07319v1
Date: Mon, 13 Sep 2021 18:55:37 GMT
ステータス: 翻訳完了
システム内更新日: 2021-09-16 15:21:57.593235
Title: Embedding Convolutions for Short Text Extreme Classification with Millions of Labels
Title（参考訳）: 数百万のラベルを用いた短文極小分類のための畳み込み畳み込み
Authors: Siddhant Kharbanda, Atmadeep Banerjee, Akash Palrecha, Rohit Babbar
Abstract要約: Short Text Extreme Classificationは、最近、関連する検索や製品レコメンデーションタスクの予測に多くの応用を見出した。本稿では、畳み込み操作をリキャストして、埋め込み次元に沿って結合された意味をキャプチャする手法を提案する。畳み込み操作の計算効率から恩恵を受ける、エンリッチな単語埋め込みに適用された畳み込み畳み込みは、軽量で強力なエンコーダをもたらす(InceptionXML)。
参考スコア（独自算出の注目度）: 1.7044368816068713
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Automatic annotation of short-text data to a large number of target labels, referred to as Short Text Extreme Classification, has recently found numerous applications in prediction of related searches and product recommendation tasks. The conventional usage of Convolutional Neural Network (CNN) to capture n-grams in text-classification relies heavily on uniformity in word-ordering and the presence of long input sequences to convolve over. However, this is missing in short and unstructured text sequences encountered in search and recommendation. In order to tackle this, we propose an orthogonal approach by recasting the convolution operation to capture coupled semantics along the embedding dimensions, and develop a word-order agnostic embedding enhancement module to deal with the lack of structure in such queries. Benefitting from the computational efficiency of the convolution operation, Embedding Convolutions, when applied on the enriched word embeddings, result in a light-weight and yet powerful encoder (InceptionXML) that is robust to the inherent lack of structure in short-text extreme classification. Towards scaling our model to problems with millions of labels, we also propose InceptionXML+, which addresses the shortcomings of the dynamic hard-negative mining framework in the recently proposed LightXML by improving the alignment between the label-shortlister and extreme classifier. On popular benchmark datasets, we empirically demonstrate that the proposed method outperforms state-of-the-art deep extreme classifiers such as Astec by an average of 5% and 8% on the P@k and propensity-scored PSP@k metrics respectively.
Abstract（参考訳）: ショートテキスト極端分類と呼ばれる多数のターゲットラベルに対するショートテキストデータの自動アノテーションは、最近、関連する検索と製品推奨タスクの予測に多くの応用が見つかった。テキスト分類におけるn-gramを捉えるために従来の畳み込みニューラルネットワーク(CNN)は、単語順序の均一性と長い入力シーケンスの存在に大きく依存している。しかし、これは検索やレコメンデーションで遭遇する短く非構造化のテキストシーケンスに欠けている。そこで本研究では, 畳み込み操作をリキャストして, 組込み次元に沿った結合意味を捕捉し, 単語順に依存しない組込み拡張モジュールを開発し, クエリの構造の欠如に対処する直交アプローチを提案する。畳み込み操作の計算効率の恩恵を受け、畳み込みが強化された単語埋め込みに適用されると、軽量かつ強力なエンコーダ(インセプションxml)となり、短文の極端な分類において構造が本質的に欠如していることに頑健になる。 InceptionXML+は、ラベルショートリストと極端な分類器の整合性を改善することで、最近提案されたLightXMLにおける動的なハードネガティブなマイニングフレームワークの欠点に対処します。一般的なベンチマークデータセットでは,提案手法がastecのような最先端の深部極端分類器を平均5%,p@kで8%,psp@kメトリクスをそれぞれ上回っていることを実証的に示す。

関連論文リスト

Order-agnostic Identifier for Large Language Model-based Generative Recommendation [94.37662915542603]
アイテムは、ユーザ履歴をエンコードし、次のアイテムを生成するために、LLM(Large Language Models)の識別子に割り当てられる。既存のアプローチでは、トークンシーケンス識別子を使用して、アイテムを個別のトークンシーケンスとして表現するか、IDまたはセマンティック埋め込みを使用して単一トークン識別子を使用する。本稿では,セマンティック・トークンライザを利用するSETRecを提案する。
論文参考訳（メタデータ） (2025-02-15T15:25:38Z)
Prototypical Extreme Multi-label Classification with a Dynamic Margin Loss [6.244642999033755]
XMC (Extreme Multi-label Classification) メソッドは、非常に大きなラベル空間において、与えられたクエリの関連ラベルを予測する。 XMCにおける最近の研究は、テキスト記述を最も近いラベルの復元に適した埋め込み空間に投影するディープエンコーダを用いてこの問題に対処している。本稿では,新しいプロトタイプ・コントラスト学習技術を用いて,ブルートフォース手法を超越した効率と性能を再現するXMC手法PRIMEを提案する。
論文参考訳（メタデータ） (2024-10-27T10:24:23Z)
REXEL: An End-to-end Model for Document-Level Relation Extraction and Entity Linking [11.374031643273941]
REXELは文書レベルcIE(DocIE)の共同作業のための高効率かつ高精度なモデルである同様の環境では、競合する既存のアプローチよりも平均11倍高速です。速度と精度の組み合わせにより、REXELはWebスケールで構造化された情報を抽出する正確なコスト効率のシステムとなる。
論文参考訳（メタデータ） (2024-04-19T11:04:27Z)
Exploring Structured Semantic Prior for Multi Label Recognition with Incomplete Labels [60.675714333081466]
不完全なラベルを持つマルチラベル認識(MLR)は非常に難しい。最近の研究は、視覚言語モデルであるCLIPにおける画像とラベルの対応を探り、不十分なアノテーションを補うことを目指している。我々は,MLRにおけるラベル管理の欠如を,構造化されたセマンティクスを導出することにより,不完全なラベルで修復することを提唱する。
論文参考訳（メタデータ） (2023-03-23T12:39:20Z)
CascadeXML: Rethinking Transformers for End-to-end Multi-resolution Training in Extreme Multi-label Classification [1.6886874648363768]
Extreme Multi-label Text Classification (XMC)は、数百万のラベル選択から最も関連性の高いラベルのサブセットで入力を割り当てることができる分類器を学習する。 XR-TransformerやLightXMLといった最近のアプローチでは、トランスフォーマーインスタンスを活用して最先端のパフォーマンスを実現している。本稿では,トランスフォーマーモデルの多層アーキテクチャを活用して,異なるラベル解像度に異なる特徴表現で対応可能な,エンドツーエンドのマルチレゾリューション学習パイプラインであるCascadeXMLを提案する。
論文参考訳（メタデータ） (2022-10-29T11:03:23Z)
Text Summarization with Oracle Expectation [88.39032981994535]
抽出要約は、文書の中で最も重要な文を識別し、連結することによって要約を生成する。ほとんどの要約データセットは、文書文が要約に値するかどうかを示す金のラベルを持っていない。本稿では,ソフトな予測に基づく文ラベルを生成する,シンプルで効果的なラベル付けアルゴリズムを提案する。
論文参考訳（メタデータ） (2022-09-26T14:10:08Z)
Exploiting Dynamic and Fine-grained Semantic Scope for Extreme Multi-label Text Classification [12.508006325140949]
XMTC (Extreme Multi-label text classification) とは、あるテキストをラベル集合から最も関連性の高いサブセットにタグ付けする問題を指す。既存のXMTC法の多くは、初期から得られた固定ラベルクラスタを利用して、テールラベルとヘッドラベルのパフォーマンスのバランスをとる。我々は,教師の知識から動的かつきめ細かなセマンティックスコープを取り入れた,XMTCのための新しいフレームワークTReaderXMLを提案する。
論文参考訳（メタデータ） (2022-05-24T11:15:35Z)
Label Disentanglement in Partition-based Extreme Multilabel Classification [111.25321342479491]
分割型XMCにおけるラベル割り当て問題を最適化問題として定式化できることを示す。提案手法はマルチモーダルラベルのアンタングル化に成功し、4つのXMCベンチマークでSOTA(State-of-the-art)結果が得られた。
論文参考訳（メタデータ） (2021-06-24T03:24:18Z)
HTCInfoMax: A Global Model for Hierarchical Text Classification via Information Maximization [75.45291796263103]
階層的テキスト分類のための現在の最新モデルHiAGMには2つの制限がある。関連しない情報を含むデータセット内のすべてのラベルと、各テキストサンプルを関連付ける。 2つのモジュールを含む情報を導入することで、これらの問題に対処するHTCInfoMaxを提案します。
論文参考訳（メタデータ） (2021-04-12T06:04:20Z)
Group-aware Label Transfer for Domain Adaptive Person Re-identification [179.816105255584]
Unsupervised Adaptive Domain (UDA) Person Re-identification (ReID) は、ラベル付きソースドメインデータセットで訓練されたモデルを、さらなるアノテーションなしでターゲットドメインデータセットに適応することを目的としている。最も成功したUDA-ReIDアプローチは、クラスタリングに基づく擬似ラベル予測と表現学習を組み合わせて、2つのステップを交互に実行する。疑似ラベル予測と表現学習のオンラインインタラクションと相互促進を可能にするグループ認識ラベル転送(GLT)アルゴリズムを提案します。
論文参考訳（メタデータ） (2021-03-23T07:57:39Z)
MATCH: Metadata-Aware Text Classification in A Large Hierarchy [60.59183151617578]
MATCHはメタデータと階層情報の両方を利用するエンドツーエンドのフレームワークである。親による各子ラベルのパラメータと出力確率を正規化するさまざまな方法を提案します。大規模なラベル階層を持つ2つの大規模なテキストデータセットの実験は、MATCHの有効性を示しています。
論文参考訳（メタデータ） (2021-02-15T05:23:08Z)
LightXML: Transformer with Dynamic Negative Sampling for High-Performance Extreme Multi-label Text Classification [27.80266694835677]
Extreme Multi-label text Classification (XMC) は、大きなラベルセットから最も関連性の高いラベルを見つけるタスクである。エンドツーエンドのトレーニングと動的負ラベルサンプリングを採用したLightXMLを提案する。実験では、LightXMLは5つの極端なマルチラベルデータセットで最先端のメソッドより優れています。
論文参考訳（メタデータ） (2021-01-09T07:04:18Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。