論文の概要: Description Based Text Classification with Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2002.03067v3
- Date: Thu, 4 Jun 2020 13:18:34 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-02 22:46:05.801806
- Title: Description Based Text Classification with Reinforcement Learning
- Title(参考訳): 強化学習による記述に基づくテキスト分類
- Authors: Duo Chai, Wei Wu, Qinghong Han, Fei Wu, Jiwei Li
- Abstract要約: 本稿では,各カテゴリのラベルをカテゴリ記述に関連付ける,テキスト分類のための新しいフレームワークを提案する。
我々は、幅広いテキスト分類タスクにおいて、強いベースラインよりも顕著なパフォーマンス向上を観察する。
- 参考スコア(独自算出の注目度): 34.18824470728299
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The task of text classification is usually divided into two stages: {\it text
feature extraction} and {\it classification}. In this standard formalization
categories are merely represented as indexes in the label vocabulary, and the
model lacks for explicit instructions on what to classify. Inspired by the
current trend of formalizing NLP problems as question answering tasks, we
propose a new framework for text classification, in which each category label
is associated with a category description. Descriptions are generated by
hand-crafted templates or using abstractive/extractive models from
reinforcement learning. The concatenation of the description and the text is
fed to the classifier to decide whether or not the current label should be
assigned to the text. The proposed strategy forces the model to attend to the
most salient texts with respect to the label, which can be regarded as a hard
version of attention, leading to better performances. We observe significant
performance boosts over strong baselines on a wide range of text classification
tasks including single-label classification, multi-label classification and
multi-aspect sentiment analysis.
- Abstract(参考訳): テキスト分類のタスクは、通常、"it text feature extraction}"と"it classification"の2つの段階に分けられる。
この標準形式化カテゴリは単にラベル語彙のインデックスとして表現されるだけであり、モデルは分類すべきものに関する明示的な指示を欠いている。
質問応答タスクとしてNLP問題を形式化する現在の傾向に触発されて,各カテゴリラベルをカテゴリ記述に関連付ける,テキスト分類のための新しいフレームワークを提案する。
記述は手作りのテンプレートや強化学習からの抽象的/極端なモデルによって生成される。
記述とテキストの結合は分類器に送られ、現在のラベルがテキストに割り当てられるべきかどうかを判断する。
提案された戦略は、モデルにラベルに関する最も有意義なテキストへの出席を強いるものであり、これは注意の堅いバージョンと見なすことができ、より良いパフォーマンスをもたらす。
シングルラベル分類,マルチラベル分類,マルチアスペクト感情分析など,幅広いテキスト分類タスクにおいて,強いベースラインに対する顕著なパフォーマンス向上が観察された。
関連論文リスト
- Scribbles for All: Benchmarking Scribble Supervised Segmentation Across Datasets [51.74296438621836]
Scribbles for Allは、スクリブルラベルに基づいて訓練されたセマンティックセグメンテーションのためのラベルおよびトレーニングデータ生成アルゴリズムである。
弱い監督の源泉としてのスクリブルの主な制限は、スクリブルセグメンテーションのための挑戦的なデータセットの欠如である。
Scribbles for Allは、いくつかの人気のあるセグメンテーションデータセットのスクリブルラベルを提供し、密集したアノテーションを持つデータセットのスクリブルラベルを自動的に生成するアルゴリズムを提供する。
論文 参考訳(メタデータ) (2024-08-22T15:29:08Z) - Label-Guided Prompt for Multi-label Few-shot Aspect Category Detection [12.094529796168384]
文やカテゴリの表現は、このタスクにおいて重要な問題である。
文やカテゴリを表現するためのラベル誘導プロンプト手法を提案する。
マクロF1スコアは3.86%~4.75%向上した。
論文 参考訳(メタデータ) (2024-07-30T09:11:17Z) - XAI-CLASS: Explanation-Enhanced Text Classification with Extremely Weak
Supervision [6.406111099707549]
XAI-CLASSは、説明強化弱教師付きテキスト分類法である。
単語の正当性予測を補助タスクとして組み込む。
XAI-CLASSは、他の弱い教師付きテキスト分類法よりも大幅に優れている。
論文 参考訳(メタデータ) (2023-10-31T23:24:22Z) - Description-Enhanced Label Embedding Contrastive Learning for Text
Classification [65.01077813330559]
モデル学習プロセスにおける自己監督型学習(SSL)と新しい自己監督型関係関係(R2)分類タスクの設計
テキスト分類とR2分類を最適化対象として扱うテキスト分類のための関係学習ネットワーク(R2-Net)の関係について検討する。
ラベルセマンティックラーニングのためのマルチアスペクト記述を得るためのWordNetからの外部知識。
論文 参考訳(メタデータ) (2023-06-15T02:19:34Z) - Label Semantic Aware Pre-training for Few-shot Text Classification [53.80908620663974]
テキスト分類システムの一般化とデータ効率を向上させるために,ラベルセマンティック・アウェア事前学習(LSAP)を提案する。
LSAPは、ラベル付き文の2次事前学習を行うことにより、ラベルセマンティクスを事前学習された生成モデル(T5)に組み込む。
論文 参考訳(メタデータ) (2022-04-14T17:33:34Z) - MotifClass: Weakly Supervised Text Classification with Higher-order
Metadata Information [47.44278057062421]
そこで本研究では,テキスト文書をカテゴリ表面名のみを持つ事前定義されたカテゴリの集合に分類することを目的とした,弱教師付きテキスト分類の問題について検討する。
具体的には、異種情報ネットワークを介して文書とメタデータの関係をモデル化する。
そこで我々は,カテゴリ名と指示モチーフインスタンスに基づいて,カテゴリ適応モチーフインスタンスを選択し,擬似ラベル付きトレーニングサンプルを検索し,生成する,MotifClassという新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2021-11-07T07:39:10Z) - TF-CR: Weighting Embeddings for Text Classification [6.531659195805749]
本稿では,単語埋め込みの計算において,高頻度のカテゴリー排他語を重み付け可能な新しい重み付け方式TF-CRを提案する。
16の分類データセットの実験はTF-CRの有効性を示し、既存の重み付け方式よりもパフォーマンススコアが向上した。
論文 参考訳(メタデータ) (2020-12-11T19:23:28Z) - Text Classification Using Label Names Only: A Language Model
Self-Training Approach [80.63885282358204]
現在のテキスト分類法は、訓練データとして多くの人ラベルの文書を必要とするのが一般的である。
本モデルでは,トピック分類や感情分類を含む4つのベンチマークデータセットにおいて,約90%の精度が得られた。
論文 参考訳(メタデータ) (2020-10-14T17:06:41Z) - Exploring the Hierarchy in Relation Labels for Scene Graph Generation [75.88758055269948]
提案手法は,Recall@50において,複数の最先端ベースラインを大きなマージン(最大33%の相対利得)で改善することができる。
実験により,提案手法により,最先端のベースラインを大きなマージンで改善できることが示された。
論文 参考訳(メタデータ) (2020-09-12T17:36:53Z) - Joint Embedding of Words and Category Labels for Hierarchical
Multi-label Text Classification [4.2750700546937335]
階層的テキスト分類(HTC)は広く注目されており、幅広い応用の見通しがある。
本稿では,HTC の階層的微調整順序ニューロン LSTM (HFT-ONLSTM) に基づくテキストと親カテゴリの結合埋め込みを提案する。
論文 参考訳(メタデータ) (2020-04-06T11:06:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。