論文の概要: Academic Resource Text Level Multi-label Classification based on
Attention
- arxiv url: http://arxiv.org/abs/2203.10743v1
- Date: Mon, 21 Mar 2022 05:32:35 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-22 14:30:34.801065
- Title: Academic Resource Text Level Multi-label Classification based on
Attention
- Title(参考訳): 留意点に基づく学術資料レベルの多ラベル分類
- Authors: Yue Wang, Yawen Li, Ang Li
- Abstract要約: 階層的多ラベル学術テキスト分類(Hierarchical Multi-label academic text classification, HMTC)は、学術テキストを階層的に構造化されたラベリングシステムに割り当てることである。
本稿では,テキスト,キーワード,階層構造などの特徴を統合することで,学術テキスト(AHMCA)の注目に基づく階層的多言語分類アルゴリズムを提案する。
- 参考スコア(独自算出の注目度): 16.71166207897885
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Hierarchical multi-label academic text classification (HMTC) is to assign
academic texts into a hierarchically structured labeling system. We propose an
attention-based hierarchical multi-label classification algorithm of academic
texts (AHMCA) by integrating features such as text, keywords, and hierarchical
structure, the academic documents are classified into the most relevant
categories. We utilize word2vec and BiLSTM to obtain embedding and latent
vector representations of text, keywords, and hierarchies. We use hierarchical
attention mechanism to capture the associations between keywords, label
hierarchies, and text word vectors to generate hierarchical-specific document
embedding vectors to replace the original text embeddings in HMCN-F. The
experimental results on the academic text dataset demonstrate the effectiveness
of the AHMCA algorithm.
- Abstract(参考訳): 階層的多ラベル学術テキスト分類(Hierarchical multi-label academic text classification, HMTC)は、学術テキストを階層的に構造化されたラベリングシステムに割り当てることである。
本稿では,テキスト,キーワード,階層構造などの特徴を統合することにより,学術文献を最も関連性の高いカテゴリに分類し,注意に基づく学術文章の階層的階層分類アルゴリズムを提案する。
我々は word2vec と BiLSTM を用いてテキスト,キーワード,階層の埋め込みおよび潜時ベクトル表現を得る。
階層的注意機構を用いてキーワード,ラベル階層,およびテキスト単語ベクトル間の関係をキャプチャし,階層的特有な文書埋め込みベクトルを生成し,hmcn-f の原文埋め込みを置き換える。
学術テキストデータセットの実験結果から,AHMCAアルゴリズムの有効性が示された。
関連論文リスト
- Text2Tree: Aligning Text Representation to the Label Tree Hierarchy for
Imbalanced Medical Classification [9.391704905671476]
本稿では、医療用テキストにおけるデータ課題を再考し、Text2Treeと呼ばれるフレームワークに依存しない新しいアルゴリズムを提案する。
ラベルのICDコードツリー構造をカスケードアテンションモジュールに組み込んで階層型ラベル表現を学習する。
異なるラベルのサンプルを再利用・識別することでテキスト分類を向上させるために,2つの新しい学習手法であるSimisity Surrogate Learning (SSL) とDissimilarity Mixup Learning (DML) が考案された。
論文 参考訳(メタデータ) (2023-11-28T10:02:08Z) - Recent Advances in Hierarchical Multi-label Text Classification: A
Survey [11.709847202580505]
階層的マルチラベルテキスト分類は、入力されたテキストを複数のラベルに分類することを目的としており、その中にラベルが構造化され階層的である。
これは、科学文献のアーカイブなど、多くの現実世界の応用において重要なタスクである。
論文 参考訳(メタデータ) (2023-07-30T16:13:00Z) - Hierarchical Multi-Label Classification of Scientific Documents [47.293189105900524]
我々はSciHTCと呼ばれる科学論文の階層的多ラベルテキスト分類のための新しいデータセットを提案する。
このデータセットは、ACM CCSツリーから186,160の論文と1,233のカテゴリを含んでいる。
我々の最良のモデルでは、マクロF1スコアが34.57%に達し、このデータセットが大きな研究機会を提供することを示す。
論文 参考訳(メタデータ) (2022-11-05T04:12:57Z) - Many-Class Text Classification with Matching [65.74328417321738]
textbfText textbfClassification をテキストとラベル間のtextbfMatching 問題として定式化し,TCM というシンプルなフレームワークを提案する。
従来のテキスト分類手法と比較して、TCMは分類ラベルのきめ細かい意味情報を活用している。
論文 参考訳(メタデータ) (2022-05-23T15:51:19Z) - Incorporating Hierarchy into Text Encoder: a Contrastive Learning
Approach for Hierarchical Text Classification [23.719121637849806]
テキストエンコーダにラベル階層を埋め込むための階層型コントラスト学習(HGCLR)を提案する。
トレーニング中、HGCLRはラベル階層のガイダンスの下で入力テキストの正のサンプルを構築する。
トレーニング後、HGCLR拡張テキストエンコーダは冗長な階層を不要にすることができる。
論文 参考訳(メタデータ) (2022-03-08T03:21:45Z) - Minimally-Supervised Structure-Rich Text Categorization via Learning on
Text-Rich Networks [61.23408995934415]
テキストリッチネットワークから学習することで,最小限に教師付き分類を行う新しいフレームワークを提案する。
具体的には、テキスト理解のためのテキスト解析モジュールと、クラス差別的でスケーラブルなネットワーク学習のためのネットワーク学習モジュールの2つのモジュールを共同でトレーニングします。
実験の結果,1つのカテゴリに3つのシード文書しか与えられず,その精度は約92%であった。
論文 参考訳(メタデータ) (2021-02-23T04:14:34Z) - MATCH: Metadata-Aware Text Classification in A Large Hierarchy [60.59183151617578]
MATCHはメタデータと階層情報の両方を利用するエンドツーエンドのフレームワークである。
親による各子ラベルのパラメータと出力確率を正規化するさまざまな方法を提案します。
大規模なラベル階層を持つ2つの大規模なテキストデータセットの実験は、MATCHの有効性を示しています。
論文 参考訳(メタデータ) (2021-02-15T05:23:08Z) - Exploring the Hierarchy in Relation Labels for Scene Graph Generation [75.88758055269948]
提案手法は,Recall@50において,複数の最先端ベースラインを大きなマージン(最大33%の相対利得)で改善することができる。
実験により,提案手法により,最先端のベースラインを大きなマージンで改善できることが示された。
論文 参考訳(メタデータ) (2020-09-12T17:36:53Z) - Joint Embedding of Words and Category Labels for Hierarchical
Multi-label Text Classification [4.2750700546937335]
階層的テキスト分類(HTC)は広く注目されており、幅広い応用の見通しがある。
本稿では,HTC の階層的微調整順序ニューロン LSTM (HFT-ONLSTM) に基づくテキストと親カテゴリの結合埋め込みを提案する。
論文 参考訳(メタデータ) (2020-04-06T11:06:08Z) - Hierarchical Image Classification using Entailment Cone Embeddings [68.82490011036263]
まずラベル階層の知識を任意のCNNベースの分類器に注入する。
画像からの視覚的セマンティクスと組み合わせた外部セマンティクス情報の利用が全体的な性能を高めることを実証的に示す。
論文 参考訳(メタデータ) (2020-04-02T10:22:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。