論文の概要: Incorporating Hierarchy into Text Encoder: a Contrastive Learning
Approach for Hierarchical Text Classification
- arxiv url: http://arxiv.org/abs/2203.03825v1
- Date: Tue, 8 Mar 2022 03:21:45 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-09 14:30:39.159369
- Title: Incorporating Hierarchy into Text Encoder: a Contrastive Learning
Approach for Hierarchical Text Classification
- Title(参考訳): テキストエンコーダへの階層化:階層型テキスト分類のためのコントラスト学習アプローチ
- Authors: Zihan Wang, Peiyi Wang, Lianzhe Huang, Xin Sun, Houfeng Wang
- Abstract要約: テキストエンコーダにラベル階層を埋め込むための階層型コントラスト学習(HGCLR)を提案する。
トレーニング中、HGCLRはラベル階層のガイダンスの下で入力テキストの正のサンプルを構築する。
トレーニング後、HGCLR拡張テキストエンコーダは冗長な階層を不要にすることができる。
- 参考スコア(独自算出の注目度): 23.719121637849806
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Hierarchical text classification is a challenging subtask of multi-label
classification due to its complex label hierarchy. Existing methods encode text
and label hierarchy separately and mix their representations for
classification, where the hierarchy remains unchanged for all input text.
Instead of modeling them separately, in this work, we propose Hierarchy-guided
Contrastive Learning (HGCLR) to directly embed the hierarchy into a text
encoder. During training, HGCLR constructs positive samples for input text
under the guidance of the label hierarchy. By pulling together the input text
and its positive sample, the text encoder can learn to generate the
hierarchy-aware text representation independently. Therefore, after training,
the HGCLR enhanced text encoder can dispense with the redundant hierarchy.
Extensive experiments on three benchmark datasets verify the effectiveness of
HGCLR.
- Abstract(参考訳): 階層的テキスト分類は、複雑なラベル階層のため、マルチラベル分類の難しいサブタスクである。
既存の方法では、テキストとラベルの階層を別々にエンコードし、それらの表現を分類するために混合する。
本研究では,これらを別々にモデル化する代わりに,階層構造をテキストエンコーダに直接組み込む階層構造誘導型コントラスト学習(hgclr)を提案する。
トレーニング中、HGCLRはラベル階層のガイダンスの下で入力テキストの正のサンプルを構築する。
入力テキストとその正のサンプルをプルすることで、テキストエンコーダは階層認識されたテキスト表現を独立して生成することを学ぶことができる。
したがって、訓練後、HGCLR拡張テキストエンコーダは冗長な階層を不要にすることができる。
3つのベンチマークデータセットに対する大規模な実験は、HGCLRの有効性を検証する。
関連論文リスト
- Text2Tree: Aligning Text Representation to the Label Tree Hierarchy for
Imbalanced Medical Classification [9.391704905671476]
本稿では、医療用テキストにおけるデータ課題を再考し、Text2Treeと呼ばれるフレームワークに依存しない新しいアルゴリズムを提案する。
ラベルのICDコードツリー構造をカスケードアテンションモジュールに組み込んで階層型ラベル表現を学習する。
異なるラベルのサンプルを再利用・識別することでテキスト分類を向上させるために,2つの新しい学習手法であるSimisity Surrogate Learning (SSL) とDissimilarity Mixup Learning (DML) が考案された。
論文 参考訳(メタデータ) (2023-11-28T10:02:08Z) - HiTIN: Hierarchy-aware Tree Isomorphism Network for Hierarchical Text
Classification [18.03202012033514]
本稿では階層型木同型ネットワーク(HiTIN)を提案する。
我々は3つの一般的なデータセットで実験を行い、その結果、HiTINはより良いテスト性能とメモリ消費を達成できることを示した。
論文 参考訳(メタデータ) (2023-05-24T14:14:08Z) - Exploiting Global and Local Hierarchies for Hierarchical Text
Classification [34.624922210257125]
既存の手法は、ラベル階層を全てのラベルを含む静的階層構造として扱うグローバルビューでラベル階層をエンコードする。
我々は,グローバル階層とローカル階層の両方をモデル化するために,グローバル階層とローカル階層(HBGL)を用いた階層誘導BERTを提案する。
提案手法は,最先端のHGCLRと比較して,3つのベンチマークデータセットにおいて大幅な改善を実現している。
論文 参考訳(メタデータ) (2022-05-05T12:48:41Z) - Use All The Labels: A Hierarchical Multi-Label Contrastive Learning
Framework [75.79736930414715]
本稿では,すべての利用可能なラベルを活用でき,クラス間の階層的関係を維持できる階層型多言語表現学習フレームワークを提案する。
比較損失に階層的ペナルティを併用し,その階層的制約を強制する。
論文 参考訳(メタデータ) (2022-04-27T21:41:44Z) - Constrained Sequence-to-Tree Generation for Hierarchical Text
Classification [10.143177923523407]
階層的テキスト分類(HTC)は、分類学内で複数の階層的に構造化されたカテゴリに文書を割り当てる難易度の高いタスクである。
本稿では,HTCをシーケンス生成タスクとして定式化し,階層的なラベル構造をモデル化するためのシーケンス・ツー・ツリー・フレームワーク(Seq2Tree)を導入する。
論文 参考訳(メタデータ) (2022-04-02T08:35:39Z) - Deep Hierarchical Semantic Segmentation [76.40565872257709]
階層的セマンティックセマンティックセグメンテーション(HSS)は、クラス階層の観点で視覚的観察を構造化、ピクセル単位で記述することを目的としている。
HSSNは、HSSを画素単位のマルチラベル分類タスクとしてキャストし、現在のセグメンテーションモデルに最小限のアーキテクチャ変更をもたらすだけである。
階層構造によって引き起こされるマージンの制約により、HSSNはピクセル埋め込み空間を再評価し、よく構造化されたピクセル表現を生成する。
論文 参考訳(メタデータ) (2022-03-27T15:47:44Z) - Academic Resource Text Level Multi-label Classification based on
Attention [16.71166207897885]
階層的多ラベル学術テキスト分類(Hierarchical Multi-label academic text classification, HMTC)は、学術テキストを階層的に構造化されたラベリングシステムに割り当てることである。
本稿では,テキスト,キーワード,階層構造などの特徴を統合することで,学術テキスト(AHMCA)の注目に基づく階層的多言語分類アルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-03-21T05:32:35Z) - Minimally-Supervised Structure-Rich Text Categorization via Learning on
Text-Rich Networks [61.23408995934415]
テキストリッチネットワークから学習することで,最小限に教師付き分類を行う新しいフレームワークを提案する。
具体的には、テキスト理解のためのテキスト解析モジュールと、クラス差別的でスケーラブルなネットワーク学習のためのネットワーク学習モジュールの2つのモジュールを共同でトレーニングします。
実験の結果,1つのカテゴリに3つのシード文書しか与えられず,その精度は約92%であった。
論文 参考訳(メタデータ) (2021-02-23T04:14:34Z) - MATCH: Metadata-Aware Text Classification in A Large Hierarchy [60.59183151617578]
MATCHはメタデータと階層情報の両方を利用するエンドツーエンドのフレームワークである。
親による各子ラベルのパラメータと出力確率を正規化するさまざまな方法を提案します。
大規模なラベル階層を持つ2つの大規模なテキストデータセットの実験は、MATCHの有効性を示しています。
論文 参考訳(メタデータ) (2021-02-15T05:23:08Z) - Hierarchical Bi-Directional Self-Attention Networks for Paper Review
Rating Recommendation [81.55533657694016]
本稿では,階層型双方向自己注意ネットワークフレームワーク(HabNet)を提案する。
具体的には、文エンコーダ(レベル1)、レビュー内エンコーダ(レベル2)、レビュー間エンコーダ(レベル3)の3つのレベルで、論文レビューの階層構造を利用する。
我々は、最終的な受理決定を行う上で有用な予測者を特定することができ、また、数値的なレビュー評価とレビュアーが伝えるテキストの感情の不整合を発見するのに役立てることができる。
論文 参考訳(メタデータ) (2020-11-02T08:07:50Z) - Exploring the Hierarchy in Relation Labels for Scene Graph Generation [75.88758055269948]
提案手法は,Recall@50において,複数の最先端ベースラインを大きなマージン(最大33%の相対利得)で改善することができる。
実験により,提案手法により,最先端のベースラインを大きなマージンで改善できることが示された。
論文 参考訳(メタデータ) (2020-09-12T17:36:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。