論文の概要: HFT-ONLSTM: Hierarchical and Fine-Tuning Multi-label Text Classification
- arxiv url: http://arxiv.org/abs/2204.08115v1
- Date: Mon, 18 Apr 2022 00:57:46 GMT
- ステータス: 処理完了
- システム内更新日: 2022-04-19 12:59:36.204305
- Title: HFT-ONLSTM: Hierarchical and Fine-Tuning Multi-label Text Classification
- Title(参考訳): HFT-ONLSTM:階層的・微調整多ラベルテキスト分類
- Authors: Pengfei Gao, Jingpeng Zhao, Yinglong Ma, Ahmad Tanvir, Beihong Jin
- Abstract要約: 階層型マルチラベルテキスト分類(HMTC)は,近縁なカテゴリの大規模集合よりも高精度である。
本稿では,HFT-ONLSTMと略される順序付きニューラルLSTMニューラルネットワークをベースとした階層的・微調整手法を提案し,より正確なレベル・バイ・レベルHMTCを提案する。
- 参考スコア(独自算出の注目度): 7.176984223240199
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Many important classification problems in the real-world consist of a large
number of closely related categories in a hierarchical structure or taxonomy.
Hierarchical multi-label text classification (HMTC) with higher accuracy over
large sets of closely related categories organized in a hierarchy or taxonomy
has become a challenging problem. In this paper, we present a hierarchical and
fine-tuning approach based on the Ordered Neural LSTM neural network,
abbreviated as HFT-ONLSTM, for more accurate level-by-level HMTC. First, we
present a novel approach to learning the joint embeddings based on parent
category labels and textual data for accurately capturing the joint features of
both category labels and texts. Second, a fine tuning technique is adopted for
training parameters such that the text classification results in the upper
level should contribute to the classification in the lower one. At last, the
comprehensive analysis is made based on extensive experiments in comparison
with the state-of-the-art hierarchical and flat multi-label text classification
approaches over two benchmark datasets, and the experimental results show that
our HFT-ONLSTM approach outperforms these approaches, in particular reducing
computational costs while achieving superior performance.
- Abstract(参考訳): 現実世界における多くの重要な分類問題は、階層構造や分類学における多くの密接に関連するカテゴリから構成される。
階層的マルチラベルテキスト分類(HMTC)は,階層構造や分類で整理された近縁なカテゴリの集合よりも高精度である。
本稿では,HFT-ONLSTMと略される順序付きニューラルLSTMニューラルネットワークをベースとした階層的・微調整手法を提案し,より正確なレベル・バイ・レベルHMTCを提案する。
まず,親カテゴリラベルとテクストデータに基づくジョイント埋め込みを学習し,カテゴリラベルとテキストのジョイント特徴を正確に把握する新しい手法を提案する。
第2に、上位レベルのテキスト分類結果が下位層の分類に寄与するように、パラメータを訓練するために微調整技術が採用されている。
その結果,HFT-ONLSTM手法は,2つのベンチマークデータセットに対する最先端の階層的およびフラットな多ラベルテキスト分類手法と比較し,これらの手法よりも高い性能を示し,特に計算コストを低減し,優れた性能を実現した。
関連論文リスト
- Balanced Classification: A Unified Framework for Long-Tailed Object
Detection [74.94216414011326]
従来の検出器は、分類バイアスによる長期データを扱う際の性能劣化に悩まされる。
本稿では,カテゴリ分布の格差に起因する不平等の適応的是正を可能にする,BAlanced CLassification (BACL) と呼ばれる統一フレームワークを提案する。
BACLは、さまざまなバックボーンとアーキテクチャを持つさまざまなデータセット間で、一貫してパフォーマンス改善を実現している。
論文 参考訳(メタデータ) (2023-08-04T09:11:07Z) - Semantic Guided Level-Category Hybrid Prediction Network for
Hierarchical Image Classification [8.456482280676884]
階層分類(HC)は、各オブジェクトに階層構造にまとめられた複数のラベルを割り当てる。
本稿では,そのレベルとカテゴリの予測をエンドツーエンドで共同で行うことのできる,セマンティックガイド付き階層型ハイブリッド予測ネットワーク(SGLCHPN)を提案する。
論文 参考訳(メタデータ) (2022-11-22T13:49:10Z) - Many-Class Text Classification with Matching [65.74328417321738]
textbfText textbfClassification をテキストとラベル間のtextbfMatching 問題として定式化し,TCM というシンプルなフレームワークを提案する。
従来のテキスト分類手法と比較して、TCMは分類ラベルのきめ細かい意味情報を活用している。
論文 参考訳(メタデータ) (2022-05-23T15:51:19Z) - Decision Making for Hierarchical Multi-label Classification with
Multidimensional Local Precision Rate [4.812468844362369]
我々は,各クラスの各対象に対して,多次元局所精度率 (mLPR) と呼ばれる新しい統計モデルを導入する。
我々は,mLPRの下位順序でクラス間でオブジェクトをソートするだけで,クラス階層を確実にすることができることを示す。
これに対し、階層を尊重しながら推定mLPRを用いてCATCHの実証バージョンを最大化する新しいアルゴリズムであるHierRankを導入する。
論文 参考訳(メタデータ) (2022-05-16T17:43:35Z) - CoPHE: A Count-Preserving Hierarchical Evaluation Metric in Large-Scale
Multi-Label Text Classification [70.554573538777]
ニューラルLMTCモデルの予測の階層的評価について論じる。
先行技術における構造化ラベル空間の表現における構造的問題について述べる。
深度に基づく表現を用いた階層的評価のための指標セットを提案する。
論文 参考訳(メタデータ) (2021-09-10T13:09:12Z) - Multitask Learning for Class-Imbalanced Discourse Classification [74.41900374452472]
マルチタスクアプローチは,現在のベンチマークで7%のマイクロf1コアを改善できることを示す。
また,NLPにおける資源不足問題に対処するための追加手法の比較検討を行った。
論文 参考訳(メタデータ) (2021-01-02T07:13:41Z) - Coherent Hierarchical Multi-Label Classification Networks [56.41950277906307]
C-HMCNN(h)はHMC問題に対する新しいアプローチであり、階層情報を利用して制約に整合した予測を生成し、性能を向上させる。
最先端モデルと比較してC-HMCNN(h)の優れた性能を示す広範囲な実験的検討を行った。
論文 参考訳(メタデータ) (2020-10-20T09:37:02Z) - Revisiting LSTM Networks for Semi-Supervised Text Classification via
Mixed Objective Function [106.69643619725652]
我々は,単純なBiLSTMモデルであっても,クロスエントロピー損失でトレーニングした場合に,競争的な結果が得られるようなトレーニング戦略を開発する。
いくつかのベンチマークデータセット上で,テキスト分類タスクの最先端結果について報告する。
論文 参考訳(メタデータ) (2020-09-08T21:55:22Z) - Joint Embedding of Words and Category Labels for Hierarchical
Multi-label Text Classification [4.2750700546937335]
階層的テキスト分類(HTC)は広く注目されており、幅広い応用の見通しがある。
本稿では,HTC の階層的微調整順序ニューロン LSTM (HFT-ONLSTM) に基づくテキストと親カテゴリの結合埋め込みを提案する。
論文 参考訳(メタデータ) (2020-04-06T11:06:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。