論文の概要: Does Head Label Help for Long-Tailed Multi-Label Text Classification
- arxiv url: http://arxiv.org/abs/2101.09704v1
- Date: Sun, 24 Jan 2021 12:31:39 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-16 09:18:17.746085
- Title: Does Head Label Help for Long-Tailed Multi-Label Text Classification
- Title(参考訳): head labelはロングテールのマルチラベルテキスト分類に役立つか
- Authors: Lin Xiao, Xiangliang Zhang, Liping Jing, Chi Huang, Mingyang Song
- Abstract要約: 実際の応用では、ラベル周波数の分布は長い尾を持つことが多く、少数のラベルが大量の文書に関連付けられている。
データ豊富なヘッドラベルからデータ貧弱なテールラベルへメタ知識を転送するヘッドツーテールネットワーク(HTTN)を提案する。
- 参考スコア(独自算出の注目度): 45.762555329467446
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Multi-label text classification (MLTC) aims to annotate documents with the
most relevant labels from a number of candidate labels. In real applications,
the distribution of label frequency often exhibits a long tail, i.e., a few
labels are associated with a large number of documents (a.k.a. head labels),
while a large fraction of labels are associated with a small number of
documents (a.k.a. tail labels). To address the challenge of insufficient
training data on tail label classification, we propose a Head-to-Tail Network
(HTTN) to transfer the meta-knowledge from the data-rich head labels to
data-poor tail labels. The meta-knowledge is the mapping from few-shot network
parameters to many-shot network parameters, which aims to promote the
generalizability of tail classifiers. Extensive experimental results on three
benchmark datasets demonstrate that HTTN consistently outperforms the
state-of-the-art methods. The code and hyper-parameter settings are released
for reproducibility
- Abstract(参考訳): MLTC(Multi-label text classification)は、複数の候補ラベルから最も関連性の高いラベルを持つ文書を注釈付けすることを目的とする。
実際のアプリケーションでは、ラベル周波数の分布はしばしば長い尾を示す、すなわち、少数のラベルは多数の文書(a.k.a.)に関連付けられている。
ヘッドラベル) ラベルのごく一部は少数の文書(a.k.a.)に関連付けられている。
尾のラベル)。
テールラベル分類におけるトレーニングデータ不足に対処するため,HTTN(Head-to-Tail Network)を提案し,メタ知識をデータリッチなヘッドラベルからデータポーアなテールラベルに転送する。
メタ知識は、少数ショットネットワークパラメータから多ショットネットワークパラメータへのマッピングであり、テール分類器の一般化を促進することを目的としている。
3つのベンチマークデータセットの大規模な実験結果は、HTTNが最先端の手法を一貫して上回っていることを示している。
再現性のためにコードとハイパーパラメータの設定がリリース
関連論文リスト
- Weakly-Supervised Scientific Document Classification via
Retrieval-Augmented Multi-Stage Training [24.2734548438594]
本稿では,ラベル名のみを用いた科学的文書分類のための弱教師付きアプローチを提案する。
科学的ドメインでは、ラベル名は文書コーパスに現れないドメイン固有の概念を含むことが多い。
WANDER は平均 11.9% で最高のベースラインを上回ります。
論文 参考訳(メタデータ) (2023-06-12T15:50:13Z) - Exploring Structured Semantic Prior for Multi Label Recognition with
Incomplete Labels [60.675714333081466]
不完全なラベルを持つマルチラベル認識(MLR)は非常に難しい。
最近の研究は、視覚言語モデルであるCLIPにおける画像とラベルの対応を探り、不十分なアノテーションを補うことを目指している。
我々は,MLRにおけるラベル管理の欠如を,構造化されたセマンティクスを導出することにより,不完全なラベルで修復することを提唱する。
論文 参考訳(メタデータ) (2023-03-23T12:39:20Z) - Review of Extreme Multilabel Classification [1.888738346075831]
極端なマルチラベル分類(英: Extreme multilabel classification、XML)は、機械学習における活発な関心領域である。
コミュニティは、頭や尾のラベルの予測を正しく識別するために有用なメトリクスセットを考案した。
論文 参考訳(メタデータ) (2023-02-12T18:29:20Z) - Pairwise Instance Relation Augmentation for Long-tailed Multi-label Text
Classification [38.66674700075432]
Pairwise Instance Relation Augmentation Network (PIRAN) を提案する。
PIRANはSOTA法を一貫して上回り、テールラベルの性能を劇的に向上させる。
論文 参考訳(メタデータ) (2022-11-19T12:45:54Z) - Structured Semantic Transfer for Multi-Label Recognition with Partial
Labels [85.6967666661044]
部分ラベル付きマルチラベル認識モデルのトレーニングを可能にする構造化意味伝達(SST)フレームワークを提案する。
このフレームワークは2つの相補的なトランスファーモジュールから構成され、インテリアイメージとクロスイメージセマンティック相関を探索する。
Microsoft COCO、Visual Genome、Pascal VOCデータセットの実験は、提案されたSSTフレームワークが現在の最先端アルゴリズムよりも優れたパフォーマンスが得られることを示している。
論文 参考訳(メタデータ) (2021-12-21T02:15:01Z) - MATCH: Metadata-Aware Text Classification in A Large Hierarchy [60.59183151617578]
MATCHはメタデータと階層情報の両方を利用するエンドツーエンドのフレームワークである。
親による各子ラベルのパラメータと出力確率を正規化するさまざまな方法を提案します。
大規模なラベル階層を持つ2つの大規模なテキストデータセットの実験は、MATCHの有効性を示しています。
論文 参考訳(メタデータ) (2021-02-15T05:23:08Z) - A Study on the Autoregressive and non-Autoregressive Multi-label
Learning [77.11075863067131]
本稿では,ラベルとラベルの依存関係を共同で抽出する自己アテンションに基づく変分エンコーダモデルを提案する。
したがって、ラベルラベルとラベル機能の両方の依存関係を保ちながら、すべてのラベルを並列に予測することができる。
論文 参考訳(メタデータ) (2020-12-03T05:41:44Z) - Label-Wise Document Pre-Training for Multi-Label Text Classification [14.439051753832032]
本稿では,ラベル認識情報を用いた文書表現を実現するLW-PT法を提案する。
基本的な考え方は、複数ラベルの文書は、複数のラベルの表現の組み合わせとして表すことができ、相関ラベルは、常に同じまたは類似の文書で共起するということである。
論文 参考訳(メタデータ) (2020-08-15T10:34:27Z) - Few-shot Slot Tagging with Collapsed Dependency Transfer and
Label-enhanced Task-adaptive Projection Network [61.94394163309688]
本稿では,現在最先端の少数ショット分類モデルであるTapNetに基づくラベル強化タスク適応プロジェクションネットワーク(L-TapNet)を提案する。
実験結果から,本モデルは1ショット設定で14.64点のF1スコアで最強の少ショット学習ベースラインを著しく上回っていることがわかった。
論文 参考訳(メタデータ) (2020-06-10T07:50:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。