論文の概要: Adopting the Multi-answer Questioning Task with an Auxiliary Metric for
Extreme Multi-label Text Classification Utilizing the Label Hierarchy
- arxiv url: http://arxiv.org/abs/2303.01064v1
- Date: Thu, 2 Mar 2023 08:40:31 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-03 15:23:28.069926
- Title: Adopting the Multi-answer Questioning Task with an Auxiliary Metric for
Extreme Multi-label Text Classification Utilizing the Label Hierarchy
- Title(参考訳): ラベル階層を用いた極端なマルチラベルテキスト分類のための補助指標を用いたマルチアンウェル質問タスクの適用
- Authors: Li Wang, Ying Wah Teh, Mohammed Ali Al-Garadi
- Abstract要約: 本稿では,過度なマルチラベル分類のための複数問合せタスクを採用する。
本研究では,提案手法と評価基準を法域に適用する。
- 参考スコア(独自算出の注目度): 10.87653109398961
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Extreme multi-label text classification utilizes the label hierarchy to
partition extreme labels into multiple label groups, turning the task into
simple multi-group multi-label classification tasks. Current research encodes
labels as a vector with fixed length which needs establish multiple classifiers
for different label groups. The problem is how to build only one classifier
without sacrificing the label relationship in the hierarchy. This paper adopts
the multi-answer questioning task for extreme multi-label classification. This
paper also proposes an auxiliary classification evaluation metric. This study
adopts the proposed method and the evaluation metric to the legal domain. The
utilization of legal Berts and the study on task distribution are discussed.
The experiment results show that the proposed hierarchy and multi-answer
questioning task can do extreme multi-label classification for EURLEX dataset.
And in minor/fine-tuning the multi-label classification task, the domain
adapted BERT models could not show apparent advantages in this experiment. The
method is also theoretically applicable to zero-shot learning.
- Abstract(参考訳): エクストリームマルチラベルテキスト分類は、ラベル階層を利用して、極端なラベルを複数のラベルグループに分割し、タスクを単純なマルチグループマルチラベル分類タスクに変換する。
現在の研究では、ラベルを固定長のベクトルとしてエンコードしており、異なるラベル群に対して複数の分類器を確立する必要がある。
問題は、階層内のラベル関係を犠牲にすることなく、1つの分類子のみを構築する方法だ。
本稿では,過度なマルチラベル分類のための複数問合せタスクを採用する。
本稿では,補助的な分類評価指標を提案する。
本研究は,法領域に対して提案手法と評価基準を適用した。
法的bertの利用とタスク分散に関する研究について考察した。
実験結果から,EURLEXデータセットに対して,階層構造と複数問合せタスクを極端に多ラベル分類できることがわかった。
マルチラベル分類タスクの微調整では、領域適応BERTモデルは、この実験で明らかな利点を示さなかった。
この方法は理論上ゼロショット学習にも応用できる。
関連論文リスト
- Active Generalized Category Discovery [60.69060965936214]
GCD(Generalized Category Discovery)は、新しいクラスと古いクラスの未ラベルのサンプルをクラスタ化するための取り組みである。
我々は,能動的学習の精神を取り入れて,能動的一般化カテゴリー発見(AGCD)という新たな設定を提案する。
提案手法は, 汎用および微粒なデータセット上での最先端性能を実現する。
論文 参考訳(メタデータ) (2024-03-07T07:12:24Z) - Multi-Label Knowledge Distillation [86.03990467785312]
本稿では,新しい多ラベル知識蒸留法を提案する。
一方、マルチラベル学習問題をバイナリ分類問題に分割することにより、ロジットからの情報的意味知識を利用する。
一方,ラベルワイド埋め込みの構造情報を活用することにより,学習した特徴表現の識別性を向上する。
論文 参考訳(メタデータ) (2023-08-12T03:19:08Z) - Towards Imbalanced Large Scale Multi-label Classification with Partially
Annotated Labels [8.977819892091]
マルチラベル分類は、複数のクラスにインスタンスを関連付けることができる日常生活において、広く発生する問題である。
本研究では,ラベルの不均衡の問題に対処し,部分ラベルを用いたニューラルネットワークのトレーニング方法について検討する。
論文 参考訳(メタデータ) (2023-07-31T21:50:48Z) - Learning from Stochastic Labels [8.178975818137937]
マルチクラスインスタンスのアノテーションは、機械学習の分野で重要なタスクである。
本稿では,これらのラベルから学習するための新しいアプローチを提案する。
論文 参考訳(メタデータ) (2023-02-01T08:04:27Z) - Multi-Instance Partial-Label Learning: Towards Exploiting Dual Inexact
Supervision [53.530957567507365]
実世界のタスクでは、各トレーニングサンプルは、1つの基底真実ラベルといくつかの偽陽性ラベルを含む候補ラベルセットに関連付けられている。
本稿では,Multi-instance partial-label learning (MIPL) などの問題を定式化する。
既存のマルチインスタンス学習アルゴリズムと部分ラベル学習アルゴリズムはMIPL問題の解法に最適である。
論文 参考訳(メタデータ) (2022-12-18T03:28:51Z) - TagRec++: Hierarchical Label Aware Attention Network for Question
Categorization [0.3683202928838613]
オンライン学習システムは、階層的な性質の明確に定義された分類に従ってコンテンツを整理する。
階層ラベルへの入力を分類するタスクは通常、フラットな多クラス分類問題として扱われる。
各コンテンツに対して適切な階層ラベルを検索するために,タスクを高密度検索問題として定式化する。
論文 参考訳(メタデータ) (2022-08-10T05:08:37Z) - Expert Knowledge-Guided Length-Variant Hierarchical Label Generation for
Proposal Classification [21.190465278587045]
提案分類は、提案をラベルの長さ可変シーケンスに分類することを目的としている。
我々は3つの特徴を共同でモデル化する新しいディーププロポーザル分類フレームワークを開発した。
我々のモデルは,次のラベル予測を止めるために,ラベルシーケンスの最適な長さを自動的に識別することができる。
論文 参考訳(メタデータ) (2021-09-14T13:09:28Z) - MATCH: Metadata-Aware Text Classification in A Large Hierarchy [60.59183151617578]
MATCHはメタデータと階層情報の両方を利用するエンドツーエンドのフレームワークである。
親による各子ラベルのパラメータと出力確率を正規化するさまざまな方法を提案します。
大規模なラベル階層を持つ2つの大規模なテキストデータセットの実験は、MATCHの有効性を示しています。
論文 参考訳(メタデータ) (2021-02-15T05:23:08Z) - Multilabel Classification by Hierarchical Partitioning and
Data-dependent Grouping [33.48217977134427]
ラベルベクトルの空間性と階層構造を利用して、それらを低次元空間に埋め込む。
我々は、低ランク非負行列因子化に基づくグループ構成を用いる、新しいデータ依存型グループ化手法を提案する。
次に、大規模問題におけるラベル階層を利用して、大きなラベル空間を分割し、より小さなサブプロブレムを生成する階層的分割手法を提案する。
論文 参考訳(メタデータ) (2020-06-24T22:23:39Z) - Interaction Matching for Long-Tail Multi-Label Classification [57.262792333593644]
既存のマルチラベル分類モデルにおいて,制約に対処するためのエレガントで効果的なアプローチを提案する。
ソフトなn-gram相互作用マッチングを実行することで、ラベルと自然言語記述をマッチングする。
論文 参考訳(メタデータ) (2020-05-18T15:27:55Z) - Unsupervised Person Re-identification via Multi-label Classification [55.65870468861157]
本稿では,教師なしのReIDを多ラベル分類タスクとして定式化し,段階的に真のラベルを求める。
提案手法は,まず,各人物画像に単一クラスラベルを割り当てることから始まり,ラベル予測のために更新されたReIDモデルを活用することで,多ラベル分類へと進化する。
マルチラベル分類におけるReIDモデルのトレーニング効率を高めるために,メモリベースマルチラベル分類損失(MMCL)を提案する。
論文 参考訳(メタデータ) (2020-04-20T12:13:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。