論文の概要: TagRec++: Hierarchical Label Aware Attention Network for Question
Categorization
- arxiv url: http://arxiv.org/abs/2208.05152v1
- Date: Wed, 10 Aug 2022 05:08:37 GMT
- ステータス: 処理完了
- システム内更新日: 2022-08-11 13:00:05.059332
- Title: TagRec++: Hierarchical Label Aware Attention Network for Question
Categorization
- Title(参考訳): TagRec++: 質問分類のための階層的なラベル認識ネットワーク
- Authors: Venktesh Viswanathan, Mukesh Mohania and Vikram Goyal
- Abstract要約: オンライン学習システムは、階層的な性質の明確に定義された分類に従ってコンテンツを整理する。
階層ラベルへの入力を分類するタスクは通常、フラットな多クラス分類問題として扱われる。
各コンテンツに対して適切な階層ラベルを検索するために,タスクを高密度検索問題として定式化する。
- 参考スコア(独自算出の注目度): 0.3683202928838613
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Online learning systems have multiple data repositories in the form of
transcripts, books and questions. To enable ease of access, such systems
organize the content according to a well defined taxonomy of hierarchical
nature (subject-chapter-topic). The task of categorizing inputs to the
hierarchical labels is usually cast as a flat multi-class classification
problem. Such approaches ignore the semantic relatedness between the terms in
the input and the tokens in the hierarchical labels. Alternate approaches also
suffer from class imbalance when they only consider leaf level nodes as labels.
To tackle the issues, we formulate the task as a dense retrieval problem to
retrieve the appropriate hierarchical labels for each content. In this paper,
we deal with categorizing questions. We model the hierarchical labels as a
composition of their tokens and use an efficient cross-attention mechanism to
fuse the information with the term representations of the content. We also
propose an adaptive in-batch hard negative sampling approach which samples
better negatives as the training progresses. We demonstrate that the proposed
approach \textit{TagRec++} outperforms existing state-of-the-art approaches on
question datasets as measured by Recall@k. In addition, we demonstrate
zero-shot capabilities of \textit{TagRec++} and ability to adapt to label
changes.
- Abstract(参考訳): オンライン学習システムは、テキスト、本、質問の形式で複数のデータリポジトリを持っている。
アクセスを容易にするため、このようなシステムは、階層的性質(主観的チャプタートピック)の明確に定義された分類に従ってコンテンツを整理する。
階層ラベルへの入力を分類するタスクは通常、フラットな多クラス分類問題として扱われる。
このようなアプローチは、入力の用語と階層的なラベルのトークンの間の意味的関連性を無視する。
リーフレベルのノードをラベルとしてのみ考える場合、代替アプローチもクラス不均衡に悩まされる。
この問題に取り組むために,タスクを密集した検索問題として定式化し,各コンテンツの適切な階層ラベルを取得する。
本稿では,質問の分類について述べる。
階層ラベルをトークンの合成としてモデル化し,効率的なクロスアテンション機構を用いて情報とコンテンツの用語表現を融合する。
また,トレーニングが進むにつれて,より優れた負をサンプリングする適応型バッチ型ハードネガティブサンプリング手法を提案する。
提案手法は,Recall@kで測定した質問データセットに対する既存の最先端アプローチよりも優れていることを示す。
さらに、 \textit{TagRec++} のゼロショット機能とラベル変更への適応性を実証する。
関連論文リスト
- Posterior Label Smoothing for Node Classification [2.737276507021477]
本稿では,トランスダクティブノード分類タスクに対して,単純かつ効果的なラベル平滑化を提案する。
本研究では, ソフトラベルを設計し, 周辺ラベル分布を通じて対象ノードの局所的コンテキストをカプセル化する。
以下の分析結果から,大域的なラベル統計を後続計算に組み込むことが,ラベル平滑化の成功の鍵であることが判明した。
論文 参考訳(メタデータ) (2024-06-01T11:59:49Z) - Semi-Supervised Hierarchical Multi-Label Classifier Based on Local Information [1.6574413179773761]
局所情報に基づく半教師付き階層型多言語分類器(SSHMC-BLI)
SSHMC-BLIは、ラベル付き隣人のラベルのパスからラベルなしのインスタンスごとに擬似ラベルを構築する。
機能ゲノミクスによる12の挑戦的なデータセットの実験では、ラベル付きデータとラベル付きデータを使用することで、ラベル付きデータのみに基づいてトレーニングされた教師付き階層型分類器のパフォーマンスを向上させることができる。
論文 参考訳(メタデータ) (2024-04-30T20:16:40Z) - Active Generalized Category Discovery [60.69060965936214]
GCD(Generalized Category Discovery)は、新しいクラスと古いクラスの未ラベルのサンプルをクラスタ化するための取り組みである。
我々は,能動的学習の精神を取り入れて,能動的一般化カテゴリー発見(AGCD)という新たな設定を提案する。
提案手法は, 汎用および微粒なデータセット上での最先端性能を実現する。
論文 参考訳(メタデータ) (2024-03-07T07:12:24Z) - Towards Imbalanced Large Scale Multi-label Classification with Partially
Annotated Labels [8.977819892091]
マルチラベル分類は、複数のクラスにインスタンスを関連付けることができる日常生活において、広く発生する問題である。
本研究では,ラベルの不均衡の問題に対処し,部分ラベルを用いたニューラルネットワークのトレーニング方法について検討する。
論文 参考訳(メタデータ) (2023-07-31T21:50:48Z) - Bridging the Gap between Model Explanations in Partially Annotated
Multi-label Classification [85.76130799062379]
偽陰性ラベルがモデルの説明にどのように影響するかを考察する。
本稿では,部分ラベルで学習したモデルの属性スコアを向上し,その説明をフルラベルで学習したモデルと類似させる。
論文 参考訳(メタデータ) (2023-04-04T14:00:59Z) - Exploring Structured Semantic Prior for Multi Label Recognition with
Incomplete Labels [60.675714333081466]
不完全なラベルを持つマルチラベル認識(MLR)は非常に難しい。
最近の研究は、視覚言語モデルであるCLIPにおける画像とラベルの対応を探り、不十分なアノテーションを補うことを目指している。
我々は,MLRにおけるラベル管理の欠如を,構造化されたセマンティクスを導出することにより,不完全なラベルで修復することを提唱する。
論文 参考訳(メタデータ) (2023-03-23T12:39:20Z) - Adopting the Multi-answer Questioning Task with an Auxiliary Metric for
Extreme Multi-label Text Classification Utilizing the Label Hierarchy [10.87653109398961]
本稿では,過度なマルチラベル分類のための複数問合せタスクを採用する。
本研究では,提案手法と評価基準を法域に適用する。
論文 参考訳(メタデータ) (2023-03-02T08:40:31Z) - Use All The Labels: A Hierarchical Multi-Label Contrastive Learning
Framework [75.79736930414715]
本稿では,すべての利用可能なラベルを活用でき,クラス間の階層的関係を維持できる階層型多言語表現学習フレームワークを提案する。
比較損失に階層的ペナルティを併用し,その階層的制約を強制する。
論文 参考訳(メタデータ) (2022-04-27T21:41:44Z) - TagRec: Automated Tagging of Questions with Hierarchical Learning
Taxonomy [0.0]
オンライン教育プラットフォームは、階層的な学習分類に基づく学術的な質問を組織する
本稿では,分類学と質問のセマンティック関連性を最適化する類似性に基づく検索タスクとして,問題を定式化する。
本研究では,本手法が未確認ラベルの扱いに役立ち,野生の分類学的タグ付けに有効であることを示す。
論文 参考訳(メタデータ) (2021-07-03T11:50:55Z) - MATCH: Metadata-Aware Text Classification in A Large Hierarchy [60.59183151617578]
MATCHはメタデータと階層情報の両方を利用するエンドツーエンドのフレームワークである。
親による各子ラベルのパラメータと出力確率を正規化するさまざまな方法を提案します。
大規模なラベル階層を持つ2つの大規模なテキストデータセットの実験は、MATCHの有効性を示しています。
論文 参考訳(メタデータ) (2021-02-15T05:23:08Z) - Unsupervised Person Re-identification via Multi-label Classification [55.65870468861157]
本稿では,教師なしのReIDを多ラベル分類タスクとして定式化し,段階的に真のラベルを求める。
提案手法は,まず,各人物画像に単一クラスラベルを割り当てることから始まり,ラベル予測のために更新されたReIDモデルを活用することで,多ラベル分類へと進化する。
マルチラベル分類におけるReIDモデルのトレーニング効率を高めるために,メモリベースマルチラベル分類損失(MMCL)を提案する。
論文 参考訳(メタデータ) (2020-04-20T12:13:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。