論文の概要: Knowledge Graph-Enhanced Zero-Shot Topic Classification: A Multi-Strategy Comparative Study
- arxiv url: http://arxiv.org/abs/2605.30465v1
- Date: Thu, 28 May 2026 18:39:05 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-01 20:56:50.17622
- Title: Knowledge Graph-Enhanced Zero-Shot Topic Classification: A Multi-Strategy Comparative Study
- Title(参考訳): 知識グラフ強化ゼロショットトピック分類:多段階比較研究
- Authors: Shahana Akter, Yatharth Vohra, Ankita Shukla, Souvika Sarkar,
- Abstract要約: ゼロショットマルチラベルのトピック分類フレームワークを提案し,その性能に与える影響について検討する。
基本フレームワークは、ラベル付きトレーニングデータなしでドキュメント内のトピックを分類し、記事のみの分類、キーワード付き分類、および両者の自己整合復号の4つの変種を持つ。
- 参考スコア(独自算出の注目度): 3.4601748937427423
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Multi-label topic classification without labeled training data is a challenging task, specially when documents contain complex relational information. We present a zero-shot multi-label topic classification framework and systematically investigate how per-article knowledge graph augmentation affects its performance. The base framework classifies topics in documents without labeled training data and has four variants: article-only classification, keyword-enhanced classification, and self-consistency decoding variants of both. Then, we augment each base variant with per article knowledge graph. This graph is extracted from the input document through a pipeline similar to KGGen based on subject-predicate-object triples. We test all eight methods, four base and four graph augmented on fifteen LLMs and eight multi-label datasets across different domains. For the base framework, keyword-enhanced classification (AK) is the best performing method, and six out of fifteen LLMs surpass the sentence-encoder baseline. Graph augmentation has positive and negative impacts on small and large models, respectively. This shows that larger models already contain enough relational information from pretraining. Furthermore, the self-consistency decoding variant does not show performance improvements in any experiment while increasing computation costs about fivefold.
- Abstract(参考訳): ラベル付きトレーニングデータを持たないマルチラベルトピック分類は、特に複雑な関係情報を含む文書では難しい課題である。
ゼロショット・マルチラベル・トピック分類フレームワークを提案し,その性能に及ぼすアーチクルごとの知識グラフの増大の影響を体系的に検討する。
基本フレームワークは、ラベル付きトレーニングデータなしでドキュメント内のトピックを分類し、記事のみの分類、キーワード付き分類、および両者の自己整合復号の4つの変種を持つ。
次に、記事知識グラフ毎に各基本変種を拡大する。
このグラフは、主観的述語オブジェクトトリプルに基づいて、KGGenに似たパイプラインを介して入力文書から抽出される。
我々は,8つの手法,4つの基本グラフと4つのグラフを15のLLMと8つの異なるドメインにまたがるマルチラベルデータセットで比較した。
基本フレームワークでは、キーワード強化分類(AK)が最高の実行方法であり、文エンコーダのベースラインを超える15のLLMのうち6つである。
グラフの増大は、それぞれ小さなモデルと大きなモデルに肯定的および否定的な影響を及ぼす。
これは、より大きなモデルが事前トレーニングから十分なリレーショナル情報を持っていることを示している。
さらに、自己整合復号変種は、計算コストを約5倍にし、いかなる実験でも性能改善を示さない。
関連論文リスト
- Graph-Anchored Knowledge Indexing for Retrieval-Augmented Generation [53.42323544075114]
グラフアンコール型知識インデックス手法であるGraphAnchorを提案する。
4つのマルチホップ質問応答ベンチマークの実験では、GraphAnchorの有効性が示されている。
論文 参考訳(メタデータ) (2026-01-23T05:41:05Z) - Retrieval-augmented Multi-label Text Classification [20.100081284294973]
マルチラベルテキスト分類は、大きなラベルセットの設定において難しい課題である。
Retrieval augmentationは、分類モデルのサンプル効率を改善することを目的としている。
本手法は,法および生物医学領域の4つのデータセットに対して評価する。
論文 参考訳(メタデータ) (2023-05-22T14:16:23Z) - Dynamic Conceptional Contrastive Learning for Generalized Category
Discovery [76.82327473338734]
Generalized category discovery (GCD) は、部分的にラベル付けされたデータを自動でクラスタリングすることを目的としている。
ラベル付きデータには、ラベル付きデータの既知のカテゴリだけでなく、新しいカテゴリのインスタンスも含まれている。
GCDの効果的な方法の1つは、ラベルなしデータの識別表現を学習するために自己教師付き学習を適用することである。
本稿では,クラスタリングの精度を効果的に向上する動的概念コントラスト学習フレームワークを提案する。
論文 参考訳(メタデータ) (2023-03-30T14:04:39Z) - Association Graph Learning for Multi-Task Classification with Category
Shifts [68.58829338426712]
関連する分類タスクが同じラベル空間を共有し、同時に学習されるマルチタスク分類に焦点を当てる。
我々は、不足クラスのためのタスク間で知識を伝達する関連グラフを学習する。
我々の手法は代表的基準よりも一貫して性能が良い。
論文 参考訳(メタデータ) (2022-10-10T12:37:41Z) - Many-Class Text Classification with Matching [65.74328417321738]
textbfText textbfClassification をテキストとラベル間のtextbfMatching 問題として定式化し,TCM というシンプルなフレームワークを提案する。
従来のテキスト分類手法と比較して、TCMは分類ラベルのきめ細かい意味情報を活用している。
論文 参考訳(メタデータ) (2022-05-23T15:51:19Z) - From Discrimination to Generation: Knowledge Graph Completion with
Generative Transformer [41.69537736842654]
我々は、知識グラフ補完を事前学習された言語モデルを用いて、シーケンスからシーケンスへ変換するGenKGCのアプローチを提案する。
本稿では,より優れた表現学習と高速推論を実現するために,関係誘導型実演と実体認識型階層デコーディングを導入する。
また、研究目的のために、新しい大規模中国の知識グラフデータセットAliopenKG500もリリースした。
論文 参考訳(メタデータ) (2022-02-04T12:52:32Z) - Revisiting Self-Training for Few-Shot Learning of Language Model [61.173976954360334]
ラベル付きデータにはタスク関連情報が豊富に含まれており、言語モデルの素早い学習に有用であることが証明されている。
本研究では,言語モデルファインチューニングのための自己学習手法を再検討し,最先端のプロンプトベースの少ショット学習者,SFLMを提案する。
論文 参考訳(メタデータ) (2021-10-04T08:51:36Z) - Graph Contrastive Learning Automated [94.41860307845812]
グラフコントラスト学習(GraphCL)は、有望な表現学習性能とともに登場した。
GraphCLのヒンジがアドホックなデータ拡張に与える影響は、データセット毎に手動で選択する必要がある。
本稿では,グラフデータ上でGraphCLを実行する際に,データ拡張を自動的に,適応的に動的に選択する統合バイレベル最適化フレームワークを提案する。
論文 参考訳(メタデータ) (2021-06-10T16:35:27Z) - Multi-label Few/Zero-shot Learning with Knowledge Aggregated from
Multiple Label Graphs [8.44680447457879]
本稿では,異なる意味的ラベル関係をコードする複数のラベルグラフから知識を融合する,シンプルな多グラフ集約モデルを提案する。
本研究は,多グラフ知識集約を用いた手法が,少数・ゼロショットラベルのほとんどすべてにおいて,大幅な性能向上を実現していることを示す。
論文 参考訳(メタデータ) (2020-10-15T01:15:43Z) - Adaptive-Step Graph Meta-Learner for Few-Shot Graph Classification [25.883839335786025]
本稿では,グラフデータへの高速適応にGNNをベースとしたグラフメタラーナを用いた新しいフレームワークを提案する。
我々のフレームワークは、ベースラインと比較して、いくつかのショットグラフ分類タスクに対して最先端の結果を得る。
論文 参考訳(メタデータ) (2020-03-18T14:38:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。