論文の概要: Topic Taxonomy Expansion via Hierarchy-Aware Topic Phrase Generation
- arxiv url: http://arxiv.org/abs/2211.01981v1
- Date: Tue, 18 Oct 2022 22:38:49 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-06 15:15:05.497261
- Title: Topic Taxonomy Expansion via Hierarchy-Aware Topic Phrase Generation
- Title(参考訳): 階層型トピックフレーズ生成によるトピック分類の拡張
- Authors: Dongha Lee, Jiaming Shen, Seonghyeon Lee, Susik Yoon, Hwanjo Yu,
Jiawei Han
- Abstract要約: TopicExpanというトピック分類拡張のための新しいフレームワークを提案する。
TopicExpanは、新しいトピックに属するトピック関連用語を直接生成する。
2つの実世界のテキストコーパスの実験結果から、TopicExpanは出力の質という点で他のベースライン手法よりも優れていた。
- 参考スコア(独自算出の注目度): 58.3921103230647
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Topic taxonomies display hierarchical topic structures of a text corpus and
provide topical knowledge to enhance various NLP applications. To dynamically
incorporate new topic information, several recent studies have tried to expand
(or complete) a topic taxonomy by inserting emerging topics identified in a set
of new documents. However, existing methods focus only on frequent terms in
documents and the local topic-subtopic relations in a taxonomy, which leads to
limited topic term coverage and fails to model the global topic hierarchy. In
this work, we propose a novel framework for topic taxonomy expansion, named
TopicExpan, which directly generates topic-related terms belonging to new
topics. Specifically, TopicExpan leverages the hierarchical relation structure
surrounding a new topic and the textual content of an input document for topic
term generation. This approach encourages newly-inserted topics to further
cover important but less frequent terms as well as to keep their relation
consistency within the taxonomy. Experimental results on two real-world text
corpora show that TopicExpan significantly outperforms other baseline methods
in terms of the quality of output taxonomies.
- Abstract(参考訳): トピック分類学はテキストコーパスの階層的なトピック構造を示し、様々なNLPアプリケーションを強化するためのトピック知識を提供する。
新しいトピック情報を動的に組み込むために、最近のいくつかの研究は、新しいドキュメントのセットに識別された新しいトピックを挿入することでトピック分類を拡張し(あるいは完全)しようと試みている。
しかし、既存の手法は、文書における頻繁な用語と分類学における局所的なトピック・サブトピックの関係にのみ焦点をあてており、トピック用語のカバー範囲が限られ、グローバルなトピック階層のモデル化に失敗する。
本研究では,トピック分類の拡張のための新しい枠組みであるトピックエクスパンを提案し,トピックに関連した用語を直接生成する。
具体的には、新しいトピックを取り巻く階層的関係構造と、トピック項生成のための入力文書のテキスト内容を利用する。
このアプローチにより、新しく導入されたトピックは、重要だが頻繁でない用語を更にカバーし、それらの関係性は分類学内で維持される。
2つの実世界のテキストコーポラの実験結果は、トピックエクスパンが出力分類の質の観点から他のベースラインメソッドを大きく上回っていることを示している。
関連論文リスト
- Improving Retrieval in Theme-specific Applications using a Corpus
Topical Taxonomy [52.426623750562335]
ToTER (Topical Taxonomy Enhanced Retrieval) フレームワークを紹介する。
ToTERは、クエリとドキュメントの中心的なトピックを分類学のガイダンスで識別し、そのトピックの関連性を利用して、欠落したコンテキストを補う。
プラグイン・アンド・プレイのフレームワークとして、ToTERは様々なPLMベースのレトリバーを強化するために柔軟に使用できる。
論文 参考訳(メタデータ) (2024-03-07T02:34:54Z) - Effective Neural Topic Modeling with Embedding Clustering Regularization [21.692088899479934]
新しいニューラルトピックモデルであるクラスタリング規則化トピックモデル(ECRTM)を提案する。
ECRTMは各トピックの埋め込みを、セマンティック空間内の個別に集約されたワード埋め込みクラスタの中心に強制する。
我々のECRTMは文書の質の高いトピック分布とともに多様で一貫性のあるトピックを生成する。
論文 参考訳(メタデータ) (2023-06-07T07:45:38Z) - HyperMiner: Topic Taxonomy Mining with Hyperbolic Embedding [54.52651110749165]
本稿では,単語や話題を表現するために,メタボリック埋め込みを導入した新しいフレームワークを提案する。
双曲空間のツリー様性により、下層のセマンティック階層はより解釈可能なトピックをマイニングするためによりうまく利用することができる。
論文 参考訳(メタデータ) (2022-10-16T02:54:17Z) - Knowledge-Aware Bayesian Deep Topic Model [50.58975785318575]
本稿では,事前知識を階層型トピックモデリングに組み込むベイズ生成モデルを提案する。
提案モデルでは,事前知識を効率的に統合し,階層的なトピック発見と文書表現の両面を改善する。
論文 参考訳(メタデータ) (2022-09-20T09:16:05Z) - TaxoCom: Topic Taxonomy Completion with Hierarchical Discovery of Novel
Topic Clusters [57.59286394188025]
我々はTaxoComというトピック分類の完成のための新しい枠組みを提案する。
TaxoComは、用語と文書の新たなサブトピッククラスタを発見する。
2つの実世界のデータセットに関する包括的実験により、TaxoComは、用語の一貫性とトピックカバレッジの観点から、高品質なトピック分類を生成するだけでなく、高品質なトピック分類を生成することを実証した。
論文 参考訳(メタデータ) (2022-01-18T07:07:38Z) - TopicNet: Semantic Graph-Guided Topic Discovery [51.71374479354178]
既存の階層的なトピックモデルでは、教師なしの方法でテキストコーパスから意味論的意味のあるトピックを抽出することができる。
TopicNetを階層的なトピックモデルとして導入し、学習に影響を与えるための帰納的バイアスとして、事前構造知識を注入する。
論文 参考訳(メタデータ) (2021-10-27T09:07:14Z) - Hierarchical Topic Mining via Joint Spherical Tree and Text Embedding [37.7780399311715]
階層的トピックマイニング(Hierarchical Topic Mining)は、ユーザーが関心のあるトピックを理解するのを助けるために、テキストコーパスから各カテゴリの代表語を抽出することを目的としている。
私たちのモデルは、JoSHと呼ばれ、高い効率と弱教師付き階層的テキスト分類タスクの恩恵を受ける、高品質な階層的トピックセットをマイニングしています。
論文 参考訳(メタデータ) (2020-07-18T23:30:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。