論文の概要: On the Affinity, Rationality, and Diversity of Hierarchical Topic
Modeling
- arxiv url: http://arxiv.org/abs/2401.14113v1
- Date: Thu, 25 Jan 2024 11:47:58 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-26 14:42:45.175419
- Title: On the Affinity, Rationality, and Diversity of Hierarchical Topic
Modeling
- Title(参考訳): 階層的トピックモデリングの親和性, 合理性, 多様性について
- Authors: Xiaobao Wu, Fengjun Pan, Thong Nguyen, Yichao Feng, Chaoqun Liu,
Cong-Duy Nguyen, Anh Tuan Luu
- Abstract要約: 我々は交通計画と文脈対応階層的トピックモデル(TraCo)を提案する。
TraCoは依存関係を制約して、そのスパーシティとバランスを確保すると同時に、トピック階層の構築を規則化している。
以前は絡み合ったデコーディングではなく、アンタングル化されたデコーディングによって異なるレベルのトピックに異なる意味的な粒度を分散する。
- 参考スコア(独自算出の注目度): 29.277151061615434
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Hierarchical topic modeling aims to discover latent topics from a corpus and
organize them into a hierarchy to understand documents with desirable semantic
granularity. However, existing work struggles with producing topic hierarchies
of low affinity, rationality, and diversity, which hampers document
understanding. To overcome these challenges, we in this paper propose Transport
Plan and Context-aware Hierarchical Topic Model (TraCo). Instead of early
simple topic dependencies, we propose a transport plan dependency method. It
constrains dependencies to ensure their sparsity and balance, and also
regularizes topic hierarchy building with them. This improves affinity and
diversity of hierarchies. We further propose a context-aware disentangled
decoder. Rather than previously entangled decoding, it distributes different
semantic granularity to topics at different levels by disentangled decoding.
This facilitates the rationality of hierarchies. Experiments on benchmark
datasets demonstrate that our method surpasses state-of-the-art baselines,
effectively improving the affinity, rationality, and diversity of hierarchical
topic modeling with better performance on downstream tasks.
- Abstract(参考訳): 階層的トピックモデリングは、コーパスから潜在トピックを発見し、それらを階層構造に整理し、望ましい意味的粒度を持つドキュメントを理解することを目的としている。
しかしながら、既存の作業は、低親和性、合理性、多様性のトピック階層を生み出すことに苦労しており、ドキュメント理解を妨げている。
本稿では,これらの課題を克服するために,交通計画と文脈対応階層的トピックモデル(TraCo)を提案する。
初期の単純なトピック依存ではなく、トランスポートプラン依存手法を提案する。
依存関係を制約し、スパーシティとバランスを確保すると同時に、トピック階層の構築も規則化する。
これにより階層の親和性と多様性が向上する。
さらに,コンテキスト認識型アンタングルデコーダを提案する。
以前は絡み合ったデコードではなく、異なるレベルのトピックに異なるセマンティクスの粒度を分散する。
これは階層の合理性を促進する。
ベンチマークデータセットを用いた実験により,提案手法は最先端のベースラインを超越し,下流タスクの性能向上による階層型トピックモデリングの親和性,合理性,多様性を効果的に向上することが示された。
関連論文リスト
- HDT: Hierarchical Document Transformer [70.2271469410557]
HDTは補助的なアンカートークンを導入し、アテンション機構をスパースなマルチレベル階層に再設計することでドキュメント構造を利用する。
文書の階層構造を考慮した新しいスパークアテンションカーネルを開発した。
論文 参考訳(メタデータ) (2024-07-11T09:28:04Z) - Reinforcement Learning with Options and State Representation [105.82346211739433]
この論文は、強化学習分野を探求し、改良された手法を構築することを目的としている。
階層的強化学習(Hierarchical Reinforcement Learning)として知られる階層的な方法で学習タスクを分解することで、そのような目標に対処する。
論文 参考訳(メタデータ) (2024-03-16T08:30:55Z) - HyperMiner: Topic Taxonomy Mining with Hyperbolic Embedding [54.52651110749165]
本稿では,単語や話題を表現するために,メタボリック埋め込みを導入した新しいフレームワークを提案する。
双曲空間のツリー様性により、下層のセマンティック階層はより解釈可能なトピックをマイニングするためによりうまく利用することができる。
論文 参考訳(メタデータ) (2022-10-16T02:54:17Z) - Knowledge-Aware Bayesian Deep Topic Model [50.58975785318575]
本稿では,事前知識を階層型トピックモデリングに組み込むベイズ生成モデルを提案する。
提案モデルでは,事前知識を効率的に統合し,階層的なトピック発見と文書表現の両面を改善する。
論文 参考訳(メタデータ) (2022-09-20T09:16:05Z) - TaxoCom: Topic Taxonomy Completion with Hierarchical Discovery of Novel
Topic Clusters [57.59286394188025]
我々はTaxoComというトピック分類の完成のための新しい枠組みを提案する。
TaxoComは、用語と文書の新たなサブトピッククラスタを発見する。
2つの実世界のデータセットに関する包括的実験により、TaxoComは、用語の一貫性とトピックカバレッジの観点から、高品質なトピック分類を生成するだけでなく、高品質なトピック分類を生成することを実証した。
論文 参考訳(メタデータ) (2022-01-18T07:07:38Z) - TopicNet: Semantic Graph-Guided Topic Discovery [51.71374479354178]
既存の階層的なトピックモデルでは、教師なしの方法でテキストコーパスから意味論的意味のあるトピックを抽出することができる。
TopicNetを階層的なトピックモデルとして導入し、学習に影響を与えるための帰納的バイアスとして、事前構造知識を注入する。
論文 参考訳(メタデータ) (2021-10-27T09:07:14Z) - An End-to-End Document-Level Neural Discourse Parser Exploiting
Multi-Granularity Representations [24.986030179701405]
構文とセマンティクスにまたがる複数のレベルの粒度から派生した堅牢な表現を利用します。
このような表現をエンドツーエンドのエンコーダデコーダニューラルアーキテクチャに組み込んで、よりリソース豊富な対話処理を行います。
論文 参考訳(メタデータ) (2020-12-21T08:01:04Z) - Hierarchical Topic Mining via Joint Spherical Tree and Text Embedding [37.7780399311715]
階層的トピックマイニング(Hierarchical Topic Mining)は、ユーザーが関心のあるトピックを理解するのを助けるために、テキストコーパスから各カテゴリの代表語を抽出することを目的としている。
私たちのモデルは、JoSHと呼ばれ、高い効率と弱教師付き階層的テキスト分類タスクの恩恵を受ける、高品質な階層的トピックセットをマイニングしています。
論文 参考訳(メタデータ) (2020-07-18T23:30:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。