論文の概要: Hierarchical Topic Mining via Joint Spherical Tree and Text Embedding
- arxiv url: http://arxiv.org/abs/2007.09536v1
- Date: Sat, 18 Jul 2020 23:30:47 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-09 05:14:23.808897
- Title: Hierarchical Topic Mining via Joint Spherical Tree and Text Embedding
- Title(参考訳): 関節球面木とテキスト埋め込みによる階層的トピックマイニング
- Authors: Yu Meng, Yunyi Zhang, Jiaxin Huang, Yu Zhang, Chao Zhang, Jiawei Han
- Abstract要約: 階層的トピックマイニング(Hierarchical Topic Mining)は、ユーザーが関心のあるトピックを理解するのを助けるために、テキストコーパスから各カテゴリの代表語を抽出することを目的としている。
私たちのモデルは、JoSHと呼ばれ、高い効率と弱教師付き階層的テキスト分類タスクの恩恵を受ける、高品質な階層的トピックセットをマイニングしています。
- 参考スコア(独自算出の注目度): 37.7780399311715
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Mining a set of meaningful topics organized into a hierarchy is intuitively
appealing since topic correlations are ubiquitous in massive text corpora. To
account for potential hierarchical topic structures, hierarchical topic models
generalize flat topic models by incorporating latent topic hierarchies into
their generative modeling process. However, due to their purely unsupervised
nature, the learned topic hierarchy often deviates from users' particular needs
or interests. To guide the hierarchical topic discovery process with minimal
user supervision, we propose a new task, Hierarchical Topic Mining, which takes
a category tree described by category names only, and aims to mine a set of
representative terms for each category from a text corpus to help a user
comprehend his/her interested topics. We develop a novel joint tree and text
embedding method along with a principled optimization procedure that allows
simultaneous modeling of the category tree structure and the corpus generative
process in the spherical space for effective category-representative term
discovery. Our comprehensive experiments show that our model, named JoSH, mines
a high-quality set of hierarchical topics with high efficiency and benefits
weakly-supervised hierarchical text classification tasks.
- Abstract(参考訳): 階層構造に整理された意味のあるトピックの集合をマイニングすることは直感的に魅力的である。
階層的トピック構造の可能性を考慮するため、階層的トピックモデルは、潜在的トピック階層を生成的モデリングプロセスに組み込むことでフラットなトピックモデルを一般化する。
しかし、純粋に監督されていない性質のため、学習されたトピック階層はしばしばユーザーの特定のニーズや関心から逸脱する。
そこで本研究では,ユーザが興味を持つ話題を理解するのに役立つテキストコーパスから,カテゴリ名のみで記述されたカテゴリツリーを抽出し,カテゴリごとに代表する単語のセットをマイニングすることを目的とした新しいタスクである階層的トピックマイニングを提案する。
我々は,圏木構造と球面空間におけるコーパス生成過程を同時にモデル化し,効果的なカテゴリー表現項の発見を可能にする,新しい共同木とテキストの埋め込み手法を開発した。
総合実験の結果,joshと名づけたこのモデルでは,高効率な階層的トピック群をマイニングし,下位教師付き階層的テキスト分類タスクの利点を生かした。
関連論文リスト
- On the Affinity, Rationality, and Diversity of Hierarchical Topic
Modeling [29.277151061615434]
我々は交通計画と文脈対応階層的トピックモデル(TraCo)を提案する。
TraCoは依存関係を制約して、そのスパーシティとバランスを確保すると同時に、トピック階層の構築を規則化している。
以前は絡み合ったデコーディングではなく、アンタングル化されたデコーディングによって異なるレベルのトピックに異なる意味的な粒度を分散する。
論文 参考訳(メタデータ) (2024-01-25T11:47:58Z) - Topic Taxonomy Expansion via Hierarchy-Aware Topic Phrase Generation [58.3921103230647]
TopicExpanというトピック分類拡張のための新しいフレームワークを提案する。
TopicExpanは、新しいトピックに属するトピック関連用語を直接生成する。
2つの実世界のテキストコーパスの実験結果から、TopicExpanは出力の質という点で他のベースライン手法よりも優れていた。
論文 参考訳(メタデータ) (2022-10-18T22:38:49Z) - HyperMiner: Topic Taxonomy Mining with Hyperbolic Embedding [54.52651110749165]
本稿では,単語や話題を表現するために,メタボリック埋め込みを導入した新しいフレームワークを提案する。
双曲空間のツリー様性により、下層のセマンティック階層はより解釈可能なトピックをマイニングするためによりうまく利用することができる。
論文 参考訳(メタデータ) (2022-10-16T02:54:17Z) - Knowledge-Aware Bayesian Deep Topic Model [50.58975785318575]
本稿では,事前知識を階層型トピックモデリングに組み込むベイズ生成モデルを提案する。
提案モデルでは,事前知識を効率的に統合し,階層的なトピック発見と文書表現の両面を改善する。
論文 参考訳(メタデータ) (2022-09-20T09:16:05Z) - TaxoCom: Topic Taxonomy Completion with Hierarchical Discovery of Novel
Topic Clusters [57.59286394188025]
我々はTaxoComというトピック分類の完成のための新しい枠組みを提案する。
TaxoComは、用語と文書の新たなサブトピッククラスタを発見する。
2つの実世界のデータセットに関する包括的実験により、TaxoComは、用語の一貫性とトピックカバレッジの観点から、高品質なトピック分類を生成するだけでなく、高品質なトピック分類を生成することを実証した。
論文 参考訳(メタデータ) (2022-01-18T07:07:38Z) - TopicNet: Semantic Graph-Guided Topic Discovery [51.71374479354178]
既存の階層的なトピックモデルでは、教師なしの方法でテキストコーパスから意味論的意味のあるトピックを抽出することができる。
TopicNetを階層的なトピックモデルとして導入し、学習に影響を与えるための帰納的バイアスとして、事前構造知識を注入する。
論文 参考訳(メタデータ) (2021-10-27T09:07:14Z) - Generating Categories for Sets of Entities [34.32017697099142]
カテゴリーシステムは知識ベースの中心的な構成要素であり、意味論的に関連する概念と実体の階層的なグループ化を提供する。
本稿では,ニューラルネットワークの抽象的要約モデルを用いて,エンティティの集合のカテゴリを生成する手法を提案する。
ウィキペディアのカテゴリに基づいたテストコレクションを開発し,提案手法の有効性を実証する。
論文 参考訳(メタデータ) (2020-08-19T13:31:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。