論文の概要: HyperMiner: Topic Taxonomy Mining with Hyperbolic Embedding
- arxiv url: http://arxiv.org/abs/2210.10625v1
- Date: Sun, 16 Oct 2022 02:54:17 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-20 15:39:08.854741
- Title: HyperMiner: Topic Taxonomy Mining with Hyperbolic Embedding
- Title(参考訳): HyperMiner: ハイパボリック埋め込みによるトピック分類マイニング
- Authors: Yishi Xu, Dongsheng Wang, Bo Chen, Ruiying Lu, Zhibin Duan, Mingyuan
Zhou
- Abstract要約: 本稿では,単語や話題を表現するために,メタボリック埋め込みを導入した新しいフレームワークを提案する。
双曲空間のツリー様性により、下層のセマンティック階層はより解釈可能なトピックをマイニングするためによりうまく利用することができる。
- 参考スコア(独自算出の注目度): 54.52651110749165
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Embedded topic models are able to learn interpretable topics even with large
and heavy-tailed vocabularies. However, they generally hold the Euclidean
embedding space assumption, leading to a basic limitation in capturing
hierarchical relations. To this end, we present a novel framework that
introduces hyperbolic embeddings to represent words and topics. With the
tree-likeness property of hyperbolic space, the underlying semantic hierarchy
among words and topics can be better exploited to mine more interpretable
topics. Furthermore, due to the superiority of hyperbolic geometry in
representing hierarchical data, tree-structure knowledge can also be naturally
injected to guide the learning of a topic hierarchy. Therefore, we further
develop a regularization term based on the idea of contrastive learning to
inject prior structural knowledge efficiently. Experiments on both topic
taxonomy discovery and document representation demonstrate that the proposed
framework achieves improved performance against existing embedded topic models.
- Abstract(参考訳): 組み込みトピックモデルは、大きくて重い語彙でも解釈可能なトピックを学習することができる。
しかし、それらは一般にユークリッド埋め込み空間の仮定を持ち、階層関係を捉えるための基本的な制限をもたらす。
この目的のために,単語や話題を表現するために双曲組込みを導入する新しい枠組みを提案する。
双曲空間のツリーのような性質により、単語やトピックの下位のセマンティック階層は、より解釈可能なトピックをマイニングするためによりうまく活用できる。
さらに、階層データ表現における双曲幾何学の優位性により、木構造知識を自然に注入してトピック階層の学習を導くこともできる。
そこで本研究では,事前構造知識を効率的に注入するコントラスト学習の概念に基づく正規化用語をさらに発展させる。
トピック分類発見と文書表現の両方の実験は、提案フレームワークが既存の組込みトピックモデルに対する性能改善を実現していることを示している。
関連論文リスト
- TopicGPT: A Prompt-based Topic Modeling Framework [77.72072691307811]
TopicGPTは,大規模言語モデルを用いてテキストコレクション内の潜在トピックを明らかにするプロンプトベースのフレームワークである。
競合する手法と比較して、人間の分類とよく一致したトピックを生成する。
そのトピックもまた解釈可能であり、自然言語ラベルと関連する自由形式の記述を含むトピックを好んで、曖昧な言葉の袋を除いた。
論文 参考訳(メタデータ) (2023-11-02T17:57:10Z) - Topic Taxonomy Expansion via Hierarchy-Aware Topic Phrase Generation [58.3921103230647]
TopicExpanというトピック分類拡張のための新しいフレームワークを提案する。
TopicExpanは、新しいトピックに属するトピック関連用語を直接生成する。
2つの実世界のテキストコーパスの実験結果から、TopicExpanは出力の質という点で他のベースライン手法よりも優れていた。
論文 参考訳(メタデータ) (2022-10-18T22:38:49Z) - Knowledge-Aware Bayesian Deep Topic Model [50.58975785318575]
本稿では,事前知識を階層型トピックモデリングに組み込むベイズ生成モデルを提案する。
提案モデルでは,事前知識を効率的に統合し,階層的なトピック発見と文書表現の両面を改善する。
論文 参考訳(メタデータ) (2022-09-20T09:16:05Z) - TaxoCom: Topic Taxonomy Completion with Hierarchical Discovery of Novel
Topic Clusters [57.59286394188025]
我々はTaxoComというトピック分類の完成のための新しい枠組みを提案する。
TaxoComは、用語と文書の新たなサブトピッククラスタを発見する。
2つの実世界のデータセットに関する包括的実験により、TaxoComは、用語の一貫性とトピックカバレッジの観点から、高品質なトピック分類を生成するだけでなく、高品質なトピック分類を生成することを実証した。
論文 参考訳(メタデータ) (2022-01-18T07:07:38Z) - TopicNet: Semantic Graph-Guided Topic Discovery [51.71374479354178]
既存の階層的なトピックモデルでは、教師なしの方法でテキストコーパスから意味論的意味のあるトピックを抽出することができる。
TopicNetを階層的なトピックモデルとして導入し、学習に影響を与えるための帰納的バイアスとして、事前構造知識を注入する。
論文 参考訳(メタデータ) (2021-10-27T09:07:14Z) - HyperExpan: Taxonomy Expansion with Hyperbolic Representation Learning [24.080321524759455]
我々は,ハイパーボリックグラフニューラルネット(HGNN)を用いた概念とそれらの関係を表現するための分類拡張アルゴリズムHyperExpanを提案する。
実験の結果,提案したHyperExpanはユークリッド特徴空間における表現学習のベースラインモデルよりも優れており,分類学拡張ベンチマークの最先端性能を実現していることがわかった。
論文 参考訳(メタデータ) (2021-09-22T03:27:04Z) - A Neural Generative Model for Joint Learning Topics and Topic-Specific
Word Embeddings [42.87769996249732]
共同学習トピックとトピック固有の単語埋め込みのための局所的・グローバル的文脈を探索する新しい生成モデルを提案する。
訓練されたモデルは、単語を話題に依存した埋め込みにマッピングする。
論文 参考訳(メタデータ) (2020-08-11T13:54:11Z) - Hierarchical Topic Mining via Joint Spherical Tree and Text Embedding [37.7780399311715]
階層的トピックマイニング(Hierarchical Topic Mining)は、ユーザーが関心のあるトピックを理解するのを助けるために、テキストコーパスから各カテゴリの代表語を抽出することを目的としている。
私たちのモデルは、JoSHと呼ばれ、高い効率と弱教師付き階層的テキスト分類タスクの恩恵を受ける、高品質な階層的トピックセットをマイニングしています。
論文 参考訳(メタデータ) (2020-07-18T23:30:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。