論文の概要: Self-supervised Topic Taxonomy Discovery in the Box Embedding Space
- arxiv url: http://arxiv.org/abs/2408.15050v1
- Date: Tue, 27 Aug 2024 13:19:32 GMT
- ステータス: 処理完了
- システム内更新日: 2024-08-28 13:43:53.392855
- Title: Self-supervised Topic Taxonomy Discovery in the Box Embedding Space
- Title(参考訳): 箱埋め空間における自己監督型トピック分類学発見
- Authors: Yuyin Lu, Hegang Chen, Pengbo Mao, Yanghui Rao, Haoran Xie, Fu Lee Wang, Qing Li,
- Abstract要約: 本稿では,単語やトピックをボックス埋め込み空間にマッピングする,Box Embedding-based Topic Model (BoxTM) を提案する。
BoxTMは、特定のトピック間の相関に基づいて、上位のトピックを明示的に推論する。
広範囲にわたる実験により、BoxTMで学んだトピック分類の質が検証された。
- 参考スコア(独自算出の注目度): 23.942807248774514
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Topic taxonomy discovery aims at uncovering topics of different abstraction levels and constructing hierarchical relations between them. Unfortunately, most of prior work can hardly model semantic scopes of words and topics by holding the Euclidean embedding space assumption. What's worse, they infer asymmetric hierarchical relations by symmetric distances between topic embeddings. As a result, existing methods suffer from problems of low-quality topics at high abstraction levels and inaccurate hierarchical relations. To alleviate these problems, this paper develops a Box embedding-based Topic Model (BoxTM) that maps words and topics into the box embedding space, where the asymmetric metric is defined to properly infer hierarchical relations among topics. Additionally, our BoxTM explicitly infers upper-level topics based on correlation between specific topics through recursive clustering on topic boxes. Finally, extensive experiments validate high-quality of the topic taxonomy learned by BoxTM.
- Abstract(参考訳): トピック分類発見は、異なる抽象レベルのトピックを明らかにし、それらの間の階層的な関係を構築することを目的としている。
残念なことに、以前の研究のほとんどはユークリッド埋め込み空間の仮定を保持することで、単語やトピックの意味的スコープをモデル化することができない。
さらに悪いことに、それらはトピック埋め込み間の対称距離によって非対称な階層関係を推測する。
その結果、既存の手法は、高い抽象レベルでの低品質トピックの問題と不正確な階層関係に悩まされる。
これらの問題を緩和するため,本研究では,単語とトピックをボックス埋め込み空間にマッピングするBox Embedding-based Topic Model(BoxTM)を開発した。
さらに、BoxTMは、トピックボックス上の再帰的クラスタリングを通じて、特定のトピック間の相関に基づいて、上位トピックを明示的に推論する。
最後に、BoxTMによって学習されたトピック分類の高品質性を検証する広範な実験を行った。
関連論文リスト
- On the Affinity, Rationality, and Diversity of Hierarchical Topic
Modeling [29.277151061615434]
我々は交通計画と文脈対応階層的トピックモデル(TraCo)を提案する。
TraCoは依存関係を制約して、そのスパーシティとバランスを確保すると同時に、トピック階層の構築を規則化している。
以前は絡み合ったデコーディングではなく、アンタングル化されたデコーディングによって異なるレベルのトピックに異なる意味的な粒度を分散する。
論文 参考訳(メタデータ) (2024-01-25T11:47:58Z) - Effective Neural Topic Modeling with Embedding Clustering Regularization [21.692088899479934]
新しいニューラルトピックモデルであるクラスタリング規則化トピックモデル(ECRTM)を提案する。
ECRTMは各トピックの埋め込みを、セマンティック空間内の個別に集約されたワード埋め込みクラスタの中心に強制する。
我々のECRTMは文書の質の高いトピック分布とともに多様で一貫性のあるトピックを生成する。
論文 参考訳(メタデータ) (2023-06-07T07:45:38Z) - HyHTM: Hyperbolic Geometry based Hierarchical Topic Models [9.583526547108349]
階層的トピックモデル(HTM)は、文書コレクション内のトピック階層を発見するのに有用である。
双曲幾何学に基づく階層的トピックモデルHyHTMを提案する。
論文 参考訳(メタデータ) (2023-05-16T08:06:11Z) - Topic Taxonomy Expansion via Hierarchy-Aware Topic Phrase Generation [58.3921103230647]
TopicExpanというトピック分類拡張のための新しいフレームワークを提案する。
TopicExpanは、新しいトピックに属するトピック関連用語を直接生成する。
2つの実世界のテキストコーパスの実験結果から、TopicExpanは出力の質という点で他のベースライン手法よりも優れていた。
論文 参考訳(メタデータ) (2022-10-18T22:38:49Z) - HyperMiner: Topic Taxonomy Mining with Hyperbolic Embedding [54.52651110749165]
本稿では,単語や話題を表現するために,メタボリック埋め込みを導入した新しいフレームワークを提案する。
双曲空間のツリー様性により、下層のセマンティック階層はより解釈可能なトピックをマイニングするためによりうまく利用することができる。
論文 参考訳(メタデータ) (2022-10-16T02:54:17Z) - Knowledge-Aware Bayesian Deep Topic Model [50.58975785318575]
本稿では,事前知識を階層型トピックモデリングに組み込むベイズ生成モデルを提案する。
提案モデルでは,事前知識を効率的に統合し,階層的なトピック発見と文書表現の両面を改善する。
論文 参考訳(メタデータ) (2022-09-20T09:16:05Z) - TaxoCom: Topic Taxonomy Completion with Hierarchical Discovery of Novel
Topic Clusters [57.59286394188025]
我々はTaxoComというトピック分類の完成のための新しい枠組みを提案する。
TaxoComは、用語と文書の新たなサブトピッククラスタを発見する。
2つの実世界のデータセットに関する包括的実験により、TaxoComは、用語の一貫性とトピックカバレッジの観点から、高品質なトピック分類を生成するだけでなく、高品質なトピック分類を生成することを実証した。
論文 参考訳(メタデータ) (2022-01-18T07:07:38Z) - TopicNet: Semantic Graph-Guided Topic Discovery [51.71374479354178]
既存の階層的なトピックモデルでは、教師なしの方法でテキストコーパスから意味論的意味のあるトピックを抽出することができる。
TopicNetを階層的なトピックモデルとして導入し、学習に影響を与えるための帰納的バイアスとして、事前構造知識を注入する。
論文 参考訳(メタデータ) (2021-10-27T09:07:14Z) - Sawtooth Factorial Topic Embeddings Guided Gamma Belief Network [49.458250193768826]
本稿では,文書の深部生成モデルであるGBNのソートゥース要素埋め込みについて述べる。
単語も話題も同じ次元の埋め込みベクトルとして表現される。
我々のモデルは、より深い解釈可能なトピックを抽出する他のニューラルネットワークモデルよりも優れています。
論文 参考訳(メタデータ) (2021-06-30T10:14:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。