論文の概要: CobwebTM: Probabilistic Concept Formation for Lifelong and Hierarchical Topic Modeling
- arxiv url: http://arxiv.org/abs/2604.14489v1
- Date: Wed, 15 Apr 2026 23:58:37 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-17 21:29:31.652209
- Title: CobwebTM: Probabilistic Concept Formation for Lifelong and Hierarchical Topic Modeling
- Title(参考訳): CobwebTM:生涯的かつ階層的なトピックモデリングのための確率論的概念形成
- Authors: Karthik Singaravadivelan, Anant Gupta, Zekun Wang, Christopher MacLellan,
- Abstract要約: 我々は,漸進的確率論的概念形成に基づく生涯的階層型トピックモデルであるtextscCobwebTMを紹介した。
Cobwebアルゴリズムを継続的ドキュメント埋め込みに適応させることで、textscCobwebTMはオンラインでセマンティック階層を構築し、教師なしトピック発見を可能にする。
多様なデータセットにわたって、textscCobwebTMは強力なトピックコヒーレンス、時間とともに安定したトピック、高品質な階層を実現している。
- 参考スコア(独自算出の注目度): 4.947963880040107
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Topic modeling seeks to uncover latent semantic structure in text corpora with minimal supervision. Neural approaches achieve strong performance but require extensive tuning and struggle with lifelong learning due to catastrophic forgetting and fixed capacity, while classical probabilistic models lack flexibility and adaptability to streaming data. We introduce \textsc{CobwebTM}, a low-parameter lifelong hierarchical topic model based on incremental probabilistic concept formation. By adapting the Cobweb algorithm to continuous document embeddings, \textsc{CobwebTM} constructs semantic hierarchies online, enabling unsupervised topic discovery, dynamic topic creation, and hierarchical organization without predefining the number of topics. Across diverse datasets, \textsc{CobwebTM} achieves strong topic coherence, stable topics over time, and high-quality hierarchies, demonstrating that incremental symbolic concept formation combined with pretrained representations is an efficient approach to topic modeling.
- Abstract(参考訳): トピックモデリングは、最小限の監督力でテキストコーパスの潜在意味構造を明らかにすることを目指している。
ニューラルアプローチは高いパフォーマンスを実現するが、破滅的な忘れ込みと固定能力のために、広範囲なチューニングと生涯学習に苦慮する一方で、古典的確率論的モデルはストリーミングデータに柔軟性と適応性を持たない。
漸進的確率論的概念形成に基づく低パラメータ寿命階層型トピックモデルである「textsc{CobwebTM}」を紹介する。
Cobwebアルゴリズムを継続的ドキュメント埋め込みに適応させることで、オンラインで意味的階層を構築し、トピックの数を事前に定義することなく、教師なしトピック発見、動的トピック生成、階層的組織を可能にする。
多様なデータセット全体にわたって、textsc{CobwebTM} は強力なトピックコヒーレンス、時間とともに安定なトピック、高品質な階層を実現し、事前訓練された表現とインクリメンタルシンボリック概念の形成がトピックモデリングの効率的なアプローチであることを実証している。
関連論文リスト
- Multi-Scale Feature Fusion and Graph Neural Network Integration for Text Classification with Large Language Models [11.071281023081582]
本研究では、大規模言語モデルからの深い特徴抽出、特徴ピラミッドによるマルチスケール融合、複雑な意味文脈における性能向上のためのグラフニューラルネットワークによる構造化モデリングを統合するテキスト分類のハイブリッド手法について検討する。
提案手法は, ACC, F1-Score, AUC, Precisionの既存モデルよりも優れたロバスト性アライメント実験において, 有効性と安定性を検証した。
論文 参考訳(メタデータ) (2025-11-07T22:54:26Z) - NExT-OMNI: Towards Any-to-Any Omnimodal Foundation Models with Discrete Flow Matching [64.10695425442164]
NExT-OMNI(英語版)は、離散フローパラダイムによる統一モデリングを実現するオープンソース・オムニモーダル・ファンデーション・モデルである。
NExT-OMNIは、大規模なインターリーブ付きテキスト、画像、ビデオ、オーディオデータに基づいて訓練され、マルチモーダル生成および理解ベンチマーク上で競合するパフォーマンスを提供する。
さらなる研究を進めるために、トレーニングの詳細、データプロトコル、およびコードとモデルチェックポイントの両方をオープンソース化する。
論文 参考訳(メタデータ) (2025-10-15T16:25:18Z) - Dynamic Topic Evolution with Temporal Decay and Attention in Large Language Models [3.4219049032524804]
本稿では,時間的大言語モデルに基づく動的トピック進化のためのモデリングフレームワークを提案する。
提案手法は,大規模テキストにおける動的セマンティックパターンを理解するための体系的なソリューションを提供する。
論文 参考訳(メタデータ) (2025-10-12T13:50:41Z) - On the Affinity, Rationality, and Diversity of Hierarchical Topic
Modeling [29.277151061615434]
我々は交通計画と文脈対応階層的トピックモデル(TraCo)を提案する。
TraCoは依存関係を制約して、そのスパーシティとバランスを確保すると同時に、トピック階層の構築を規則化している。
以前は絡み合ったデコーディングではなく、アンタングル化されたデコーディングによって異なるレベルのトピックに異なる意味的な粒度を分散する。
論文 参考訳(メタデータ) (2024-01-25T11:47:58Z) - HyperMiner: Topic Taxonomy Mining with Hyperbolic Embedding [54.52651110749165]
本稿では,単語や話題を表現するために,メタボリック埋め込みを導入した新しいフレームワークを提案する。
双曲空間のツリー様性により、下層のセマンティック階層はより解釈可能なトピックをマイニングするためによりうまく利用することができる。
論文 参考訳(メタデータ) (2022-10-16T02:54:17Z) - Knowledge-Aware Bayesian Deep Topic Model [50.58975785318575]
本稿では,事前知識を階層型トピックモデリングに組み込むベイズ生成モデルを提案する。
提案モデルでは,事前知識を効率的に統合し,階層的なトピック発見と文書表現の両面を改善する。
論文 参考訳(メタデータ) (2022-09-20T09:16:05Z) - TopicNet: Semantic Graph-Guided Topic Discovery [51.71374479354178]
既存の階層的なトピックモデルでは、教師なしの方法でテキストコーパスから意味論的意味のあるトピックを抽出することができる。
TopicNetを階層的なトピックモデルとして導入し、学習に影響を与えるための帰納的バイアスとして、事前構造知識を注入する。
論文 参考訳(メタデータ) (2021-10-27T09:07:14Z) - Deep Autoencoding Topic Model with Scalable Hybrid Bayesian Inference [55.35176938713946]
我々は、ガンマ分布の階層構造を用いて、その多確率層生成ネットワークを構築するディープ・オートエンコーディング・トピック・モデル(DATM)を開発した。
Weibull上向き変分エンコーダを提案する。このエンコーダは深層ニューラルネットワークを介して情報を上向きに伝播し,次いで下向き生成モデルを提案する。
大規模コーパス上での教師なしおよび教師なしの学習タスクにおいて,モデルの有効性とスケーラビリティを実証した。
論文 参考訳(メタデータ) (2020-06-15T22:22:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。