論文の概要: Dynamic Topic Analysis in Academic Journals using Convex Non-negative Matrix Factorization Method
- arxiv url: http://arxiv.org/abs/2504.08743v1
- Date: Sun, 23 Mar 2025 14:31:47 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-20 06:33:21.223381
- Title: Dynamic Topic Analysis in Academic Journals using Convex Non-negative Matrix Factorization Method
- Title(参考訳): 凸非負行列分解法による学術雑誌の動的トピック分析
- Authors: Yang Yang, Tong Zhang, Jian Wu, Lijie Su,
- Abstract要約: 本稿では,2段階の動的トピック分析フレームワークを提案する。
トピックの一貫性、スパーシリティ、解釈可能性を改善するために凸最適化が組み込まれている。
2004年から2022年までのIEEEジャーナルの要約に提案手法を適用して、新興研究トピックを効果的に同定し、定量化する。
- 参考スコア(独自算出の注目度): 13.479775419940283
- License:
- Abstract: With the rapid advancement of large language models, academic topic identification and topic evolution analysis are crucial for enhancing AI's understanding capabilities. Dynamic topic analysis provides a powerful approach to capturing and understanding the temporal evolution of topics in large-scale datasets. This paper presents a two-stage dynamic topic analysis framework that incorporates convex optimization to improve topic consistency, sparsity, and interpretability. In Stage 1, a two-layer non-negative matrix factorization (NMF) model is employed to extract annual topics and identify key terms. In Stage 2, a convex optimization algorithm refines the dynamic topic structure using the convex NMF (cNMF) model, further enhancing topic integration and stability. Applying the proposed method to IEEE journal abstracts from 2004 to 2022 effectively identifies and quantifies emerging research topics, such as COVID-19 and digital twins. By optimizing sparsity differences in the clustering feature space between traditional and emerging research topics, the framework provides deeper insights into topic evolution and ranking analysis. Moreover, the NMF-cNMF model demonstrates superior stability in topic consistency. At sparsity levels of 0.4, 0.6, and 0.9, the proposed approach improves topic ranking stability by 24.51%, 56.60%, and 36.93%, respectively. The source code (to be open after publication) is available at https://github.com/meetyangyang/CDNMF.
- Abstract(参考訳): 大規模言語モデルの急速な進歩により、学術的トピック識別とトピック進化分析はAIの理解能力を高めるために不可欠である。
動的トピック分析は、大規模データセットにおけるトピックの時間的進化をキャプチャし、理解するための強力なアプローチを提供する。
本稿では,トピックの一貫性,疎性,解釈可能性を改善するために凸最適化を取り入れた2段階動的トピック分析フレームワークを提案する。
ステージ1では,2層非負行列分解(NMF)モデルを用いて年次トピックを抽出し,キーワードを同定する。
ステージ2では、凸最適化アルゴリズムが凸NMF(cNMF)モデルを用いて動的トピック構造を洗練し、トピック統合と安定性をさらに向上する。
2004年から2022年までのIEEEの論文に提案手法を適用して、新型コロナウイルスやデジタル双生児などの新興研究トピックを効果的に同定し、定量化する。
従来の研究トピックと新興研究トピックのクラスタリング機能空間における空間的差異を最適化することにより、このフレームワークはトピックの進化とランキング分析に関する深い洞察を提供する。
さらに、NMF-cNMFモデルはトピック一貫性において優れた安定性を示す。
スパシティレベル0.4、0.6、0.9では、トピックランク安定性をそれぞれ24.51%、56.60%、36.93%改善する。
ソースコードはhttps://github.com/meetyangyang/CDNMF.comで公開されている。
関連論文リスト
- Bridging the Evaluation Gap: Leveraging Large Language Models for Topic Model Evaluation [0.0]
本研究では,Large Language Models (LLMs) を用いた科学文献における動的に進化するトピックの自動評価のための枠組みを提案する。
提案手法は,専門家のアノテータや狭義の統計指標に大きく依存することなく,コヒーレンス,反復性,多様性,トピック文書のアライメントといった重要な品質次元を測定するためにLLMを利用する。
論文 参考訳(メタデータ) (2025-02-11T08:23:56Z) - Detecting Neurocognitive Disorders through Analyses of Topic Evolution and Cross-modal Consistency in Visual-Stimulated Narratives [84.03001845263]
神経認知障害(NCD)の早期発見は、時間的介入と疾患管理に不可欠である。
伝統的な物語分析は、しばしば単語の使用法や構文など、ミクロ構造における局所的な指標に焦点を当てる。
本稿では,話題の変化,時間的ダイナミクス,物語の時間的コヒーレンスを分析することによって,特定の認知的・言語的課題を解明することを提案する。
論文 参考訳(メタデータ) (2025-01-07T12:16:26Z) - Stability of Primal-Dual Gradient Flow Dynamics for Multi-Block Convex Optimization Problems [2.66854711376491]
提案された力学はラグランジアンの近位拡大に基づいている。
我々は、グローバル(指数)収束保証を確立するために、様々な構造的特性を利用する。
我々の仮定は、様々な原始双対力学の(指数的な)安定性を証明するために必要なものよりもはるかに弱い。
論文 参考訳(メタデータ) (2024-08-28T17:43:18Z) - Interactive Topic Models with Optimal Transport [75.26555710661908]
ラベル名監視型トピックモデリングのためのアプローチとして,EdTMを提案する。
EdTMは、LM/LLMベースのドキュメントトピック親和性を活用しながら、代入問題としてのトピックモデリングをモデル化する。
論文 参考訳(メタデータ) (2024-06-28T13:57:27Z) - FASTopic: Pretrained Transformer is a Fast, Adaptive, Stable, and Transferable Topic Model [76.509837704596]
本稿では,高速で適応的で,安定で,移動可能なトピックモデルであるFASTopicを提案する。
我々はDSR(Dual Semantic-Relation Reconstruction)を用いて潜在トピックをモデル化する。
また, セマンティック関係を最適輸送計画として正規化するためのETP(Embedding Transport Plan)を提案する。
論文 参考訳(メタデータ) (2024-05-28T09:06:38Z) - Data-Centric Long-Tailed Image Recognition [49.90107582624604]
ロングテールモデルは高品質なデータに対する強い需要を示している。
データ中心のアプローチは、モデルパフォーマンスを改善するために、データの量と品質の両方を強化することを目的としています。
現在、情報強化の有効性を説明するメカニズムに関する研究が不足している。
論文 参考訳(メタデータ) (2023-11-03T06:34:37Z) - vONTSS: vMF based semi-supervised neural topic modeling with optimal
transport [6.874745415692134]
この研究は、von Mises-Fisher (vMF) ベースの変分オートエンコーダと最適なトランスポートを用いた半教師付きニューラルトピックモデリング手法 vONTSS を提案する。
実験により、vONTSSは、分類精度と多様性において、既存の半教師付きトピックモデリング手法よりも優れていることが示された。
また、類似の分類性能を達成しつつ、最先端の弱教師付きテキスト分類法よりもはるかに高速である。
論文 参考訳(メタデータ) (2023-07-03T04:23:41Z) - ANTM: An Aligned Neural Topic Model for Exploring Evolving Topics [1.854328133293073]
本稿では、アラインドニューラルトピックモデル(ANTM)と呼ばれる動的トピックモデルのアルゴリズム系を提案する。
ANTMは、新しいデータマイニングアルゴリズムを組み合わせて、進化するトピックを発見するためのモジュラーフレームワークを提供する。
Pythonパッケージは、大規模テキストデータにおけるトピックのトレンドと進化パターンを研究したい研究者や科学者のために開発されている。
論文 参考訳(メタデータ) (2023-02-03T02:31:12Z) - Knowledge-Aware Bayesian Deep Topic Model [50.58975785318575]
本稿では,事前知識を階層型トピックモデリングに組み込むベイズ生成モデルを提案する。
提案モデルでは,事前知識を効率的に統合し,階層的なトピック発見と文書表現の両面を改善する。
論文 参考訳(メタデータ) (2022-09-20T09:16:05Z) - Non-negative matrix factorization algorithms greatly improve topic model
fits [7.7276871905342315]
NMFはトピックモデルパラメータの"sum-to-one"制約を回避する。
まずNMF問題を解き、トピックモデルの適合性を回復することで、より優れた適合性が得られることを示す。
論文 参考訳(メタデータ) (2021-05-27T20:34:46Z) - Improving Neural Topic Models using Knowledge Distillation [84.66983329587073]
我々は,確率論的トピックモデルと事前学習されたトランスフォーマーの最適属性を組み合わせるために,知識蒸留を用いる。
我々のモジュラー手法は、どのニューラルトピックモデルでも簡単に適用でき、トピックの品質を向上させることができる。
論文 参考訳(メタデータ) (2020-10-05T22:49:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。