論文の概要: Towards the TopMost: A Topic Modeling System Toolkit
- arxiv url: http://arxiv.org/abs/2309.06908v2
- Date: Fri, 14 Jun 2024 16:27:24 GMT
- ステータス: 処理完了
- システム内更新日: 2024-06-17 19:53:15.403786
- Title: Towards the TopMost: A Topic Modeling System Toolkit
- Title(参考訳): TopMost: トピックモデリングシステムツールキット
- Authors: Xiaobao Wu, Fengjun Pan, Anh Tuan Luu,
- Abstract要約: トピックモデルのためのトピックモデリングシステムツールキット(TopMost)を提案する。
TopMostは、データセット、前処理、モデル、トレーニング、評価を含む、完全なライフサイクルを含む、幅広いトピックモデリングシナリオをカバーしている。
密集的で疎結合なモジュール設計のおかげで、TopMostは様々な最先端トピックモデルの迅速な利用、公正な比較、柔軟な拡張を可能にします。
- 参考スコア(独自算出の注目度): 26.546646866501735
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Topic models have a rich history with various applications and have recently been reinvigorated by neural topic modeling. However, these numerous topic models adopt totally distinct datasets, implementations, and evaluations. This impedes quick utilization and fair comparisons, and thereby hinders their research progress and applications. To tackle this challenge, we in this paper propose a Topic Modeling System Toolkit (TopMost). Compared to existing toolkits, TopMost stands out by supporting more extensive features. It covers a broader spectrum of topic modeling scenarios with their complete lifecycles, including datasets, preprocessing, models, training, and evaluations. Thanks to its highly cohesive and decoupled modular design, TopMost enables rapid utilization, fair comparisons, and flexible extensions of diverse cutting-edge topic models. Our code, tutorials, and documentation are available at https://github.com/bobxwu/topmost.
- Abstract(参考訳): トピックモデルは様々なアプリケーションで豊富な歴史を持ち、最近はニューラルトピックモデリングによって再活性化されている。
しかし、これらの多くのトピックモデルは、全く異なるデータセット、実装、評価を採用する。
これは迅速な利用と公正な比較を妨げるため、研究の進歩と応用を妨げる。
そこで本研究では,トピックモデリングシステムツールキット(TopMost)を提案する。
既存のツールキットと比較して、TopMostはより広範な機能をサポートすることで際立っている。
データセット、前処理、モデル、トレーニング、評価などを含む、幅広いトピックモデリングシナリオを、完全なライフサイクルでカバーしている。
密集的で疎結合なモジュール設計のおかげで、TopMostは様々な最先端トピックモデルの迅速な利用、公正な比較、柔軟な拡張を可能にします。
私たちのコード、チュートリアル、ドキュメントはhttps://github.com/bobxwu/topmost.comで公開されています。
関連論文リスト
- Investigating the Impact of Text Summarization on Topic Modeling [13.581341206178525]
本稿では,事前学習型大言語モデル(LLM)を用いてトピックモデリング性能をさらに向上する手法を提案する。
トピックモデリングへの影響を比較するために、異なる長さの要約を生成するために、ショットプロンプトはほとんど使われない。
提案手法は,従来のモデルと比較して,トピックの多様性とコヒーレンス値に比較して優れている。
論文 参考訳(メタデータ) (2024-09-28T19:45:45Z) - Iterative Improvement of an Additively Regularized Topic Model [0.0]
本稿では,トピックモデルの反復的学習法を提案する。
いくつかの自然言語テキストの収集実験により、提案したITARモデルは、他の人気のあるトピックモデルよりも優れた性能を示した。
論文 参考訳(メタデータ) (2024-08-11T18:22:12Z) - An Iterative Approach to Topic Modelling [0.0]
本稿では,プロセス完了時のトピックの完全性の感覚を生じさせるトピックモデリングを反復的に行うことを提案する。
本稿では,クラスタリング比較において選択した3つの尺度のうちの1つを用いて,さらに改善できないトピックの集合に,モデルプロセスが反復的に適用可能であることを実証する。
論文 参考訳(メタデータ) (2024-07-25T09:26:07Z) - Data-Juicer Sandbox: A Comprehensive Suite for Multimodal Data-Model Co-development [67.55944651679864]
統合データモデル共同開発に適した新しいサンドボックススイートを提案する。
このサンドボックスは包括的な実験プラットフォームを提供し、データとモデルの両方の迅速なイテレーションと洞察駆動による改善を可能にする。
また、徹底的なベンチマークから得られた実りある洞察を明らかにし、データ品質、多様性、モデル行動の間の重要な相互作用に光を当てています。
論文 参考訳(メタデータ) (2024-07-16T14:40:07Z) - StableLLaVA: Enhanced Visual Instruction Tuning with Synthesized
Image-Dialogue Data [129.92449761766025]
本稿では,視覚的インストラクションチューニングのための画像と対話を同期的に合成する新しいデータ収集手法を提案する。
このアプローチは生成モデルのパワーを活用し、ChatGPTとテキスト・ツー・イメージ生成モデルの能力とを結合する。
本研究は,各種データセットを対象とした総合的な実験を含む。
論文 参考訳(メタデータ) (2023-08-20T12:43:52Z) - Dissecting Multimodality in VideoQA Transformer Models by Impairing Modality Fusion [54.33764537135906]
VideoQA Transformerモデルは標準ベンチマークで競合性能を示す。
これらのモデルはビデオとテキストからリッチなマルチモーダル構造とダイナミックスを一緒に捉えていますか?
彼らはバイアスと刺激的な特徴を利用して高いスコアを達成していますか?
論文 参考訳(メタデータ) (2023-06-15T06:45:46Z) - Large-scale Multi-Modal Pre-trained Models: A Comprehensive Survey [66.18478838828231]
マルチモーダルな事前訓練型大型モデルは近年ますます注目を集めている。
本稿では, 自然言語処理, コンピュータビジョン, 音声処理における従来の深層・深層・深層・深層・深層・深層・深層・深層・深層・深層・深層・深層・深層・深層・深層・深層・深層・深層・深層・高層・高層・高層・高層・高層・高層・高層・高層・高層・高層・高層・高層・高層・高層・高層・高層・高層・高層・高層・高層・高層・高層・高層・高層・高層・高層・高層・高層・高層・高層・高層・高層・高層・高層・高層・
次に,マルチモーダル・プレトレーニング・モデル(MM-PTM)のタスク定義,課題,メリットを紹介し,データ,目的,ネットワーク,知識強化による事前トレーニングに着目して,MM-PTMについて議論する。
論文 参考訳(メタデータ) (2023-02-20T15:34:03Z) - HTMOT : Hierarchical Topic Modelling Over Time [0.0]
本稿では,階層的話題モデリングを行うための新しい手法であるHTMOTを提案する。
時間モデリングを深層サブトピックに適用するだけで、特定のストーリーやイベントを抽出できることを示す。
以上の結果から,トレーニング手順は高速で,高精度なトピックと時間的高精度なサブトピックを抽出できることが示唆された。
論文 参考訳(メタデータ) (2021-11-22T11:02:35Z) - Improving Neural Topic Models using Knowledge Distillation [84.66983329587073]
我々は,確率論的トピックモデルと事前学習されたトランスフォーマーの最適属性を組み合わせるために,知識蒸留を用いる。
我々のモジュラー手法は、どのニューラルトピックモデルでも簡単に適用でき、トピックの品質を向上させることができる。
論文 参考訳(メタデータ) (2020-10-05T22:49:16Z) - Topic Adaptation and Prototype Encoding for Few-Shot Visual Storytelling [81.33107307509718]
トピック間一般化の能力をモデル化するためのトピック適応型ストーリーテラを提案する。
また,アトピー内導出能力のモデル化を目的とした符号化手法の試作も提案する。
実験結果から,トピック適応とプロトタイプ符号化構造が相互に利益をもたらすことが明らかとなった。
論文 参考訳(メタデータ) (2020-08-11T03:55:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。