論文の概要: Towards the TopMost: A Topic Modeling System Toolkit
- arxiv url: http://arxiv.org/abs/2309.06908v1
- Date: Wed, 13 Sep 2023 12:10:54 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-14 14:32:06.393916
- Title: Towards the TopMost: A Topic Modeling System Toolkit
- Title(参考訳): 一番上へ:トピック・モデリング・システム・ツールキット
- Authors: Xiaobao Wu, Fengjun Pan, Anh Tuan Luu
- Abstract要約: トピックモデルのためのトピックモデリングシステムツールキット(TopMost)を提案する。
TopMostのモジュール設計は、様々なトピックモデルの迅速な利用、公正な比較、柔軟な拡張を可能にする。
- 参考スコア(独自算出の注目度): 29.835770709172557
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Topic models have been proposed for decades with various applications and
recently refreshed by the neural variational inference. However, these topic
models adopt totally distinct dataset, implementation, and evaluation settings,
which hinders their quick utilization and fair comparisons. This greatly
hinders the research progress of topic models. To address these issues, in this
paper we propose a Topic Modeling System Toolkit (TopMost). Compared to
existing toolkits, TopMost stands out by covering a wider range of topic
modeling scenarios including complete lifecycles with dataset pre-processing,
model training, testing, and evaluations. The highly cohesive and decoupled
modular design of TopMost enables quick utilization, fair comparisons, and
flexible extensions of different topic models. This can facilitate the research
and applications of topic models. Our code, tutorials, and documentation are
available at https://github.com/bobxwu/topmost.
- Abstract(参考訳): トピックモデルは何十年にもわたって様々な用途で提案され、最近はニューラル変動推論によってリフレッシュされた。
しかしながら、これらのトピックモデルは、完全に異なるデータセット、実装、評価設定を採用しており、迅速な利用と公平な比較を妨げる。
これは話題モデルの研究の進展を大いに妨げている。
本稿では,これらの課題に対処するため,トピックモデリングシステムツールキット(TopMost)を提案する。
既存のツールキットと比較して、TopMostは、データセット前処理、モデルトレーニング、テスト、評価を含む完全なライフサイクルを含む幅広いトピックモデリングシナリオをカバーしている。
TopMostの高度に結合的で疎結合なモジュール設計は、様々なトピックモデルの迅速な利用、公正な比較、柔軟な拡張を可能にします。
これによりトピックモデルの研究や応用が容易になる。
私たちのコード、チュートリアル、ドキュメンテーションはhttps://github.com/bobxwu/topmostで閲覧できます。
関連論文リスト
- Investigating the Impact of Text Summarization on Topic Modeling [13.581341206178525]
本稿では,事前学習型大言語モデル(LLM)を用いてトピックモデリング性能をさらに向上する手法を提案する。
トピックモデリングへの影響を比較するために、異なる長さの要約を生成するために、ショットプロンプトはほとんど使われない。
提案手法は,従来のモデルと比較して,トピックの多様性とコヒーレンス値に比較して優れている。
論文 参考訳(メタデータ) (2024-09-28T19:45:45Z) - Iterative Improvement of an Additively Regularized Topic Model [0.0]
本稿では,トピックモデルの反復的学習法を提案する。
いくつかの自然言語テキストの収集実験により、提案したITARモデルは、他の人気のあるトピックモデルよりも優れた性能を示した。
論文 参考訳(メタデータ) (2024-08-11T18:22:12Z) - An Iterative Approach to Topic Modelling [0.0]
本稿では,プロセス完了時のトピックの完全性の感覚を生じさせるトピックモデリングを反復的に行うことを提案する。
本稿では,クラスタリング比較において選択した3つの尺度のうちの1つを用いて,さらに改善できないトピックの集合に,モデルプロセスが反復的に適用可能であることを実証する。
論文 参考訳(メタデータ) (2024-07-25T09:26:07Z) - Data-Juicer Sandbox: A Comprehensive Suite for Multimodal Data-Model Co-development [67.55944651679864]
統合データモデル共同開発に適した新しいサンドボックススイートを提案する。
このサンドボックスは包括的な実験プラットフォームを提供し、データとモデルの両方の迅速なイテレーションと洞察駆動による改善を可能にする。
また、徹底的なベンチマークから得られた実りある洞察を明らかにし、データ品質、多様性、モデル行動の間の重要な相互作用に光を当てています。
論文 参考訳(メタデータ) (2024-07-16T14:40:07Z) - StableLLaVA: Enhanced Visual Instruction Tuning with Synthesized
Image-Dialogue Data [129.92449761766025]
本稿では,視覚的インストラクションチューニングのための画像と対話を同期的に合成する新しいデータ収集手法を提案する。
このアプローチは生成モデルのパワーを活用し、ChatGPTとテキスト・ツー・イメージ生成モデルの能力とを結合する。
本研究は,各種データセットを対象とした総合的な実験を含む。
論文 参考訳(メタデータ) (2023-08-20T12:43:52Z) - Dissecting Multimodality in VideoQA Transformer Models by Impairing Modality Fusion [54.33764537135906]
VideoQA Transformerモデルは標準ベンチマークで競合性能を示す。
これらのモデルはビデオとテキストからリッチなマルチモーダル構造とダイナミックスを一緒に捉えていますか?
彼らはバイアスと刺激的な特徴を利用して高いスコアを達成していますか?
論文 参考訳(メタデータ) (2023-06-15T06:45:46Z) - Large-scale Multi-Modal Pre-trained Models: A Comprehensive Survey [66.18478838828231]
マルチモーダルな事前訓練型大型モデルは近年ますます注目を集めている。
本稿では, 自然言語処理, コンピュータビジョン, 音声処理における従来の深層・深層・深層・深層・深層・深層・深層・深層・深層・深層・深層・深層・深層・深層・深層・深層・深層・深層・深層・高層・高層・高層・高層・高層・高層・高層・高層・高層・高層・高層・高層・高層・高層・高層・高層・高層・高層・高層・高層・高層・高層・高層・高層・高層・高層・高層・高層・高層・高層・高層・高層・高層・高層・高層・
次に,マルチモーダル・プレトレーニング・モデル(MM-PTM)のタスク定義,課題,メリットを紹介し,データ,目的,ネットワーク,知識強化による事前トレーニングに着目して,MM-PTMについて議論する。
論文 参考訳(メタデータ) (2023-02-20T15:34:03Z) - HTMOT : Hierarchical Topic Modelling Over Time [0.0]
本稿では,階層的話題モデリングを行うための新しい手法であるHTMOTを提案する。
時間モデリングを深層サブトピックに適用するだけで、特定のストーリーやイベントを抽出できることを示す。
以上の結果から,トレーニング手順は高速で,高精度なトピックと時間的高精度なサブトピックを抽出できることが示唆された。
論文 参考訳(メタデータ) (2021-11-22T11:02:35Z) - Improving Neural Topic Models using Knowledge Distillation [84.66983329587073]
我々は,確率論的トピックモデルと事前学習されたトランスフォーマーの最適属性を組み合わせるために,知識蒸留を用いる。
我々のモジュラー手法は、どのニューラルトピックモデルでも簡単に適用でき、トピックの品質を向上させることができる。
論文 参考訳(メタデータ) (2020-10-05T22:49:16Z) - Topic Adaptation and Prototype Encoding for Few-Shot Visual Storytelling [81.33107307509718]
トピック間一般化の能力をモデル化するためのトピック適応型ストーリーテラを提案する。
また,アトピー内導出能力のモデル化を目的とした符号化手法の試作も提案する。
実験結果から,トピック適応とプロトタイプ符号化構造が相互に利益をもたらすことが明らかとなった。
論文 参考訳(メタデータ) (2020-08-11T03:55:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。