論文の概要: Towards the TopMost: A Topic Modeling System Toolkit
- arxiv url: http://arxiv.org/abs/2309.06908v1
- Date: Wed, 13 Sep 2023 12:10:54 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-14 14:32:06.393916
- Title: Towards the TopMost: A Topic Modeling System Toolkit
- Title(参考訳): 一番上へ:トピック・モデリング・システム・ツールキット
- Authors: Xiaobao Wu, Fengjun Pan, Anh Tuan Luu
- Abstract要約: トピックモデルのためのトピックモデリングシステムツールキット(TopMost)を提案する。
TopMostのモジュール設計は、様々なトピックモデルの迅速な利用、公正な比較、柔軟な拡張を可能にする。
- 参考スコア(独自算出の注目度): 29.835770709172557
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Topic models have been proposed for decades with various applications and
recently refreshed by the neural variational inference. However, these topic
models adopt totally distinct dataset, implementation, and evaluation settings,
which hinders their quick utilization and fair comparisons. This greatly
hinders the research progress of topic models. To address these issues, in this
paper we propose a Topic Modeling System Toolkit (TopMost). Compared to
existing toolkits, TopMost stands out by covering a wider range of topic
modeling scenarios including complete lifecycles with dataset pre-processing,
model training, testing, and evaluations. The highly cohesive and decoupled
modular design of TopMost enables quick utilization, fair comparisons, and
flexible extensions of different topic models. This can facilitate the research
and applications of topic models. Our code, tutorials, and documentation are
available at https://github.com/bobxwu/topmost.
- Abstract(参考訳): トピックモデルは何十年にもわたって様々な用途で提案され、最近はニューラル変動推論によってリフレッシュされた。
しかしながら、これらのトピックモデルは、完全に異なるデータセット、実装、評価設定を採用しており、迅速な利用と公平な比較を妨げる。
これは話題モデルの研究の進展を大いに妨げている。
本稿では,これらの課題に対処するため,トピックモデリングシステムツールキット(TopMost)を提案する。
既存のツールキットと比較して、TopMostは、データセット前処理、モデルトレーニング、テスト、評価を含む完全なライフサイクルを含む幅広いトピックモデリングシナリオをカバーしている。
TopMostの高度に結合的で疎結合なモジュール設計は、様々なトピックモデルの迅速な利用、公正な比較、柔軟な拡張を可能にします。
これによりトピックモデルの研究や応用が容易になる。
私たちのコード、チュートリアル、ドキュメンテーションはhttps://github.com/bobxwu/topmostで閲覧できます。
関連論文リスト
- StableLLaVA: Enhanced Visual Instruction Tuning with Synthesized
Image-Dialogue Data [129.92449761766025]
本稿では,視覚的インストラクションチューニングのための画像と対話を同期的に合成する新しいデータ収集手法を提案する。
このアプローチは生成モデルのパワーを活用し、ChatGPTとテキスト・ツー・イメージ生成モデルの能力とを結合する。
本研究は,各種データセットを対象とした総合的な実験を含む。
論文 参考訳(メタデータ) (2023-08-20T12:43:52Z) - ZhiJian: A Unifying and Rapidly Deployable Toolbox for Pre-trained Model
Reuse [59.500060790983994]
本稿では、PyTorchバックエンドを利用して、モデル再利用のための包括的でユーザフレンドリなツールボックスであるZhiJianを紹介する。
ZhiJianは、PTMによるターゲットアーキテクチャ構築、PTMによるターゲットモデルチューニング、およびPTMに基づく推論を含む、モデル再利用に関するさまざまな視点を統一する新しいパラダイムを提示している。
論文 参考訳(メタデータ) (2023-08-17T19:12:13Z) - Visual Tuning [141.9331258362799]
微調整ビジュアルモデルは、多くの下流視覚タスクにおいて有望なパフォーマンスを示すことが広く示されている。
最近の進歩は、事前訓練されたパラメータ全体をフルチューニングするよりも優れたパフォーマンスを達成することができる。
この調査は、最近の作品の大規模かつ思慮深い選択を特徴付け、作業とモデルの体系的かつ包括的な概要を提供する。
論文 参考訳(メタデータ) (2023-05-10T11:26:36Z) - A User-Centered, Interactive, Human-in-the-Loop Topic Modelling System [32.065158970382036]
ヒューマン・イン・ザ・ループ(Human-in-the-loop)トピック・モデリングは、ユーザの知識をモデリングプロセスに取り入れ、モデルを反復的に洗練することを可能にする。
最近の研究では、ユーザフィードバックの価値が実証されているが、検討すべき問題がまだ残っている。
そこで我々は,ユーザフレンドリなインタフェースを備えた対話型話題モデリングシステムを開発した。
論文 参考訳(メタデータ) (2023-04-04T13:05:10Z) - Federated Neural Topic Models [0.0]
フェデレートされたトピックモデリングにより、複数のパーティがデータを共有することなく、共同でトピックモデルをトレーニングできる。
我々は、最先端のニューラルトピックモデリング実装に基づいて、フェデレートされた実装を提案し、分析する。
実際には、我々のアプローチは集中型モデルトレーニングに相当しますが、ノードのプライバシを保持します。
論文 参考訳(メタデータ) (2022-12-05T13:49:26Z) - ELEVATER: A Benchmark and Toolkit for Evaluating Language-Augmented
Visual Models [102.63817106363597]
ELEVATERは、事前訓練された言語拡張ビジュアルモデルの比較と評価を行う最初のベンチマークである。
20の画像分類データセットと35のオブジェクト検出データセットで構成され、それぞれが外部知識で拡張されている。
研究コミュニティ向けのツールキットと評価プラットフォームをリリースします。
論文 参考訳(メタデータ) (2022-04-19T10:23:42Z) - HTMOT : Hierarchical Topic Modelling Over Time [0.0]
本稿では,階層的話題モデリングを行うための新しい手法であるHTMOTを提案する。
時間モデリングを深層サブトピックに適用するだけで、特定のストーリーやイベントを抽出できることを示す。
以上の結果から,トレーニング手順は高速で,高精度なトピックと時間的高精度なサブトピックを抽出できることが示唆された。
論文 参考訳(メタデータ) (2021-11-22T11:02:35Z) - Improving Neural Topic Models using Knowledge Distillation [84.66983329587073]
我々は,確率論的トピックモデルと事前学習されたトランスフォーマーの最適属性を組み合わせるために,知識蒸留を用いる。
我々のモジュラー手法は、どのニューラルトピックモデルでも簡単に適用でき、トピックの品質を向上させることができる。
論文 参考訳(メタデータ) (2020-10-05T22:49:16Z) - Topic Adaptation and Prototype Encoding for Few-Shot Visual Storytelling [81.33107307509718]
トピック間一般化の能力をモデル化するためのトピック適応型ストーリーテラを提案する。
また,アトピー内導出能力のモデル化を目的とした符号化手法の試作も提案する。
実験結果から,トピック適応とプロトタイプ符号化構造が相互に利益をもたらすことが明らかとなった。
論文 参考訳(メタデータ) (2020-08-11T03:55:11Z) - Keyword Assisted Topic Models [0.0]
少数のキーワードを提供することで,話題モデルの計測性能を大幅に向上させることができることを示す。
KeyATMは、より解釈可能な結果を提供し、文書分類性能が向上し、標準トピックモデルよりもトピックの数に敏感でない。
論文 参考訳(メタデータ) (2020-04-13T14:35:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。