論文の概要: A Topic Coverage Approach to Evaluation of Topic Models
- arxiv url: http://arxiv.org/abs/2012.06274v1
- Date: Fri, 11 Dec 2020 12:08:27 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-11 13:07:32.689485
- Title: A Topic Coverage Approach to Evaluation of Topic Models
- Title(参考訳): トピックモデル評価のためのトピックカバレッジアプローチ
- Authors: Damir Koren\v{c}i\'c (1), Strahil Ristov (1), Jelena Repar (1), Jan
\v{S}najder (2) ((1) Rudjer Bo\v{s}kovi\'c Institute, Croatia, (2) University
of Zagreb, Faculty of Electrical Engineering and Computing, Croatia)
- Abstract要約: トピックカバレッジの測定に基づくトピックモデル評価のアプローチについて検討する。
このアプローチの利点を,一連の実験において,異なる種類のトピックモデルを評価することによって実証する。
この論文の寄稿には、カバレッジの尺度とトピック発見のためのトピックモデルの使用のための推奨事項が含まれる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: When topic models are used for discovery of topics in text collections, a
question that arises naturally is how well the model-induced topics correspond
to topics of interest to the analyst. We investigate an approach to topic model
evaluation based on measuring topic coverage, and propose measures of coverage
based on matching between model topics and reference topics. We demonstrate the
benefits of the approach by evaluating, in a series of experiments, different
types of topic models on two distinct text domains. The experiments include
evaluation of model quality, analysis of coverage of distinct topic categories,
and the relation between coverage and other topic model evaluation methods. The
contributions of the paper include the measures of coverage and the
recommendations for the use of topic models for topic discovery.
- Abstract(参考訳): トピックモデルがテキストコレクション内のトピックの発見に使用されるとき、自然に生じる疑問は、モデルによって引き起こされるトピックがアナリストにとって関心のあるトピックにどの程度適合しているかである。
本研究では,トピックカバレッジの測定に基づくトピックモデル評価のアプローチを調査し,モデルトピックと参照トピックのマッチングに基づくカバレッジ尺度を提案する。
本研究は,2つの異なるテキスト領域上で,異なるタイプのトピックモデルを評価することによって,アプローチの利点を実証する。
実験には、モデル品質の評価、異なるトピックカテゴリのカバレッジの分析、カバレッジと他のトピックモデル評価方法との関係が含まれる。
本論文のコントリビューションには,トピック発見のためのトピックモデルの利用に関する,カバレッジの尺度と推奨事項が含まれている。
関連論文リスト
- Embedded Topic Models Enhanced by Wikification [3.082729239227955]
ウィキペディアの知識をニューラルトピックモデルに組み込んで、名前付きエンティティを認識する。
実験により,本手法は一般化可能性において,ニューラルトピックモデルの性能を向上させることが示された。
論文 参考訳(メタデータ) (2024-10-03T12:39:14Z) - Interactive Topic Models with Optimal Transport [75.26555710661908]
ラベル名監視型トピックモデリングのためのアプローチとして,EdTMを提案する。
EdTMは、LM/LLMベースのドキュメントトピック親和性を活用しながら、代入問題としてのトピックモデリングをモデル化する。
論文 参考訳(メタデータ) (2024-06-28T13:57:27Z) - GINopic: Topic Modeling with Graph Isomorphism Network [0.8962460460173959]
本稿では,グラフ同型ネットワークに基づく話題モデリングフレームワークGINopicを紹介し,単語間の相関関係を捉える。
本稿では,既存のトピックモデルと比較してGINopicの有効性を実証し,トピックモデリングの進歩の可能性を明らかにする。
論文 参考訳(メタデータ) (2024-04-02T17:18:48Z) - Neural Multimodal Topic Modeling: A Comprehensive Evaluation [18.660262940980477]
本稿では,マルチモーダルトピックモデリングの体系的および包括的評価について述べる。
本稿では2つの新しいトピックモデリングソリューションと2つの新しい評価指標を提案する。
全体として、前代未聞の豊かで多様なデータセットのコレクションに対する評価は、両方のモデルが一貫性と多様なトピックを生成することを示している。
論文 参考訳(メタデータ) (2024-03-26T01:29:46Z) - The Geometric Structure of Topic Models [0.0]
研究や応用に広く利用されているにもかかわらず、トピックモデルの詳細な分析は依然としてオープンな研究トピックである。
平坦なトピックモデルから順序構造を導出する入射幾何学的手法を提案する。
規則的モチーフに基づく概念階層のための新しい可視化パラダイムを提案する。
論文 参考訳(メタデータ) (2024-03-06T10:53:51Z) - TopicAdapt- An Inter-Corpora Topics Adaptation Approach [27.450275637652418]
本稿では、関連するソースコーパスから関連するトピックを適応し、ソースコーパスに存在しないターゲットコーパスに新しいトピックを発見できるトピックモデルTopicAdaptを提案する。
多様なドメインからの複数のデータセットに対する実験は、最先端のトピックモデルに対して提案されたモデルの優位性を示している。
論文 参考訳(メタデータ) (2023-10-08T02:56:44Z) - Are Neural Topic Models Broken? [81.15470302729638]
トピックモデルの自動評価と人的評価の関係について検討する。
ニューラルトピックモデルは、確立された古典的手法と比較して、両方の点においてより悪くなる。
論文 参考訳(メタデータ) (2022-10-28T14:38:50Z) - Knowledge-Aware Bayesian Deep Topic Model [50.58975785318575]
本稿では,事前知識を階層型トピックモデリングに組み込むベイズ生成モデルを提案する。
提案モデルでは,事前知識を効率的に統合し,階層的なトピック発見と文書表現の両面を改善する。
論文 参考訳(メタデータ) (2022-09-20T09:16:05Z) - Author Clustering and Topic Estimation for Short Texts [69.54017251622211]
同じ文書中の単語間の強い依存をモデル化することにより、遅延ディリクレ割当を拡張できる新しいモデルを提案する。
同時にユーザをクラスタ化し、ホック後のクラスタ推定の必要性を排除しています。
我々の手法は、短文で生じる問題に対する従来のアプローチよりも、-または----------- で機能する。
論文 参考訳(メタデータ) (2021-06-15T20:55:55Z) - ConvoSumm: Conversation Summarization Benchmark and Improved Abstractive
Summarization with Argument Mining [61.82562838486632]
我々は、さまざまなオンライン会話形式のニュースコメント、ディスカッションフォーラム、コミュニティ質問応答フォーラム、電子メールスレッドに関する4つの新しいデータセットをクラウドソースする。
我々は、データセットの最先端モデルをベンチマークし、データに関連する特徴を分析します。
論文 参考訳(メタデータ) (2021-06-01T22:17:13Z) - Improving Neural Topic Models using Knowledge Distillation [84.66983329587073]
我々は,確率論的トピックモデルと事前学習されたトランスフォーマーの最適属性を組み合わせるために,知識蒸留を用いる。
我々のモジュラー手法は、どのニューラルトピックモデルでも簡単に適用でき、トピックの品質を向上させることができる。
論文 参考訳(メタデータ) (2020-10-05T22:49:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。