論文の概要: TopicAdapt- An Inter-Corpora Topics Adaptation Approach
- arxiv url: http://arxiv.org/abs/2310.04978v1
- Date: Sun, 8 Oct 2023 02:56:44 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-12 13:55:44.320272
- Title: TopicAdapt- An Inter-Corpora Topics Adaptation Approach
- Title(参考訳): topicadapt - コーポラ間のトピック適応アプローチ
- Authors: Pritom Saha Akash, Trisha Das, Kevin Chen-Chuan Chang
- Abstract要約: 本稿では、関連するソースコーパスから関連するトピックを適応し、ソースコーパスに存在しないターゲットコーパスに新しいトピックを発見できるトピックモデルTopicAdaptを提案する。
多様なドメインからの複数のデータセットに対する実験は、最先端のトピックモデルに対して提案されたモデルの優位性を示している。
- 参考スコア(独自算出の注目度): 27.450275637652418
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Topic models are popular statistical tools for detecting latent semantic
topics in a text corpus. They have been utilized in various applications across
different fields. However, traditional topic models have some limitations,
including insensitivity to user guidance, sensitivity to the amount and quality
of data, and the inability to adapt learned topics from one corpus to another.
To address these challenges, this paper proposes a neural topic model,
TopicAdapt, that can adapt relevant topics from a related source corpus and
also discover new topics in a target corpus that are absent in the source
corpus. The proposed model offers a promising approach to improve topic
modeling performance in practical scenarios. Experiments over multiple datasets
from diverse domains show the superiority of the proposed model against the
state-of-the-art topic models.
- Abstract(参考訳): トピックモデルはテキストコーパス内の潜在意味トピックを検出する一般的な統計ツールである。
これらは様々な分野の様々なアプリケーションで利用されている。
しかし、従来のトピックモデルには、ユーザガイダンスに対する感受性、データの量と品質に対する感度、学習したトピックをコーパスから別のコーパスに適応できないことなど、いくつかの制限がある。
これらの課題に対処するため,本稿では,関連する情報源コーパスから関連するトピックを適応させ,ソースコーパスに存在しないターゲットコーパスで新たなトピックを発見できる,ニューラルトピックモデルである topicadapt を提案する。
提案モデルは,実践シナリオにおけるトピックモデリング性能を改善するための有望なアプローチを提供する。
多様なドメインからの複数のデータセットに対する実験は、提案モデルが最先端のトピックモデルに対して優れていることを示している。
関連論文リスト
- Interactive Topic Models with Optimal Transport [75.26555710661908]
ラベル名監視型トピックモデリングのためのアプローチとして,EdTMを提案する。
EdTMは、LM/LLMベースのドキュメントトピック親和性を活用しながら、代入問題としてのトピックモデリングをモデル化する。
論文 参考訳(メタデータ) (2024-06-28T13:57:27Z) - Enhanced Short Text Modeling: Leveraging Large Language Models for Topic Refinement [7.6115889231452964]
トピックリファインメント(Topic Refinement)と呼ばれる新しいアプローチを導入する。
このアプローチは、トピックの初期のモデリングに直接関係せず、採掘後にトピックを改善することに重点を置いています。
素早いエンジニアリングを駆使して、所与のトピック内での話題外単語を排除し、文脈的に関係のある単語だけが、よりセマンティックに適合した単語で保存または置換されることを保証する。
論文 参考訳(メタデータ) (2024-03-26T13:50:34Z) - Prompting Large Language Models for Topic Modeling [10.31712610860913]
大規模言語モデル(LLM)の高度な言語理解を活用する新しいトピックモデリング手法であるPromptTopicを提案する。
個々の文書から文章レベルでトピックを抽出し、これらのトピックを事前定義された量に集約して凝縮し、最終的に様々な長さのテキストに対して一貫性のあるトピックを提供する。
PromptTopicを3つの非常に多様なデータセットの最先端のベースラインに対してベンチマークし、意味のあるトピックを発見する能力を確立しました。
論文 参考訳(メタデータ) (2023-12-15T11:15:05Z) - Knowledge-Aware Bayesian Deep Topic Model [50.58975785318575]
本稿では,事前知識を階層型トピックモデリングに組み込むベイズ生成モデルを提案する。
提案モデルでは,事前知識を効率的に統合し,階層的なトピック発見と文書表現の両面を改善する。
論文 参考訳(メタデータ) (2022-09-20T09:16:05Z) - Enhance Topics Analysis based on Keywords Properties [0.0]
本稿では,最も情報性の高いトピックを選択可能なキーワード特性に基づく特異度スコアを示す。
実験では,最近の文献におけるコヒーレンススコアに基づいて,様々な要因のトピックモデリング結果を,解よりもはるかに低い情報損失で圧縮できることを示した。
論文 参考訳(メタデータ) (2022-03-09T15:10:12Z) - ConvoSumm: Conversation Summarization Benchmark and Improved Abstractive
Summarization with Argument Mining [61.82562838486632]
我々は、さまざまなオンライン会話形式のニュースコメント、ディスカッションフォーラム、コミュニティ質問応答フォーラム、電子メールスレッドに関する4つの新しいデータセットをクラウドソースする。
我々は、データセットの最先端モデルをベンチマークし、データに関連する特徴を分析します。
論文 参考訳(メタデータ) (2021-06-01T22:17:13Z) - Query-Driven Topic Model [23.07260625816975]
トピックモデルの望ましい特性の1つは、ユーザーがコーパスの特定の側面を記述するトピックを見つけることを可能にすることである。
本稿では,単語やフレーズで簡単なクエリを指定し,クエリ関連トピックを返却する,新しいクエリ駆動トピックモデルを提案する。
論文 参考訳(メタデータ) (2021-05-28T22:49:42Z) - Improving Neural Topic Models using Knowledge Distillation [84.66983329587073]
我々は,確率論的トピックモデルと事前学習されたトランスフォーマーの最適属性を組み合わせるために,知識蒸留を用いる。
我々のモジュラー手法は、どのニューラルトピックモデルでも簡単に適用でき、トピックの品質を向上させることができる。
論文 参考訳(メタデータ) (2020-10-05T22:49:16Z) - Topic-Aware Multi-turn Dialogue Modeling [91.52820664879432]
本稿では,トピック認識発話を教師なしでセグメント化して抽出する,多元対話モデリングのための新しいソリューションを提案する。
トピック・アウェア・モデリングは、新たに提案されたトピック・アウェア・セグメンテーション・アルゴリズムとトピック・アウェア・デュアル・アテンション・マッチング(TADAM)ネットワークによって実現されている。
論文 参考訳(メタデータ) (2020-09-26T08:43:06Z) - Topic Adaptation and Prototype Encoding for Few-Shot Visual Storytelling [81.33107307509718]
トピック間一般化の能力をモデル化するためのトピック適応型ストーリーテラを提案する。
また,アトピー内導出能力のモデル化を目的とした符号化手法の試作も提案する。
実験結果から,トピック適応とプロトタイプ符号化構造が相互に利益をもたらすことが明らかとなった。
論文 参考訳(メタデータ) (2020-08-11T03:55:11Z) - Keyword Assisted Topic Models [0.0]
少数のキーワードを提供することで,話題モデルの計測性能を大幅に向上させることができることを示す。
KeyATMは、より解釈可能な結果を提供し、文書分類性能が向上し、標準トピックモデルよりもトピックの数に敏感でない。
論文 参考訳(メタデータ) (2020-04-13T14:35:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。