論文の概要: Moving beyond word lists: towards abstractive topic labels for
human-like topics of scientific documents
- arxiv url: http://arxiv.org/abs/2211.05599v1
- Date: Fri, 28 Oct 2022 17:47:12 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-13 23:36:47.535039
- Title: Moving beyond word lists: towards abstractive topic labels for
human-like topics of scientific documents
- Title(参考訳): 単語リストを超越する:科学文書の人間ライクな話題の抽象的話題ラベルに向けて
- Authors: Domenic Rosati
- Abstract要約: 抽象的多文書要約(MDS)を用いたヒューマンライクなトピックラベル生成手法を提案する。
我々は、トピックラベリングのためのMDSを完全に運用するために、どのような研究が必要なのかを理解するために、引用文でトピックをモデル化する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Topic models represent groups of documents as a list of words (the topic
labels). This work asks whether an alternative approach to topic labeling can
be developed that is closer to a natural language description of a topic than a
word list. To this end, we present an approach to generating human-like topic
labels using abstractive multi-document summarization (MDS). We investigate our
approach with an exploratory case study. We model topics in citation sentences
in order to understand what further research needs to be done to fully
operationalize MDS for topic labeling. Our case study shows that in addition to
more human-like topics there are additional advantages to evaluation by using
clustering and summarization measures instead of topic model measures. However,
we find that there are several developments needed before we can design a
well-powered study to evaluate MDS for topic modeling fully. Namely, improving
cluster cohesion, improving the factuality and faithfulness of MDS, and
increasing the number of documents that might be supported by MDS. We present a
number of ideas on how these can be tackled and conclude with some thoughts on
how topic modeling can also be used to improve MDS in general.
- Abstract(参考訳): トピックモデルは、文書のグループを単語のリスト(トピックラベル)として表現する。
この研究は、単語リストよりもトピックの自然言語記述に近いトピックラベリングへの代替アプローチを開発できるかどうかを問うものである。
そこで本研究では,抽象的マルチドキュメント要約(mds)を用いた人間ライクなトピックラベル生成手法を提案する。
我々はこのアプローチを探索的なケーススタディで検討する。
我々は,トピックラベリングのためのmdsを完全に運用するために,今後どのような研究が必要かを理解するために,引用文中のトピックをモデル化する。
本研究は,より人間的な話題に加えて,話題モデルの尺度ではなく,クラスタリングや要約を用いた評価の利点があることを示す。
しかし、トピックモデリングのためのMDSを十分に評価するためには、十分に力のある研究を設計する前には、いくつかの開発が必要であることがわかった。
すなわち、クラスタ凝集の改善、MDSの事実性と忠実性の向上、MDSがサポートする可能性のあるドキュメントの数の増加である。
我々は,これらをいかに取り組めばよいのか,多くのアイデアを提示するとともに,トピックモデリングがmds全般を改善する上でどのように役立つのか,いくつかの考察をまとめる。
関連論文リスト
- Interactive Topic Models with Optimal Transport [75.26555710661908]
ラベル名監視型トピックモデリングのためのアプローチとして,EdTMを提案する。
EdTMは、LM/LLMベースのドキュメントトピック親和性を活用しながら、代入問題としてのトピックモデリングをモデル化する。
論文 参考訳(メタデータ) (2024-06-28T13:57:27Z) - Large Language Models Offer an Alternative to the Traditional Approach of Topic Modelling [0.9095496510579351]
広範テキストコーパス内の話題を明らかにする代替手段として,大規模言語モデル (LLM) の未解決の可能性について検討する。
本研究は, 適切なプロンプトを持つLCMが, トピックのタイトルを生成でき, トピックを洗練, マージするためのガイドラインに固執する上で, 有効な代替手段として目立たせることを示唆している。
論文 参考訳(メタデータ) (2024-03-24T17:39:51Z) - TopicGPT: A Prompt-based Topic Modeling Framework [77.72072691307811]
TopicGPTは,大規模言語モデルを用いてテキストコレクション内の潜在トピックを明らかにするプロンプトベースのフレームワークである。
競合する手法と比較して、人間の分類とよく一致したトピックを生成する。
そのトピックもまた解釈可能であり、自然言語ラベルと関連する自由形式の記述を含むトピックを好んで、曖昧な言葉の袋を除いた。
論文 参考訳(メタデータ) (2023-11-02T17:57:10Z) - Topics in the Haystack: Extracting and Evaluating Topics beyond
Coherence [0.0]
本稿では,文と文書のテーマを深く理解する手法を提案する。
これにより、一般的な単語やネオロジズムを含む潜在トピックを検出することができる。
本稿では, 侵入者の単語の人間識別と相関係数を示し, 単語侵入作業において, ほぼ人間レベルの結果を得る。
論文 参考訳(メタデータ) (2023-03-30T12:24:25Z) - Knowledge-Aware Bayesian Deep Topic Model [50.58975785318575]
本稿では,事前知識を階層型トピックモデリングに組み込むベイズ生成モデルを提案する。
提案モデルでは,事前知識を効率的に統合し,階層的なトピック発見と文書表現の両面を改善する。
論文 参考訳(メタデータ) (2022-09-20T09:16:05Z) - Topic Discovery via Latent Space Clustering of Pretrained Language Model
Representations [35.74225306947918]
本研究では, PLM 埋め込みを基盤とした空間学習とクラスタリングの連携フレームワークを提案する。
提案モデルでは,トピック発見のためにPLMがもたらす強力な表現力と言語的特徴を効果的に活用する。
論文 参考訳(メタデータ) (2022-02-09T17:26:08Z) - Keyword Assisted Embedded Topic Model [1.9000421840914223]
確率論的トピックモデルは、文書内の単語がトピックと呼ばれる潜在分布の集合を通してどのように生成されるかを記述する。
近年,組込みトピックモデル (ETM) がLDAを拡張して,単語埋め込みにおける意味情報を利用して意味的にリッチなトピックを導出している。
本稿では,ユーザ知識を情報的トピックレベルの先行情報に組み込む機能を備えたKeyETM(Keyword Assisted Embedded Topic Model)を提案する。
論文 参考訳(メタデータ) (2021-11-22T07:27:17Z) - Topic-Guided Abstractive Multi-Document Summarization [21.856615677793243]
多文書要約(MDS)の重要なポイントは、様々な文書間の関係を学習することである。
異種グラフとして複数の文書を表現できる新しい抽象MDSモデルを提案する。
我々は、クロスドキュメントセマンティックユニットとして機能する潜在トピックを共同で発見するために、ニューラルトピックモデルを採用している。
論文 参考訳(メタデータ) (2021-10-21T15:32:30Z) - ConvoSumm: Conversation Summarization Benchmark and Improved Abstractive
Summarization with Argument Mining [61.82562838486632]
我々は、さまざまなオンライン会話形式のニュースコメント、ディスカッションフォーラム、コミュニティ質問応答フォーラム、電子メールスレッドに関する4つの新しいデータセットをクラウドソースする。
我々は、データセットの最先端モデルをベンチマークし、データに関連する特徴を分析します。
論文 参考訳(メタデータ) (2021-06-01T22:17:13Z) - Detecting and Classifying Malevolent Dialogue Responses: Taxonomy, Data
and Methodology [68.8836704199096]
コーパスベースの会話インタフェースは、テンプレートベースのエージェントや検索ベースのエージェントよりも多様な自然なレスポンスを生成することができる。
コーパスベースの会話エージェントの生成能力が増大すると、マレヴォレントな反応を分類し、フィルタリングする必要性が生じる。
不適切な内容の認識と分類に関するこれまでの研究は、主にある種のマレヴォレンスに焦点を絞っている。
論文 参考訳(メタデータ) (2020-08-21T22:43:27Z) - Topic Adaptation and Prototype Encoding for Few-Shot Visual Storytelling [81.33107307509718]
トピック間一般化の能力をモデル化するためのトピック適応型ストーリーテラを提案する。
また,アトピー内導出能力のモデル化を目的とした符号化手法の試作も提案する。
実験結果から,トピック適応とプロトタイプ符号化構造が相互に利益をもたらすことが明らかとなった。
論文 参考訳(メタデータ) (2020-08-11T03:55:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。