論文の概要: Coordinated Topic Modeling
- arxiv url: http://arxiv.org/abs/2210.08559v1
- Date: Sun, 16 Oct 2022 15:10:54 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-18 19:53:28.934098
- Title: Coordinated Topic Modeling
- Title(参考訳): 協調トピックモデリング
- Authors: Pritom Saha Akash and Jie Huang and Kevin Chen-Chuan Chang
- Abstract要約: 本稿では,テキストコーパスを記述しながら人間の行動を模倣する「協調話題モデリング」という新しい問題を提案する。
我々は,対象のコーパス固有の側面を捕捉するために,参照表現を効果的に利用する埋め込み型協調トピックモデルECTMを設計する。
ECTMでは,課題を解決するための自己学習機構を備えたトピックレベルと文書レベルの監視を導入する。
- 参考スコア(独自算出の注目度): 10.710176350043998
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We propose a new problem called coordinated topic modeling that imitates
human behavior while describing a text corpus. It considers a set of
well-defined topics like the axes of a semantic space with a reference
representation. It then uses the axes to model a corpus for easily
understandable representation. This new task helps represent a corpus more
interpretably by reusing existing knowledge and benefits the corpora comparison
task. We design ECTM, an embedding-based coordinated topic model that
effectively uses the reference representation to capture the target
corpus-specific aspects while maintaining each topic's global semantics. In
ECTM, we introduce the topic- and document-level supervision with a
self-training mechanism to solve the problem. Finally, extensive experiments on
multiple domains show the superiority of our model over other baselines.
- Abstract(参考訳): テキストコーパスを記述しながら人間の行動を模倣するコーディネートドトピックモデリングと呼ばれる新しい問題を提案する。
参照表現を持つ意味空間の軸のような、明確に定義されたトピックの集合を考える。
次に、xを使ってコーパスをモデル化し、容易に理解可能な表現を行う。
この新しいタスクは、既存の知識を再利用してコーパスをより解釈的に表現するのに役立つ。
我々は,各トピックのグローバルなセマンティクスを維持しつつ,対象コーパス固有の側面を効果的に捉え,参照表現を利用する埋め込み型協調トピックモデルECTMを設計する。
ECTMでは,課題を解決するための自己学習機構を備えたトピックレベルの監視と文書レベルの監視を導入する。
最後に、複数のドメインに対する広範な実験は、モデルが他のベースラインよりも優れていることを示す。
関連論文リスト
- Interactive Topic Models with Optimal Transport [75.26555710661908]
ラベル名監視型トピックモデリングのためのアプローチとして,EdTMを提案する。
EdTMは、LM/LLMベースのドキュメントトピック親和性を活用しながら、代入問題としてのトピックモデリングをモデル化する。
論文 参考訳(メタデータ) (2024-06-28T13:57:27Z) - TopicAdapt- An Inter-Corpora Topics Adaptation Approach [27.450275637652418]
本稿では、関連するソースコーパスから関連するトピックを適応し、ソースコーパスに存在しないターゲットコーパスに新しいトピックを発見できるトピックモデルTopicAdaptを提案する。
多様なドメインからの複数のデータセットに対する実験は、最先端のトピックモデルに対して提案されたモデルの優位性を示している。
論文 参考訳(メタデータ) (2023-10-08T02:56:44Z) - Topics as Entity Clusters: Entity-based Topics from Language Models and
Graph Neural Networks [0.7734726150561089]
本稿では,概念的エンティティを用いたクラスタベースのトピックモデリング手法を提案する。
エンティティは、リレーショナル情報に富んだ実世界の概念の言語に依存しない表現である。
当社のアプローチは、コヒーレンシメトリクス全体で、他の最先端トピックモデルよりも一貫して優れています。
論文 参考訳(メタデータ) (2023-01-06T10:54:54Z) - Knowledge-Aware Bayesian Deep Topic Model [50.58975785318575]
本稿では,事前知識を階層型トピックモデリングに組み込むベイズ生成モデルを提案する。
提案モデルでは,事前知識を効率的に統合し,階層的なトピック発見と文書表現の両面を改善する。
論文 参考訳(メタデータ) (2022-09-20T09:16:05Z) - Dialogue Meaning Representation for Task-Oriented Dialogue Systems [51.91615150842267]
タスク指向対話のための柔軟かつ容易に拡張可能な表現である対話意味表現(DMR)を提案する。
我々の表現は、合成意味論とタスク固有の概念のためのリッチな意味論を表現するために、継承階層を持つノードとエッジのセットを含んでいる。
異なる機械学習ベースの対話モデルを評価するための2つの評価タスクを提案し、さらにグラフベースのコア参照解決タスクのための新しいコア参照解決モデルGNNCorefを提案する。
論文 参考訳(メタデータ) (2022-04-23T04:17:55Z) - Topic Discovery via Latent Space Clustering of Pretrained Language Model
Representations [35.74225306947918]
本研究では, PLM 埋め込みを基盤とした空間学習とクラスタリングの連携フレームワークを提案する。
提案モデルでは,トピック発見のためにPLMがもたらす強力な表現力と言語的特徴を効果的に活用する。
論文 参考訳(メタデータ) (2022-02-09T17:26:08Z) - TopicNet: Semantic Graph-Guided Topic Discovery [51.71374479354178]
既存の階層的なトピックモデルでは、教師なしの方法でテキストコーパスから意味論的意味のあるトピックを抽出することができる。
TopicNetを階層的なトピックモデルとして導入し、学習に影響を与えるための帰納的バイアスとして、事前構造知識を注入する。
論文 参考訳(メタデータ) (2021-10-27T09:07:14Z) - Author Clustering and Topic Estimation for Short Texts [69.54017251622211]
同じ文書中の単語間の強い依存をモデル化することにより、遅延ディリクレ割当を拡張できる新しいモデルを提案する。
同時にユーザをクラスタ化し、ホック後のクラスタ推定の必要性を排除しています。
我々の手法は、短文で生じる問題に対する従来のアプローチよりも、-または----------- で機能する。
論文 参考訳(メタデータ) (2021-06-15T20:55:55Z) - Query-Driven Topic Model [23.07260625816975]
トピックモデルの望ましい特性の1つは、ユーザーがコーパスの特定の側面を記述するトピックを見つけることを可能にすることである。
本稿では,単語やフレーズで簡単なクエリを指定し,クエリ関連トピックを返却する,新しいクエリ駆動トピックモデルを提案する。
論文 参考訳(メタデータ) (2021-05-28T22:49:42Z) - Multi-View Sequence-to-Sequence Models with Conversational Structure for
Abstractive Dialogue Summarization [72.54873655114844]
テキスト要約は、NLPにおいて最も困難で興味深い問題の1つである。
本研究では、まず、異なる視点から構造化されていない日々のチャットの会話構造を抽出し、会話を表現するマルチビューシーケンス・ツー・シーケンスモデルを提案する。
大規模対話要約コーパスの実験により,本手法は,自動評価と人的判断の両面から,従来の最先端モデルよりも有意に優れた性能を示した。
論文 参考訳(メタデータ) (2020-10-04T20:12:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。