論文の概要: Jointly Dynamic Topic Model for Recognition of Lead-lag Relationship in
Two Text Corpora
- arxiv url: http://arxiv.org/abs/2111.10846v1
- Date: Sun, 21 Nov 2021 15:53:15 GMT
- ステータス: 処理完了
- システム内更新日: 2021-11-23 14:04:51.828267
- Title: Jointly Dynamic Topic Model for Recognition of Lead-lag Relationship in
Two Text Corpora
- Title(参考訳): 2つのテキストコーパスにおけるリードラグ関係認識のための共同動的トピックモデル
- Authors: Yandi Zhu, Xiaoling Lu, Jingya Hong, and Feifei Wang
- Abstract要約: 本研究は,「リードラグ関係」と定義する2つのテキストコーパス間の特別な関係性に着目した。
この関係は、あるテキストコーパスが将来他のテキストコーパスで議論されるトピックに影響を与える現象を特徴づける。
認識されたリードラグ関係により、2つのテキストコーパスの類似性を把握でき、両方のコーパスにおけるトピック学習の質を向上させることができる。
- 参考スコア(独自算出の注目度): 0.19573380763700712
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Topic evolution modeling has received significant attentions in recent
decades. Although various topic evolution models have been proposed, most
studies focus on the single document corpus. However in practice, we can easily
access data from multiple sources and also observe relationships between them.
Then it is of great interest to recognize the relationship between multiple
text corpora and further utilize this relationship to improve topic modeling.
In this work, we focus on a special type of relationship between two text
corpora, which we define as the "lead-lag relationship". This relationship
characterizes the phenomenon that one text corpus would influence the topics to
be discussed in the other text corpus in the future. To discover the lead-lag
relationship, we propose a jointly dynamic topic model and also develop an
embedding extension to address the modeling problem of large-scale text corpus.
With the recognized lead-lag relationship, the similarities of the two text
corpora can be figured out and the quality of topic learning in both corpora
can be improved. We numerically investigate the performance of the jointly
dynamic topic modeling approach using synthetic data. Finally, we apply the
proposed model on two text corpora consisting of statistical papers and the
graduation theses. Results show the proposed model can well recognize the
lead-lag relationship between the two corpora, and the specific and shared
topic patterns in the two corpora are also discovered.
- Abstract(参考訳): 近年,トピック進化モデルが注目されている。
様々なトピック進化モデルが提案されているが、ほとんどの研究は単一の文書コーパスに焦点を当てている。
しかし実際には、複数のソースからのデータを簡単にアクセスでき、それらの間の関係も観察できる。
そして、複数のテキストコーパス間の関係を認識し、さらにこの関係を利用してトピックモデリングを改善することが大きな関心事である。
本研究では,2つのテキストコーパス間の特別な関係に着目し,その関係を「リード・ラグ関係」と定義する。
この関係は、あるテキストコーパスが将来他のテキストコーパスで議論されるトピックに影響を与える現象を特徴づける。
リード・ラグ関係を明らかにするために,協調的なトピックモデルを提案し,大規模テキストコーパスのモデリング問題に対処する組込み拡張を開発した。
認識されたリードラグ関係により、2つのテキストコーパスの類似性を把握でき、両方のコーパスにおけるトピック学習の質を向上させることができる。
合成データを用いた同時動的トピックモデリング手法の性能を数値的に検討する。
最後に,統計論文と卒業論文からなる2つのテキストコーパスに対して提案モデルを適用する。
その結果,提案モデルでは2つのコーパス間のリードラグ関係をよく認識でき,また2コーパス内の特定のトピックパターンや共有トピックパターンも発見できることがわかった。
関連論文リスト
- Interactive Topic Models with Optimal Transport [75.26555710661908]
ラベル名監視型トピックモデリングのためのアプローチとして,EdTMを提案する。
EdTMは、LM/LLMベースのドキュメントトピック親和性を活用しながら、代入問題としてのトピックモデリングをモデル化する。
論文 参考訳(メタデータ) (2024-06-28T13:57:27Z) - Context versus Prior Knowledge in Language Models [49.17879668110546]
言語モデルは、事前学習中に学んだ事前知識と、文脈で提示された新しい情報を統合する必要があることが多い。
本稿では,モデルがコンテキストと先行するエンティティへの依存性を測定するための2つの相互情報ベースメトリクスを提案する。
論文 参考訳(メタデータ) (2024-04-06T13:46:53Z) - GINopic: Topic Modeling with Graph Isomorphism Network [0.8962460460173959]
本稿では,グラフ同型ネットワークに基づく話題モデリングフレームワークGINopicを紹介し,単語間の相関関係を捉える。
本稿では,既存のトピックモデルと比較してGINopicの有効性を実証し,トピックモデリングの進歩の可能性を明らかにする。
論文 参考訳(メタデータ) (2024-04-02T17:18:48Z) - Multimodal Relation Extraction with Cross-Modal Retrieval and Synthesis [89.04041100520881]
本研究は,対象物,文,画像全体に基づいて,テキストおよび視覚的証拠を検索することを提案する。
我々は,オブジェクトレベル,画像レベル,文レベル情報を合成し,同一性と異なるモダリティ間の推論を改善する新しい手法を開発した。
論文 参考訳(メタデータ) (2023-05-25T15:26:13Z) - Topics in the Haystack: Extracting and Evaluating Topics beyond
Coherence [0.0]
本稿では,文と文書のテーマを深く理解する手法を提案する。
これにより、一般的な単語やネオロジズムを含む潜在トピックを検出することができる。
本稿では, 侵入者の単語の人間識別と相関係数を示し, 単語侵入作業において, ほぼ人間レベルの結果を得る。
論文 参考訳(メタデータ) (2023-03-30T12:24:25Z) - Revise and Resubmit: An Intertextual Model of Text-based Collaboration
in Peer Review [52.359007622096684]
ピアレビューは、ほとんどの科学分野における出版プロセスの重要な要素である。
既存のNLP研究は個々のテキストの分析に重点を置いている。
編集補助は、しばしばテキストのペア間の相互作用をモデル化する必要がある。
論文 参考訳(メタデータ) (2022-04-22T16:39:38Z) - Contrastive Learning for Neural Topic Model [14.65513836956786]
敵対的トピックモデル(ATM)は、文書を別の異なるサンプルと区別することで、文書の意味パターンをうまくキャプチャすることができる。
最適化問題として識別目標を再定式化するための新しい手法を提案し,新しいサンプリング手法を設計する。
実験の結果、我々のフレームワークは3つの一般的なベンチマークデータセットにおいて、他の最先端のニューラルトピックモデルよりも優れていることが示された。
論文 参考訳(メタデータ) (2021-10-25T09:46:26Z) - Learning Relation Prototype from Unlabeled Texts for Long-tail Relation
Extraction [84.64435075778988]
本稿では,ラベルのないテキストから関係プロトタイプを学習するための一般的なアプローチを提案する。
我々は、エンティティ間の暗黙的な要因として関係プロトタイプを学習する。
私たちは、New York TimesとGoogle Distant Supervisionの2つの公開データセットで実験を行います。
論文 参考訳(メタデータ) (2020-11-27T06:21:12Z) - Learning Informative Representations of Biomedical Relations with Latent
Variable Models [2.4366811507669115]
本稿では,任意に柔軟な分布を持つ潜在変数モデルを提案する。
我々のモデルは、パラメータが少なく、トレーニングがかなり速く、両方のタスクの強いベースラインと競合する結果が得られることを実証する。
論文 参考訳(メタデータ) (2020-11-20T08:56:31Z) - On the Importance of Word and Sentence Representation Learning in
Implicit Discourse Relation Classification [43.483855615908695]
暗黙の談話関係分類は、浅い談話解析において最も難しい部分の1つである。
暗黙的な談話分析には,強力な文脈表現モジュール,二元多視点マッチングモジュール,大域情報融合モジュールが重要であると論じる。
論文 参考訳(メタデータ) (2020-04-27T07:41:02Z) - Explaining Relationships Between Scientific Documents [55.23390424044378]
本稿では,2つの学術文書間の関係を自然言語テキストを用いて記述する課題に対処する。
本稿では154K文書から622Kサンプルのデータセットを作成する。
論文 参考訳(メタデータ) (2020-02-02T03:54:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。