論文の概要: Bidirectional Topic Matching: Quantifying Thematic Overlap Between Corpora Through Topic Modelling
- arxiv url: http://arxiv.org/abs/2412.18376v1
- Date: Tue, 24 Dec 2024 12:02:43 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-25 15:55:55.106752
- Title: Bidirectional Topic Matching: Quantifying Thematic Overlap Between Corpora Through Topic Modelling
- Title(参考訳): 双方向トピックマッチング:トピックモデリングによるコーパス間のテーマオーバーラップの定量化
- Authors: Raven Adam, Marie Lisa Kogler,
- Abstract要約: Bidirectional Topic Matching (BTM) は、コーパス間の主題の重なり合いとばらつきを定量化するクロスコーパス・トピック・モデリングの新しい手法である。
BTMは二重モデルアプローチを採用し、各コーパスごとに個別のトピックモデルをトレーニングし、相互に適用して包括的なクロスコーパス比較を可能にする。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: This study introduces Bidirectional Topic Matching (BTM), a novel method for cross-corpus topic modeling that quantifies thematic overlap and divergence between corpora. BTM is a flexible framework that can incorporate various topic modeling approaches, including BERTopic, Top2Vec, and Latent Dirichlet Allocation (LDA). BTM employs a dual-model approach, training separate topic models for each corpus and applying them reciprocally to enable comprehensive cross-corpus comparisons. This methodology facilitates the identification of shared themes and unique topics, providing nuanced insights into thematic relationships. Validation against cosine similarity-based methods demonstrates the robustness of BTM, with strong agreement metrics and distinct advantages in handling outlier topics. A case study on climate news articles showcases BTM's utility, revealing significant thematic overlaps and distinctions between corpora focused on climate change and climate action. BTM's flexibility and precision make it a valuable tool for diverse applications, from political discourse analysis to interdisciplinary studies. By integrating shared and unique topic analyses, BTM offers a comprehensive framework for exploring thematic relationships, with potential extensions to multilingual and dynamic datasets. This work highlights BTM's methodological contributions and its capacity to advance discourse analysis across various domains.
- Abstract(参考訳): 本研究では,コーパス間の主題的重なり合いとばらつきを定量化するクロスコーパス・トピック・モデリング手法である双方向トピックマッチング(BTM)を紹介する。
BTMは、BERTopic、Top2Vec、Latent Dirichlet Allocation (LDA)など、さまざまなトピックモデリングアプローチを組み込むフレキシブルなフレームワークである。
BTMは二重モデルアプローチを採用し、各コーパスごとに個別のトピックモデルをトレーニングし、相互に適用して包括的なクロスコーパス比較を可能にする。
この方法論は、共有テーマとユニークなトピックの識別を促進し、テーマ関係に関する微妙な洞察を提供する。
コサイン類似性に基づく手法に対する検証は、BTMの堅牢性を示す。
気候ニュース記事のケーススタディでは、BTMの実用性を示し、気候変動と気候活動に焦点を当てたコーパス間の大きなテーマ上の重複と区別を明らかにしている。
BTMの柔軟性と精度は、政治的談話分析から学際研究まで、様々な応用に有用なツールである。
共通のトピック分析とユニークなトピック分析を統合することで、BTMはテーマ関係を探索する包括的なフレームワークを提供し、多言語および動的データセットへの潜在的な拡張を提供する。
本研究は, BTMの方法論的貢献と, 諸領域にわたる談話分析の推進能力を強調した。
関連論文リスト
- Bridging the Evaluation Gap: Leveraging Large Language Models for Topic Model Evaluation [0.0]
本研究では,Large Language Models (LLMs) を用いた科学文献における動的に進化するトピックの自動評価のための枠組みを提案する。
提案手法は,専門家のアノテータや狭義の統計指標に大きく依存することなく,コヒーレンス,反復性,多様性,トピック文書のアライメントといった重要な品質次元を測定するためにLLMを利用する。
論文 参考訳(メタデータ) (2025-02-11T08:23:56Z) - Enhancing Topic Interpretability for Neural Topic Modeling through Topic-wise Contrastive Learning [23.816433328623397]
トピックの正規化を含まない可能性の過剰強調は、トピックモデリングの過剰な拡張潜在空間につながる可能性がある。
本稿では,トピック解釈可能性の複数の面を評価可能な微分正則化器を統合した新しいNTMフレームワークContraTopicを提案する。
我々のアプローチは、最先端のNTMと比較して、優れた解釈可能性を持つトピックを一貫して生成する。
論文 参考訳(メタデータ) (2024-12-23T07:07:06Z) - BiosERC: Integrating Biography Speakers Supported by LLMs for ERC Tasks [2.9873893715462176]
本研究は,会話における話者特性を調査するBiosERCという新しいフレームワークを紹介する。
本研究では,Large Language Models (LLMs) を用いて,会話中の話者の「生体情報」を抽出する。
提案手法は,3つの有名なベンチマークデータセットを用いて,最先端のSOTA(State-of-the-art)結果を得た。
論文 参考訳(メタデータ) (2024-07-05T06:25:34Z) - Interactive Topic Models with Optimal Transport [75.26555710661908]
ラベル名監視型トピックモデリングのためのアプローチとして,EdTMを提案する。
EdTMは、LM/LLMベースのドキュメントトピック親和性を活用しながら、代入問題としてのトピックモデリングをモデル化する。
論文 参考訳(メタデータ) (2024-06-28T13:57:27Z) - MoME: Mixture of Multimodal Experts for Cancer Survival Prediction [46.520971457396726]
生存分析は、難しい課題として、全体スライド画像(WSI)とゲノムデータを総合的な意思決定のために統合する必要がある。
従来の手法ではコアテンション(co-attention)方式が用いられており、この手法は両方のモダリティから特徴を分離した後にのみ融合する。
符号化と融合を同時に行うBiased Progressive Clever(BPE)パラダイムを提案する。
論文 参考訳(メタデータ) (2024-06-14T03:44:33Z) - Two in One Go: Single-stage Emotion Recognition with Decoupled Subject-context Transformer [78.35816158511523]
単段階の感情認識手法として,DSCT(Decoupled Subject-Context Transformer)を用いる。
広範に使われている文脈認識型感情認識データセットであるCAER-SとEMOTICの単段階フレームワークの評価を行った。
論文 参考訳(メタデータ) (2024-04-26T07:30:32Z) - Multimodal Relation Extraction with Cross-Modal Retrieval and Synthesis [89.04041100520881]
本研究は,対象物,文,画像全体に基づいて,テキストおよび視覚的証拠を検索することを提案する。
我々は,オブジェクトレベル,画像レベル,文レベル情報を合成し,同一性と異なるモダリティ間の推論を改善する新しい手法を開発した。
論文 参考訳(メタデータ) (2023-05-25T15:26:13Z) - Group Gated Fusion on Attention-based Bidirectional Alignment for
Multimodal Emotion Recognition [63.07844685982738]
本稿では、LSTM隠蔽状態上の注目に基づく双方向アライメントネットワークで構成されるGBAN(Gated Bidirectional Alignment Network)と呼ばれる新しいモデルを提案する。
LSTMの最後の隠れ状態よりもアテンション整列表現の方が有意に優れていたことを実証的に示す。
提案したGBANモデルは、IEMOCAPデータセットにおける既存の最先端マルチモーダルアプローチよりも優れている。
論文 参考訳(メタデータ) (2022-01-17T09:46:59Z) - Transformer-based Multi-Aspect Modeling for Multi-Aspect Multi-Sentiment
Analysis [56.893393134328996]
本稿では,複数の側面間の潜在的な関係を抽出し,文中のすべての側面の感情を同時に検出できるトランスフォーマーベースのマルチアスペクトモデリング手法を提案する。
本手法はBERTやRoBERTaといった強力なベースラインと比較して顕著な改善を実現している。
論文 参考訳(メタデータ) (2020-11-01T11:06:31Z) - Modeling Topical Relevance for Multi-Turn Dialogue Generation [61.87165077442267]
マルチターン対話におけるトピックドリフト問題に対処する新しいモデルSTAR-BTMを提案する。
バイラルトピックモデルは、トレーニングデータセット全体に基づいて事前トレーニングされ、各コンテキストのトピック表現に基づいてトピックレベルの注意重みが計算される。
中国における顧客サービスデータと英語Ubuntuの対話データの両方の実験結果から、STAR-BTMは最先端の手法を著しく上回っていることがわかった。
論文 参考訳(メタデータ) (2020-09-27T03:33:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。