論文の概要: Large Language Model Enhanced Clustering for News Event Detection
- arxiv url: http://arxiv.org/abs/2406.10552v1
- Date: Sat, 15 Jun 2024 08:13:47 GMT
- ステータス: 処理完了
- システム内更新日: 2024-06-18 23:53:14.324789
- Title: Large Language Model Enhanced Clustering for News Event Detection
- Title(参考訳): ニュースイベント検出のための大規模言語モデル強化クラスタリング
- Authors: Adane Nega Tarekegn, Fazle Rabbi, Bjørnar Tessem,
- Abstract要約: 本稿では,大規模言語モデル(LLM)とクラスタリング解析を組み合わせたイベント検出フレームワークを提案する。
このフレームワークは、事前検出タスクと後検出タスクの両方を通じてイベントクラスタリングを強化する。
本稿では,クラスタリング結果の有効性とロバスト性を評価するための新しいクラスタ安定性評価指標(CSAI)を提案する。
- 参考スコア(独自算出の注目度): 2.4481188799524576
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The news landscape is continuously evolving, with an ever-increasing volume of information from around the world. Automated event detection within this vast data repository is essential for monitoring, identifying, and categorizing significant news occurrences across diverse platforms. This paper presents an event detection framework that leverages Large Language Models (LLMs) combined with clustering analysis to detect news events from the Global Database of Events, Language, and Tone (GDELT). The framework enhances event clustering through both pre-event detection tasks (keyword extraction and text embedding) and post-event detection tasks (event summarization and topic labeling). We also evaluate the impact of various textual embeddings on the quality of clustering outcomes, ensuring robust news categorization. Additionally, we introduce a novel Cluster Stability Assessment Index (CSAI) to assess the validity and robustness of clustering results. CSAI utilizes latent feature vectors to provide a new way of measuring clustering quality. Our experiments indicate that combining LLM embeddings with clustering algorithms yields the best results, demonstrating greater robustness in terms of CSAI scores. Moreover, post-event detection tasks generate meaningful insights, facilitating effective interpretation of event clustering results. Overall, our experimental results indicate that the proposed framework offers valuable insights and could enhance the accuracy and depth of news reporting.
- Abstract(参考訳): ニュースの世界は継続的に進化し続けており、世界中の情報が増え続けている。
この巨大なデータリポジトリ内のイベントの自動検出は、さまざまなプラットフォーム間で重要なニュースを監視、識別、分類するために不可欠である。
本稿では,大規模言語モデル(LLM)とクラスタリング分析を組み合わせて,GDELT(Global Database of Events, Language, and Tone)からニュースイベントを検出するイベント検出フレームワークを提案する。
このフレームワークは、イベント検出タスク(キーワード抽出とテキスト埋め込み)と後検出タスク(イベント要約とトピックラベリング)の両方を通じてイベントクラスタリングを強化する。
また、各種テキスト埋め込みがクラスタリング結果の質に及ぼす影響を評価し、ロバストなニュース分類を確実にする。
さらに,クラスタリング結果の有効性とロバスト性を評価するために,新しいクラスタ安定性評価指標(CSAI)を導入する。
CSAIは遅延特徴ベクトルを用いてクラスタリングの品質を計測する新しい方法を提供する。
実験の結果,LCMの埋め込みとクラスタリングアルゴリズムを組み合わせることで,CSAIスコアがより堅牢であることを示す。
さらに、イベント検出タスクは意味のある洞察を生成し、イベントクラスタリング結果の効果的な解釈を容易にする。
実験結果から,提案フレームワークは貴重な洞察を与え,ニュースレポートの精度と深度を向上する可能性が示唆された。
関連論文リスト
- Unsupervised Social Event Detection via Hybrid Graph Contrastive
Learning and Reinforced Incremental Clustering [17.148519270314313]
本稿では,ハイブリッドグラフのコントラスト学習と漸進的クラスタリングによるソーシャルメディアイベント検出手法を提案する。
TwitterとMavenのデータセット上でHCRCを評価するための包括的な実験を行います。
論文 参考訳(メタデータ) (2023-12-08T08:56:59Z) - Token-Event-Role Structure-based Multi-Channel Document-Level Event
Extraction [15.02043375212839]
本稿では,トークン・イベント・ロールと呼ばれる新しいデータ構造を取り入れた,文書レベルのイベント抽出のための新しいフレームワークを提案する。
提案したデータ構造により,複数のイベントにおけるトークンの主要な役割を明らかにすることができ,イベント関係のより包括的な理解が容易になる。
その結果,本手法はF1スコアの9.5ポイント向上した。
論文 参考訳(メタデータ) (2023-06-30T15:22:57Z) - Boosting Event Extraction with Denoised Structure-to-Text Augmentation [52.21703002404442]
イベント抽出は、テキストから事前に定義されたイベントトリガと引数を認識することを目的としている。
最近のデータ拡張手法は文法的誤りの問題を無視することが多い。
本稿では,イベント抽出DAEEのための記述構造からテキストへの拡張フレームワークを提案する。
論文 参考訳(メタデータ) (2023-05-16T16:52:07Z) - Abnormal Event Detection via Hypergraph Contrastive Learning [54.80429341415227]
異常事象検出は多くの実アプリケーションにおいて重要な役割を果たす。
本稿では,分散異種情報ネットワークにおける異常事象検出問題について検討する。
AEHCLと呼ばれる新しいハイパーグラフコントラスト学習法が,異常事象のパターンをフルに捉えるために提案されている。
論文 参考訳(メタデータ) (2023-04-02T08:23:20Z) - Robust Event Classification Using Imperfect Real-world PMU Data [58.26737360525643]
本研究では,不完全な実世界のファサー計測単位(PMU)データを用いて,ロバストな事象分類について検討する。
我々は、堅牢なイベント分類器を訓練するための新しい機械学習フレームワークを開発する。
論文 参考訳(メタデータ) (2021-10-19T17:41:43Z) - Reliable Shot Identification for Complex Event Detection via
Visual-Semantic Embedding [72.9370352430965]
本稿では,映像中の事象検出のための視覚的意味的誘導損失法を提案する。
カリキュラム学習に動機付け,高い信頼性の事例で分類器の訓練を開始するために,負の弾性正規化項を導入する。
提案する非ネット正規化問題の解法として,代替最適化アルゴリズムを開発した。
論文 参考訳(メタデータ) (2021-10-12T11:46:56Z) - Learning Constraints and Descriptive Segmentation for Subevent Detection [74.48201657623218]
本稿では,サブイベント検出とEventSeg予測の依存関係をキャプチャする制約を学習し,強制するアプローチを提案する。
我々は制約学習にRectifier Networksを採用し、学習した制約をニューラルネットワークの損失関数の正規化項に変換する。
論文 参考訳(メタデータ) (2021-09-13T20:50:37Z) - Adversarial Feature Augmentation and Normalization for Visual
Recognition [109.6834687220478]
最近のコンピュータビジョンの進歩は、分類モデルの一般化能力を改善するために、逆データ拡張を利用する。
本稿では,中間的特徴埋め込みにおける敵対的拡張を提唱する効率的かつ効率的な代替手法を提案する。
代表的なバックボーンネットワークを用いて,多様な視覚認識タスクにまたがる提案手法を検証する。
論文 参考訳(メタデータ) (2021-03-22T20:36:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。