論文の概要: BERTrend: Neural Topic Modeling for Emerging Trends Detection
- arxiv url: http://arxiv.org/abs/2411.05930v1
- Date: Fri, 08 Nov 2024 19:31:19 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-12 14:12:33.151368
- Title: BERTrend: Neural Topic Modeling for Emerging Trends Detection
- Title(参考訳): BERTrend:新しいトレンド検出のためのニューラルトピックモデリング
- Authors: Allaa Boutaleb, Jerome Picault, Guillaume Grosjean,
- Abstract要約: BERTrendは、大規模で進化しているテキストコーパスの出現傾向を監視する新しい方法である。
オンライン環境で神経トピックモデリングを使用して、意味のある弱い信号を正確に検出し、追跡する。
この手法は過去の出来事の振り返り分析にも利用できる。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: Detecting and tracking emerging trends and weak signals in large, evolving text corpora is vital for applications such as monitoring scientific literature, managing brand reputation, surveilling critical infrastructure and more generally to any kind of text-based event detection. Existing solutions often fail to capture the nuanced context or dynamically track evolving patterns over time. BERTrend, a novel method, addresses these limitations using neural topic modeling in an online setting. It introduces a new metric to quantify topic popularity over time by considering both the number of documents and update frequency. This metric classifies topics as noise, weak, or strong signals, flagging emerging, rapidly growing topics for further investigation. Experimentation on two large real-world datasets demonstrates BERTrend's ability to accurately detect and track meaningful weak signals while filtering out noise, offering a comprehensive solution for monitoring emerging trends in large-scale, evolving text corpora. The method can also be used for retrospective analysis of past events. In addition, the use of Large Language Models together with BERTrend offers efficient means for the interpretability of trends of events.
- Abstract(参考訳): 大規模で進化を続けるテキストコーパスにおける出現傾向と弱い信号の検出と追跡は、科学文献の監視、ブランド名の評価の管理、重要なインフラの監視、そしてより一般的には、テキストベースのイベント検出など、アプリケーションにとって不可欠である。
既存のソリューションは、ナンス化されたコンテキストをキャプチャしたり、時間とともに進化するパターンを動的に追跡するのに失敗することが多い。
BERTrendは、ニューラルトピックモデリングをオンライン環境で使用することで、これらの制限に対処する。
文書数と更新頻度の両方を考慮して、話題の人気度を時間とともに定量化する新しい指標を導入する。
このメトリクスは、トピックをノイズ、弱い、強いシグナル、新しいトピックのフラグ付け、さらなる調査のために急速に増加するトピックに分類する。
2つの大きな実世界のデータセットの実験は、BERTrendがノイズを除去しながら意味のある弱い信号を正確に検出し、追跡する能力を示している。
この手法は過去の出来事の振り返り分析にも利用できる。
さらに、BERTrendと一緒に大規模言語モデルを使用することで、イベントのトレンドの解釈可能性を高めることができる。
関連論文リスト
- Detecting Machine-Generated Long-Form Content with Latent-Space Variables [54.07946647012579]
既存のゼロショット検出器は主に、現実世界のドメインシフトに弱いトークンレベルの分布に焦点を当てている。
本稿では,イベント遷移などの抽象的要素を機械対人文検出の鍵となる要因として組み込んだ,より堅牢な手法を提案する。
論文 参考訳(メタデータ) (2024-10-04T18:42:09Z) - State-Space Modeling in Long Sequence Processing: A Survey on Recurrence in the Transformer Era [59.279784235147254]
このサーベイは、シーケンシャルなデータ処理の反復モデルに基づく最新のアプローチの詳細な概要を提供する。
新たなイメージは、標準のバックプロパゲーション・オブ・タイムから外れた学習アルゴリズムによって構成される、新しいルートを考える余地があることを示唆している。
論文 参考訳(メタデータ) (2024-06-13T12:51:22Z) - Challenges in Pre-Training Graph Neural Networks for Context-Based Fake
News Detection: An Evaluation of Current Strategies and Resource Limitations [1.9870554622325414]
本稿では,文脈に基づく偽ニュース検出の分野において,グラフニューラルネットワーク(GNN)の事前学習を適用することを提案する。
本実験は,グラフに基づく誤情報検出のための事前学習手法の評価を行う。
現在の大きな問題は、事前トレーニングに使用できる適切な大規模リソースの欠如である、と私たちは主張する。
論文 参考訳(メタデータ) (2024-02-28T09:10:25Z) - Text2Data: Low-Resource Data Generation with Textual Control [104.38011760992637]
自然言語は、人間が機械とシームレスに対話するための共通かつ直接的な制御信号として機能する。
ラベルのないデータを用いて教師なし拡散モデルを用いて基礎となるデータ分布を理解する新しいアプローチであるText2Dataを提案する。
制御性を確保し、破滅的な忘れを効果的に防止する、新しい制約最適化ベースの学習目標を通じて制御可能な微調整を行う。
論文 参考訳(メタデータ) (2024-02-08T03:41:39Z) - Exploring the Limits of Historical Information for Temporal Knowledge
Graph Extrapolation [59.417443739208146]
本稿では,歴史的コントラスト学習の新しい学習枠組みに基づくイベント予測モデルを提案する。
CENETは、最も潜在的なエンティティを識別するために、歴史的および非歴史的依存関係の両方を学ぶ。
提案したモデルを5つのベンチマークグラフで評価する。
論文 参考訳(メタデータ) (2023-08-29T03:26:38Z) - Discovering Communication Pattern Shifts in Large-Scale Labeled Networks
using Encoder Embedding and Vertex Dynamics [15.672962997741385]
ソーシャルメディアや電子メール通信などの大規模時系列ネットワークデータを分析することは、大きな課題となる。
本稿では,大規模グラフデータの効率的な埋め込みを可能にする時間エンコーダ埋め込み手法を提案する。
我々は,大規模組織から匿名化された時系列通信ネットワークを解析することによって,我々のアプローチを実証する。
論文 参考訳(メタデータ) (2023-05-03T18:38:01Z) - Evidential Temporal-aware Graph-based Social Event Detection via
Dempster-Shafer Theory [76.4580340399321]
ETGNN(Evidential Temporal-aware Graph Neural Network)を提案する。
ノードがテキストであり、エッジがそれぞれ複数の共有要素によって決定されるビュー固有グラフを構築する。
ビュー固有の不確実性を考慮すると、すべてのビューの表現は、明らかなディープラーニング(EDL)ニューラルネットワークを介してマス関数に変換される。
論文 参考訳(メタデータ) (2022-05-24T16:22:40Z) - Monitoring geometrical properties of word embeddings for detecting the
emergence of new topics [2.4411595994266797]
徐々に出現するトピックを早期に検出する問題に対処する。
本稿では,埋め込み空間における単語表現の挙動を監視することを提案する。
論文と学術論文の2つの公開データセットにおいて,最先端の手法よりも優れた結果が得られた。
論文 参考訳(メタデータ) (2021-11-05T13:31:56Z) - Perceptual Score: What Data Modalities Does Your Model Perceive? [73.75255606437808]
モデルが入力特徴の異なる部分集合に依存する度合いを評価する指標である知覚スコアを導入する。
近年,視覚的質問応答に対するマルチモーダルモデルでは,前者よりも視覚的データを知覚しにくい傾向がみられた。
知覚スコアを使用することで、スコアをデータサブセットのコントリビューションに分解することで、モデルのバイアスを分析することもできる。
論文 参考訳(メタデータ) (2021-10-27T12:19:56Z) - Multimodal Emergent Fake News Detection via Meta Neural Process Networks [36.52739834391597]
本稿では,MetaFENDというフェイクニュース検出フレームワークを提案する。
具体的には、メタラーニングとニューラルプロセスの手法を統合したモデルを提案する。
TwitterとWeiboから収集したマルチメディアデータセットに対して、大規模な実験が行われた。
論文 参考訳(メタデータ) (2021-06-22T21:21:29Z) - Complex networks for event detection in heterogeneous high volume news
streams [0.0]
オンラインニュースの量と頻度は、リアルタイムに動作可能な自動イベント検出方法の必要性を高める。
我々は、重要なニュースイベントが常にニュース記事にリンクされた名前付きエンティティを巻き込む、ネットワークベースのアプローチを開発する。
論文 参考訳(メタデータ) (2020-05-28T02:45:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。