論文の概要: An Incremental Clustering Baseline for Event Detection on Twitter
- arxiv url: http://arxiv.org/abs/2412.15257v1
- Date: Mon, 16 Dec 2024 09:33:13 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-23 16:23:28.826577
- Title: An Incremental Clustering Baseline for Event Detection on Twitter
- Title(参考訳): Twitterにおけるイベント検出のためのインクリメンタルクラスタリングベースライン
- Authors: Marjolaine Ray, Qi Wang, Frédérique Mélanie-Becquet, Thierry Poibeau, Béatrice Mazoyer,
- Abstract要約: テキストストリームにおけるイベント検出は,オンラインメディアやソーシャルネットワークの分析において重要な課題である。
本研究では, 文埋め込みの最近の進歩と相まって, 漸進的クラスタリングアルゴリズムを用いた。
- 参考スコア(独自算出の注目度): 7.381576223080405
- License:
- Abstract: Event detection in text streams is a crucial task for the analysis of online media and social networks. One of the current challenges in this field is establishing a performance standard while maintaining an acceptable level of computational complexity. In our study, we use an incremental clustering algorithm combined with recent advancements in sentence embeddings. Our objective is to compare our findings with previous studies, specifically those by Cao et al. (2024) and Mazoyer et al. (2020). Our results demonstrate significant improvements and could serve as a relevant baseline for future research in this area.
- Abstract(参考訳): テキストストリームにおけるイベント検出は,オンラインメディアやソーシャルネットワークの分析において重要な課題である。
この分野における現在の課題の1つは、許容される計算複雑性のレベルを維持しながら、パフォーマンス標準を確立することである。
本研究では, 文埋め込みの最近の進歩と相まって, 漸進的クラスタリングアルゴリズムを用いた。
本研究の目的は,従来の研究,特にCao et al (2024) と Mazoyer et al (2020) の成果と比較することである。
以上の結果から,本領域における今後の研究のベースラインとなる可能性が示唆された。
関連論文リスト
- Demystifying Online Clustering of Bandits: Enhanced Exploration Under Stochastic and Smoothed Adversarial Contexts [27.62165569135504]
バンディットのオンラインクラスタリングとして知られる一連の研究は、類似のユーザをクラスタにグループ化することで、コンテキストMABを拡張している。
既存のアルゴリズムは、上位信頼境界(UCB)戦略に依存しており、未知のユーザクラスタを正確に識別するために十分な統計情報を集めるのに苦労している。
クラスタ識別を高速化する探索機構を改良した,UniCLUB と PhaseUniCLUB の2つの新しいアルゴリズムを提案する。
論文 参考訳(メタデータ) (2025-01-01T16:38:29Z) - Adaptive Training Distributions with Scalable Online Bilevel
Optimization [26.029033134519604]
Webスケールコーパスで事前訓練された大規模なニューラルネットワークは、現代の機械学習の中心である。
本研究は,対象とする試験条件を反映したデータのサンプルが少なければ,事前学習分布を変更することを検討する。
本稿では、この設定をオンライン二段階最適化問題として最近定式化したアルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-11-20T18:01:29Z) - Regularization-Based Methods for Ordinal Quantification [49.606912965922504]
順序の場合、すなわち n>2 クラスの集合上で全順序が定義される場合について研究する。
本稿では,従来のアルゴリズムよりも優れた正規化OQアルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-10-13T16:04:06Z) - Topic-driven Distant Supervision Framework for Macro-level Discourse
Parsing [72.14449502499535]
テキストの内部修辞構造を解析する作業は、自然言語処理において難しい問題である。
近年のニューラルモデルの発展にもかかわらず、トレーニングのための大規模で高品質なコーパスの欠如は大きな障害となっている。
近年の研究では、遠方の監督を用いてこの制限を克服しようと試みている。
論文 参考訳(メタデータ) (2023-05-23T07:13:51Z) - Parallel Reasoning Network for Human-Object Interaction Detection [53.422076419484945]
並列推論ネットワーク(PR-Net)というトランスフォーマーに基づく新しい手法を提案する。
PR-Netは、インスタンスレベルのローカライゼーションと関係レベルの理解のための2つの独立した予測器を構築する。
我々のPR-NetはHICO-DETとV-COCOベンチマークで競合する結果を得た。
論文 参考訳(メタデータ) (2023-01-09T17:00:34Z) - Research Trends and Applications of Data Augmentation Algorithms [77.34726150561087]
我々は,データ拡張アルゴリズムの適用分野,使用するアルゴリズムの種類,重要な研究動向,時間経過に伴う研究の進展,およびデータ拡張文学における研究ギャップを同定する。
我々は、読者がデータ拡張の可能性を理解し、将来の研究方向を特定し、データ拡張研究の中で質問を開くことを期待する。
論文 参考訳(メタデータ) (2022-07-18T11:38:32Z) - A Validity Perspective on Evaluating the Justified Use of Data-driven
Decision-making Algorithms [14.96024118861361]
予測アルゴリズムの正当性を損なうような問題定式化やデータ問題における再検討問題に対して,妥当性のレンズを適用した。
これらの妥当性の考察が,予測タスクの正当性やデータの適合性に関する考察を促進・文書化することを目的とした,一連のハイレベルな質問にどのように掘り下げられるかを示す。
論文 参考訳(メタデータ) (2022-06-30T02:22:31Z) - Multitask Learning for Class-Imbalanced Discourse Classification [74.41900374452472]
マルチタスクアプローチは,現在のベンチマークで7%のマイクロf1コアを改善できることを示す。
また,NLPにおける資源不足問題に対処するための追加手法の比較検討を行った。
論文 参考訳(メタデータ) (2021-01-02T07:13:41Z) - Novel Human-Object Interaction Detection via Adversarial Domain
Generalization [103.55143362926388]
本研究では,新たな人-物間相互作用(HOI)検出の問題点を考察し,モデルの一般化能力を向上させることを目的とした。
この課題は、主に対象と述語の大きな構成空間に起因し、全ての対象と述語の組み合わせに対する十分な訓練データが欠如している。
本稿では,予測のためのオブジェクト指向不変の特徴を学習するために,対数領域の一般化の統一的な枠組みを提案する。
論文 参考訳(メタデータ) (2020-05-22T22:02:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。