論文の概要: Online Density-Based Clustering for Real-Time Narrative Evolution Monitorin
- arxiv url: http://arxiv.org/abs/2601.20680v1
- Date: Wed, 28 Jan 2026 15:07:30 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-29 15:46:06.989435
- Title: Online Density-Based Clustering for Real-Time Narrative Evolution Monitorin
- Title(参考訳): リアルタイム・ナラティブ・エボリューション・モニターのためのオンライン密度クラスタリング
- Authors: Ostap Vykhopen, Viktoria Skorik, Maxim Tereschenko, Veronika Solopova,
- Abstract要約: 本研究では,HDBSCANをオンラインクラスタリング手法(ストリーミング/インクリメンタル)に置き換えることを検討した。
本研究は,バッチ指向トピックモデリングフレームワークとソーシャルメディアモニタリングのストリーミング特性の間に重要なギャップについて論じる。
- 参考スコア(独自算出の注目度): 2.607403443115235
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Automated narrative intelligence systems for social media monitoring face significant scalability challenges when processing continuous data streams using traditional batch clustering algorithms. We investigate the replacement of HDBSCAN (offline clustering) with online (streaming/incremental) clustering methods in a production narrative report generation pipeline. The proposed system employs a three-stage architecture (data collection, modeling, dashboard generation) that processes thousands of multilingual social media documents daily. While HDBSCAN excels at discovering hierarchical density-based clusters and handling noise, its batch-only nature necessitates complete retraining for each time window, resulting in memory constraints, computational inefficiency, and inability to adapt to evolving narratives in real-time. This work evaluates a bunch of online clustering algorithms across dimensions of cluster quality preservation, computational efficiency, memory footprint, and integration compatibility with existing workflows. We propose evaluation criteria that balance traditional clustering metrics (Silhouette Coefficient, Davies-Bouldin Index) with narrative metrics (narrative distinctness, contingency and variance). Our methodology includes sliding-window simulations on historical datasets from Ukraine information space, enabling comparative analysis of algorithmic trade-offs in realistic operational contexts. This research addresses a critical gap between batch-oriented topic modeling frameworks and the streaming nature of social media monitoring, with implications for computational social science, crisis informatics, and narrative surveillance systems.
- Abstract(参考訳): ソーシャルメディア監視のための物語自動インテリジェンスシステムは、従来のバッチクラスタリングアルゴリズムを使用して連続データストリームを処理する場合、大きなスケーラビリティ上の課題に直面します。
本研究では,HDBSCAN(オフラインクラスタリング)をオンラインクラスタリング手法(ストリーミング/インクリメンタル)に置き換えることを検討した。
提案システムでは3段階アーキテクチャ(データ収集,モデリング,ダッシュボード生成)を用いて,毎日数千の多言語ソーシャルメディアドキュメントを処理する。
HDBSCANは階層的な密度ベースのクラスタの発見とノイズの処理に優れていますが、バッチのみの性質は、時間ウィンドウ毎に完全な再トレーニングを必要とします。
この研究は、クラスタ品質の保存、計算効率、メモリフットプリント、既存のワークフローとの統合性など、さまざまな次元にわたるオンラインクラスタリングアルゴリズムを評価します。
本研究では,従来のクラスタリング指標(シルエット係数,デイビーズ・ボルディン指数)と物語的指標(物語的相違,並行性,分散)のバランスをとるための評価基準を提案する。
提案手法は,ウクライナ情報空間からの歴史的データセットのスライディングウインドウシミュレーションを含み,現実的な運用状況下でのアルゴリズムトレードオフの比較分析を可能にする。
本研究は, バッチ指向トピックモデリングフレームワークとソーシャルメディア監視のストリーミング特性の間に, 計算社会科学, 危機情報学, 物語監視システムに影響を及ぼす重要なギャップについて論じる。
関連論文リスト
- Harnessing Data from Clustered LQR Systems: Personalized and Collaborative Policy Optimization [4.770545528276722]
我々は、パーソナライズされたポリシーを学ぶために、クラスタリングがデータ駆動制御にどのように使われるかを示す。
私たちの仕事は、パーソナライズされたポリシーを学ぶために、データ駆動制御でクラスタリングをどのように使用できるかを明らかにする最初のものです。
論文 参考訳(メタデータ) (2025-11-21T18:45:53Z) - Federated Granger Causality Learning for Interdependent Clients with State Space Representation [0.6499759302108926]
我々は、グランガー因果関係を学習するための連合的なアプローチを開発する。
本稿では,サーバが学習したGranger因果関係情報を用いてクライアントモデルを拡張することを提案する。
また、フレームワークの集中的なオラクルモデルへの収束について研究する。
論文 参考訳(メタデータ) (2025-01-23T18:04:21Z) - Resilience to the Flowing Unknown: an Open Set Recognition Framework for Data Streams [6.7236795813629]
本研究では、分類とクラスタリングを組み合わせて、ストリーミングシナリオにおけるテキストオーバ占有空間問題に対処するオープンセット認識フレームワークの適用について検討する。
論文 参考訳(メタデータ) (2024-10-31T11:06:54Z) - Contrastive Continual Multi-view Clustering with Filtered Structural
Fusion [57.193645780552565]
ビューが事前に収集されるアプリケーションでは、マルチビュークラスタリングが成功します。
データビューがシーケンシャルに収集されるシナリオ、すなわちリアルタイムデータを見落としている。
いくつかの方法が提案されているが、安定塑性ジレンマに閉じ込められている。
フィルタ構造融合を用いたコントラスト連続多視点クラスタリングを提案する。
論文 参考訳(メタデータ) (2023-09-26T14:18:29Z) - Deep Temporal Graph Clustering [77.02070768950145]
深部時間グラフクラスタリング(GC)のための汎用フレームワークを提案する。
GCは、時間グラフの相互作用シーケンスに基づくバッチ処理パターンに適合するディープクラスタリング技術を導入している。
我々のフレームワークは、既存の時間グラフ学習手法の性能を効果的に向上させることができる。
論文 参考訳(メタデータ) (2023-05-18T06:17:50Z) - Detection and Evaluation of Clusters within Sequential Data [58.720142291102135]
Block Markov Chainsのクラスタリングアルゴリズムは理論的最適性を保証する。
特に、私たちのシーケンシャルデータは、ヒトのDNA、テキスト、動物運動データ、金融市場から派生しています。
ブロックマルコフ連鎖モデルの仮定は、実際に探索データ解析において有意義な洞察を得られることが判明した。
論文 参考訳(メタデータ) (2022-10-04T15:22:39Z) - Learning from Heterogeneous Data Based on Social Interactions over
Graphs [58.34060409467834]
本研究では,個別のエージェントが異なる次元のストリーミング特徴を観察しながら分類問題の解決を目指す分散アーキテクチャを提案する。
私たちはそれを示します。
戦略により、エージェントはこの高度に異質な環境下で一貫して学習することができる。
私たちはそれを示します。
戦略により、エージェントはこの高度に異質な環境下で一貫して学習することができる。
論文 参考訳(メタデータ) (2021-12-17T12:47:18Z) - Scaling-up Distributed Processing of Data Streams for Machine Learning [10.581140430698103]
本稿では,計算・帯域幅制限方式における大規模分散最適化に着目した手法を最近開発した。
i)分散凸問題、(ii)分散主成分分析、(ii)グローバル収束を許容する幾何学的構造に関する非問題である。
論文 参考訳(メタデータ) (2020-05-18T16:28:54Z) - ClusterVO: Clustering Moving Instances and Estimating Visual Odometry
for Self and Surroundings [54.33327082243022]
ClusterVOはステレオビジュアルオドメトリーで、エゴと周囲の固いクラスタ/オブジェクトの両方の動きを同時にクラスタし、推定する。
以前のソリューションでは、バッチ入力やシーン構造や動的オブジェクトモデルへの事前の指示に頼っていたが、ClusterVOは一般的にオンラインであり、屋内のシーン理解や自律運転など、さまざまなシナリオで使用することができる。
論文 参考訳(メタデータ) (2020-03-29T09:06:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。