論文の概要: Early Multimodal Prediction of Cross-Lingual Meme Virality on Reddit: A Time-Window Analysis
- arxiv url: http://arxiv.org/abs/2510.05761v1
- Date: Tue, 07 Oct 2025 10:27:36 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-08 17:57:08.203237
- Title: Early Multimodal Prediction of Cross-Lingual Meme Virality on Reddit: A Time-Window Analysis
- Title(参考訳): Redditにおけるクロスリンガルミームの早期マルチモーダル予測:タイムウィンドウ解析
- Authors: Sedat Dogan, Nina Dethlefs, Debarati Chakraborty,
- Abstract要約: 本研究では,25のRedditコミュニティの大規模言語間データセットを用いて,ミームウイルスの早期予測の可能性について検討した。
本稿では,ハイブリッドエンゲージメントスコアに基づいてバイラル性を定義するための,ロバストでデータ駆動型の手法を提案する。
私たちの最高のパフォーマンスモデルであるXGBoostは、PR-AUC $> 0.52を30分で達成しています。
- 参考スコア(独自算出の注目度): 0.29949629644252374
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Predicting the virality of online content remains challenging, especially for culturally complex, fast-evolving memes. This study investigates the feasibility of early prediction of meme virality using a large-scale, cross-lingual dataset from 25 diverse Reddit communities. We propose a robust, data-driven method to define virality based on a hybrid engagement score, learning a percentile-based threshold from a chronologically held-out training set to prevent data leakage. We evaluated a suite of models, including Logistic Regression, XGBoost, and a Multi-layer Perceptron (MLP), with a comprehensive, multimodal feature set across increasing time windows (30-420 min). Crucially, useful signals emerge quickly: our best-performing model, XGBoost, achieves a PR-AUC $>$ 0.52 in just 30 minutes. Our analysis reveals a clear "evidentiary transition," in which the importance of the feature dynamically shifts from the static context to the temporal dynamics as a meme gains traction. This work establishes a robust, interpretable, and practical benchmark for early virality prediction in scenarios where full diffusion cascade data is unavailable, contributing a novel cross-lingual dataset and a methodologically sound definition of virality. To our knowledge, this study is the first to combine time series data with static content and network features to predict early meme virality.
- Abstract(参考訳): オンラインコンテンツのバイラル性を予測することは、特に文化的に複雑で、急速に進化するミームにとって、依然として困難である。
本研究では,25のRedditコミュニティの大規模・多言語データセットを用いて,ミームウイルスの早期予測の可能性について検討した。
本研究では,ハイブリッドエンゲージメントスコアに基づいてバイラル性を定義するためのロバストなデータ駆動手法を提案し,時系列的に保持されたトレーニングセットからパーセンタイルベースの閾値を学習し,データ漏洩を防止する。
我々は、ロジスティック回帰、XGBoost、マルチレイヤパーセプトロン(MLP)を含む一連のモデルを評価し、時間ウインドウ(30-420分)にまたがる包括的でマルチモーダルな機能について検討した。
私たちの最高のパフォーマンスモデルであるXGBoostは、わずか30分でPR-AUC$0.52ドルに達します。
解析の結果,特徴の重要性は静的な文脈から時間的ダイナミックスへと動的に変化し,ミームが勢いを増すと考えられることが明らかとなった。
この研究は、完全な拡散カスケードデータが利用できないシナリオにおいて、早期バイラル性予測のための堅牢で解釈可能な実用的なベンチマークを確立し、新しいクロスランガルデータセットと方法論的にバイラル性の定義に寄与する。
我々の知る限り、この研究は、時系列データと静的コンテンツとネットワーク機能を組み合わせて、初期のミームのバイラル性を予測する最初のものである。
関連論文リスト
- When Does Multimodality Lead to Better Time Series Forecasting? [96.26052272121615]
このようなマルチモーダルな統合が常に利益をもたらすかどうか、どのような条件で検討する。
その結果,マルチモーダリティの利点は条件に依存していることが判明した。
我々の研究は、マルチモーダリティが予測タスクに役立つことをいつ予測できるかを理解するための厳密で定量的な基礎を提供する。
論文 参考訳(メタデータ) (2025-06-20T23:55:56Z) - Tackling Data Heterogeneity in Federated Time Series Forecasting [61.021413959988216]
時系列予測は、エネルギー消費予測、病気の伝染モニタリング、天気予報など、様々な実世界の応用において重要な役割を果たす。
既存のほとんどのメソッドは、分散デバイスから中央クラウドサーバに大量のデータを収集する、集中的なトレーニングパラダイムに依存しています。
本稿では,情報合成データを補助的知識キャリアとして生成することにより,データの均一性に対処する新しいフレームワークであるFed-TRENDを提案する。
論文 参考訳(メタデータ) (2024-11-24T04:56:45Z) - Towards Generalisable Time Series Understanding Across Domains [10.350643783811174]
時系列の不均一性を扱うために特別に設計された新しい事前学習パラダイムを導入する。
本稿では、学習可能なドメインシグネチャ、二重マスキング戦略、正規化相互相関損失を持つトークンサを提案する。
私たちのコードと事前訓練されたウェイトはhttps://www.oetu.com/oetu/otis.comで公開されています。
論文 参考訳(メタデータ) (2024-10-09T17:09:30Z) - Scalable Spatiotemporal Prediction with Bayesian Neural Fields [3.3299088915999295]
BayesNFは、階層的ベイズ推定と高容量推定のためのディープニューラルネットワークアーキテクチャを統合し、堅牢な予測の不確実性を実現する。
BayesNFは、数万の計測値を含む気候および公衆衛生データから予測問題を改善する。
論文 参考訳(メタデータ) (2024-03-12T13:47:50Z) - Time Series Contrastive Learning with Information-Aware Augmentations [57.45139904366001]
コントラスト学習の鍵となる要素は、いくつかの先行を示唆する適切な拡張を選択して、実現可能な正のサンプルを構築することである。
対照的な学習タスクやデータセットに意味のある時系列データの増大をどうやって見つけるかは、未解決の問題である。
本稿では,時系列表現学習のための最適な拡張を適応的に選択する情報認識拡張を用いた新しいコントラスト学習手法であるInfoTSを提案する。
論文 参考訳(メタデータ) (2023-03-21T15:02:50Z) - Towards an Automatic Analysis of CHO-K1 Suspension Growth in
Microfluidic Single-cell Cultivation [63.94623495501023]
我々は、人間の力で抽象化されたニューラルネットワークをデータレベルで注入できる新しい機械学習アーキテクチャを提案する。
具体的には、自然データと合成データに基づいて生成モデルを同時に訓練し、細胞数などの対象変数を確実に推定できる共有表現を学習する。
論文 参考訳(メタデータ) (2020-10-20T08:36:51Z) - Predicting Temporal Sets with Deep Neural Networks [50.53727580527024]
本稿では,時間集合予測のためのディープニューラルネットワークに基づく統合解を提案する。
ユニークな視点は、セットレベルの共起グラフを構築することで要素関係を学ぶことである。
我々は,要素や集合の時間依存性を適応的に学習するアテンションベースのモジュールを設計する。
論文 参考訳(メタデータ) (2020-06-20T03:29:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。