論文の概要: OmniTrend: Content-Context Modeling for Scalable Social Popularity Prediction
- arxiv url: http://arxiv.org/abs/2604.26252v1
- Date: Wed, 29 Apr 2026 03:14:42 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-30 15:59:36.237893
- Title: OmniTrend: Content-Context Modeling for Scalable Social Popularity Prediction
- Title(参考訳): OmniTrend: スケーラブルなソーシャル人気予測のためのコンテンツコンテキストモデリング
- Authors: Liliang Ye, Guiyi Zeng, Yunyao Zhang, Yi-Ping Phoebe Chen, Junqing Yu, Zikai Song,
- Abstract要約: 既存の方法はコンテンツ信号にフォーカスするが、露出関連パターンとは分離しない。
OmniTrendは、人気度をコンテンツ魅力とコンテキスト露出の連成結果としてモデル化する統合フレームワークである。
- 参考スコア(独自算出の注目度): 20.31167409742074
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Predicting social media popularity requires understanding both the intrinsic appeal of content and the external context that determines how it is exposed to users. Existing methods focus on content signals but do not separate them from exposure-related patterns, which causes the learned representations to absorb platform-specific visibility effects and weakens both interpretability and cross-platform transfer. This paper introduces OmniTrend, a unified framework that models popularity as the joint outcome of content attractiveness and contextual exposure. The content module learns cross-modal representations from visual, audio, and textual cues to quantify intrinsic appeal, while the context module estimates exposure from exogenous signals such as posting time, author activity, topical trends, and retrieval-based neighborhood statistics. OmniTrend learns separate predictors for content attractiveness and contextual exposure and integrates them in the final popularity estimate, which makes the role of each factor explicit and supports robust transfer across image and video platforms.
- Abstract(参考訳): ソーシャルメディアの人気を予測するには、コンテンツの本質的な魅力と、ユーザへの露出方法を決定する外部コンテキストの両方を理解する必要がある。
既存の方法はコンテンツ信号に焦点をあてるが、露光関連パターンとは区別しないため、学習された表現はプラットフォーム固有の可視性効果を吸収し、解釈可能性とクロスプラットフォーム転送の両方を弱める。
OmniTrendは、人気度をコンテンツ魅力とコンテキスト露出の連成結果としてモデル化する統合フレームワークである。
コンテンツモジュールは、視覚、音声、テキストからのクロスモーダル表現を学習し、本質的な魅力を定量化し、コンテキストモジュールは、投稿時間、著者活動、話題傾向、検索に基づく地域統計などの外因性信号から露出を推定する。
OmniTrendは、コンテンツ魅力とコンテキスト露出の予測を別々に学び、最終的な人気予測にそれらを統合することで、各ファクタの役割を明確にし、画像とビデオプラットフォーム間のロバストな転送をサポートする。
関連論文リスト
- Explaining multimodal LLMs via intra-modal token interactions [55.27436637894534]
MLLM(Multimodal Large Language Models)は、様々な視覚言語タスクにおいて顕著な成功を収めているが、その内部決定機構は十分に理解されていない。
モーダル内相互作用を利用した解釈可能性の向上を提案する。
論文 参考訳(メタデータ) (2025-09-26T14:39:13Z) - Mind-the-Glitch: Visual Correspondence for Detecting Inconsistencies in Subject-Driven Generation [120.23172120151821]
本稿では,事前学習した拡散モデルのバックボーンから視覚的特徴と意味的特徴を分離するための新しいアプローチを提案する。
注釈付きセマンティックと視覚対応を備えた画像ペアを構築する自動パイプラインを導入する。
被験者駆動画像生成における視覚的不整合を定量化する新しい指標であるビジュアルセマンティックマッチングを提案する。
論文 参考訳(メタデータ) (2025-09-26T07:11:55Z) - Implicit Counterfactual Learning for Audio-Visual Segmentation [50.69377287012591]
我々は,非バイアスの相互理解を実現するために,暗黙の対実的枠組み(ICF)を提案する。
意味論の欠如により、異種表現は誤った一致につながる可能性がある。
モダリティ共有空間を確立するために,ビデオ,セグメント,フレームレベルを含む多粒性暗黙テキスト(MIT)をブリッジとして導入する。
論文 参考訳(メタデータ) (2025-07-28T11:46:35Z) - Modeling Story Expectations to Understand Engagement: A Generative Framework Using LLMs [3.1767625261233037]
本稿では,ストーリーがどのように展開されるかという聴衆の考え方をモデル化するための新しい枠組みを紹介する。
提案手法は,各ストーリーの複数の潜在的継続を生成し,期待,不確実性,驚きに関連する特徴を抽出する。
その結果、読み、コメント、投票のためのエンゲージメントの異なるタイプは、現在のコンテンツ機能と期待されるコンテンツの異なる組み合わせによって引き起こされることが明らかとなった。
論文 参考訳(メタデータ) (2024-12-13T04:53:34Z) - Knowledge-Enhanced Hierarchical Information Correlation Learning for
Multi-Modal Rumor Detection [82.94413676131545]
マルチモーダルなうわさ検出のための知識強化型階層型情報相関学習手法(KhiCL)を提案する。
KhiCLは異質な一様性特徴を共通特徴空間に伝達するために、クロスモーダルな関節辞書を利用する。
画像やテキストから視覚的およびテキスト的実体を抽出し、知識関連推論戦略を設計する。
論文 参考訳(メタデータ) (2023-06-28T06:08:20Z) - Semantic Role Aware Correlation Transformer for Text to Video Retrieval [23.183653281610866]
本稿では,テキストや動画をオブジェクト,空間的コンテキスト,時間的コンテキストのセマンティックな役割へと明示的に切り離す新しいトランスフォーマーを提案する。
一般的なYouCook2の予備的な結果は、我々のアプローチが現在の最先端の手法を超越していることを示している。
論文 参考訳(メタデータ) (2022-06-26T11:28:03Z) - Visual Persuasion in COVID-19 Social Media Content: A Multi-Modal
Characterization [30.710295617831015]
本研究では,マルチモーダルコンテンツにおける説得情報の結果を分析するための計算手法を提案する。
Twitterでシェアされた新型コロナウイルス関連のニュース記事において、人気と信頼性の2つの側面に焦点を当てている。
論文 参考訳(メタデータ) (2021-12-05T02:15:01Z) - Disentangled Speech Embeddings using Cross-modal Self-supervision [119.94362407747437]
本研究では,映像における顔と音声の自然な相互同期を生かした自己教師型学習目標を提案する。
我々は,(1)両表現に共通する低レベルの特徴を共有する2ストリームアーキテクチャを構築し,(2)これらの要因を明示的に解消する自然なメカニズムを提供する。
論文 参考訳(メタデータ) (2020-02-20T14:13:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。