論文の概要: Foresight Prediction Enhanced Live-Streaming Recommendation
- arxiv url: http://arxiv.org/abs/2512.06700v1
- Date: Sun, 07 Dec 2025 07:25:38 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-09 22:03:54.477073
- Title: Foresight Prediction Enhanced Live-Streaming Recommendation
- Title(参考訳): ライブストリーミングレコメンデーションの展望
- Authors: Jiangxia Cao, Ruochen Yang, Xiang Chen, Changxin Lao, Yueyang Liu, Yusheng Huang, Yuanhao Tian, Xiangyu Wu, Shuang Yang, Zhaojie Liu, Guorui Zhou,
- Abstract要約: コンテンツと時間のダイナミクスによるライブストリーミングは、プラットフォームのレコメンデーションアルゴリズムにより高い要求をもたらす。
我々は,ライブストリーミングセグメント上でセマンティックID(Sid)を取得し,過去のSidシーケンスを符号化して作者の特徴を捉え,Sid進化の傾向をモデル化し,将来的なコンテンツの予測を可能にする。
- 参考スコア(独自算出の注目度): 18.07489662404993
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Live-streaming, as an emerging media enabling real-time interaction between authors and users, has attracted significant attention. Unlike the stable playback time of traditional TV live or the fixed content of short video, live-streaming, due to the dynamics of content and time, poses higher requirements for the recommendation algorithm of the platform - understanding the ever-changing content in real time and push it to users at the appropriate moment. Through analysis, we find that users have a better experience and express more positive behaviors during highlight moments of the live-streaming. Furthermore, since the model lacks access to future content during recommendation, yet user engagement depends on how well subsequent content aligns with their interests, an intuitive solution is to predict future live-streaming content. Therefore, we perform semantic quantization on live-streaming segments to obtain Semantic ids (Sid), encode the historical Sid sequence to capture the author's characteristics, and model Sid evolution trend to enable foresight prediction of future content. This foresight enhances the ranking model through refined features. Extensive offline and online experiments demonstrate the effectiveness of our method.
- Abstract(参考訳): 著者とユーザのリアルタイムインタラクションを可能にする新興メディアとしてのライブストリーミングは、大きな注目を集めている。
従来のTVライブの安定した再生時間やショートビデオの固定されたコンテンツとは異なり、ライブストリーミングは、コンテンツと時間のダイナミクスのため、プラットフォームのレコメンデーションアルゴリズムに対してより高い要求を生じさせ、常に変化するコンテンツをリアルタイムで理解し、適切なタイミングでユーザにプッシュする。
分析により,ライブストリーミングのハイライト瞬間において,ユーザがより優れた経験を持ち,よりポジティブな振る舞いを表現できることが判明した。
さらに、モデルにはレコメンデーション中の将来のコンテンツへのアクセスが欠けているが、ユーザのエンゲージメントは、その後のコンテンツと関心がどの程度一致しているかに依存しているため、直感的な解決策は、将来のライブストリーミングコンテンツを予測することである。
そこで我々は,ライブストリーミングセグメント上で意味的量子化を行い,セマンティックID(Sid)を取得し,過去のSidシーケンスをエンコードして作者の特徴を捉え,Sidの進化傾向をモデル化し,将来的なコンテンツの予測を可能にする。
この展望により、洗練された特徴によってランキングモデルが強化される。
大規模なオフラインおよびオンライン実験により,本手法の有効性が示された。
関連論文リスト
- Harnessing Synthetic Preference Data for Enhancing Temporal Understanding of Video-LLMs [54.502280390499756]
我々はTimeWarpを提案し、モデルからの応答を微調整し、与えられた入力ビデオにフォーカスするよう促すために、ターゲットとなる合成時間データセットを作成する。
提案手法を既存モデルに適用すると,時間的理解ベンチマークの性能が大幅に向上することが実証された。
論文 参考訳(メタデータ) (2025-10-04T21:48:40Z) - Leveraging Scene Context with Dual Networks for Sequential User Behavior Modeling [58.72480539725212]
本稿では,シーンとアイテム間の動的興味や相互作用を捉えるために,新しいDSPネットワークを提案する。
DSPnetは、アイテムやシーンに対するユーザの動的関心を学習するための2つの並列ネットワークと、将来の振る舞いを予測するためのインタープレイをキャプチャするシーケンス機能拡張モジュールで構成されている。
論文 参考訳(メタデータ) (2025-09-30T12:26:57Z) - StreamAgent: Towards Anticipatory Agents for Streaming Video Understanding [52.55809460075286]
本稿では,今後のタスク関連情報を含むと思われる時間間隔と空間領域を予測できるStreamAgentを提案する。
我々は,重要な出来事の時間的進行を予測するために,予測エージェントに期待を促すことによって,質問の意味論と歴史的観察を統合する。
提案手法は,応答精度とリアルタイム効率において既存の手法よりも優れており,実世界のストリーミングシナリオの実用的価値を強調している。
論文 参考訳(メタデータ) (2025-08-03T18:15:42Z) - LLM-Alignment Live-Streaming Recommendation [20.817796284487468]
統合されたショートビデオとライブストリーミングプラットフォームは、ダイナミックなコンテンツ作成と消費を提供し、世界中で広く採用されている。
同じライブストリーミングも、ユーザーの視聴時間によって大きく異なる。
レコメンデーションを最適化するには、RecSysはライブコンテンツのリアルタイムセマンティクスを正確に解釈し、ユーザの好みに合わせる必要がある。
論文 参考訳(メタデータ) (2025-04-07T16:04:00Z) - Object-Centric Temporal Consistency via Conditional Autoregressive Inductive Biases [69.46487306858789]
Conditional Autoregressive Slot Attention (CA-SA) は、ビデオ中心の視覚タスクにおいて抽出されたオブジェクト中心の表現の時間的一貫性を高めるフレームワークである。
本稿では,提案手法が下流タスクのベースラインよりも優れていることを示す定性的,定量的な結果を示す。
論文 参考訳(メタデータ) (2024-10-21T07:44:44Z) - Flash-VStream: Memory-Based Real-Time Understanding for Long Video Streams [78.72965584414368]
人間の記憶機構をシミュレートしたビデオ言語モデルFlash-VStreamを提案する。
既存のモデルと比較して、Flash-VStreamは遅延推論とVRAM消費の大幅な削減を実現している。
本稿では,オンライン動画ストリーミング理解に特化して設計された質問応答ベンチマークであるVStream-QAを提案する。
論文 参考訳(メタデータ) (2024-06-12T11:07:55Z) - Look into the Future: Deep Contextualized Sequential Recommendation [28.726897673576865]
我々は、Look into the Future(LIFT)と呼ばれる、シーケンシャルなレコメンデーションの新しいフレームワークを提案する。
LIFTはシーケンシャルなレコメンデーションのコンテキストを構築し、活用する。
本実験では,クリックスルー率予測および評価予測タスクにおいて,LIFTは大幅な性能向上を実現している。
論文 参考訳(メタデータ) (2024-05-23T09:34:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。