論文の概要: SSRLive: Live Streaming Recommendation with Dynamic Semantic ID
- arxiv url: http://arxiv.org/abs/2606.06970v1
- Date: Fri, 05 Jun 2026 06:58:07 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-08 14:33:29.603353
- Title: SSRLive: Live Streaming Recommendation with Dynamic Semantic ID
- Title(参考訳): SSRLive:動的セマンティックIDによるライブストリーミング推奨
- Authors: Teng Shi, Zhaoheng Li, Yuanhang Qu, Yi Liu, Lixiang Lai, Yuning Jiang,
- Abstract要約: 本稿では,SSRLive: Dynamic Semantic ID-guided Streaming Recommendation for Live platformを紹介する。
提案するフレームワークは、生成モジュールと識別モジュールを統一アーキテクチャに統合する。
識別コンポーネントは、SIDとユーザ特徴を組み合わせることでタスク固有の表現を洗練し、ユーザとストリームのインタラクションデータを強化し、マルチタスク予測を実行する。
- 参考スコア(独自算出の注目度): 8.32878203748523
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Live streaming has emerged as one of the fastest-growing forms of online media, enabling instant content broadcasting and real-time engagement between users and streamers. Despite the effectiveness of existing recommendation algorithms in this domain, they often suffer from limited utilization of computational resources, with low FLOPs that hinder further performance enhancement. Generative recommendation techniques, which have gained traction in various industrial tasks, offer a promising avenue for improving live streaming recommendations. However, directly applying generative methods to live streaming is non-trivial due to two major challenges: (1) static semantic IDs (SIDs) cannot reflect the rapidly changing nature of live room content; and (2) generative pipelines generally do not incorporate user--streamer interaction signals (e.g., likes, orders), which are critical for modeling user intent toward both the streamer and showcased products. To address these challenges, we introduce SSRLive: Dynamic Semantic ID-guided Streaming Recommendation for Live platforms. The proposed framework integrates a generative module and a discriminative module in a unified architecture. The generative component employs an encoder-decoder design to produce both static and dynamic SIDs, enabling timely representation of live room content while leveraging multimodal information. The discriminative component refines task-specific representations by combining SIDs with user features, augments them with user-streamer interaction data, and performs multi-task predictions. Online A/B tests in real-world deployment demonstrate tangible benefits: watch time (+3.38%), GMV (+0.72%), follower growth (+3.12%), and interaction volume (+2.92%). These improvements highlight the effectiveness and business value of SSRLive, which is now fully deployed, serving hundreds of millions of active users.
- Abstract(参考訳): ライブストリーミングは、急速に成長しているオンラインメディアの1つであり、即時コンテンツブロードキャストと、ユーザーとストリーマー間のリアルタイムエンゲージメントを可能にしている。
この領域における既存のレコメンデーションアルゴリズムの有効性にもかかわらず、しばしば計算資源の限られた利用に悩まされ、FLOPが低く、さらなる性能向上を妨げている。
様々な産業タスクで注目を集めてきたジェネレーティブレコメンデーション技術は、ライブストリーミングレコメンデーションを改善するための有望な道を提供する。
しかし,1) 静的なセマンティックID (SID) は,ライブルームの内容の急速に変化する性質を反映することができず,(2) 生成パイプラインは一般に,ストリーマーと展示された製品の両方に対してユーザ意図をモデル化する上で重要な,ユーザ-ストリームのインタラクション信号 (例えば,注文) を組み込まない。
これらの課題に対処するために、SSRLive: Dynamic Semantic ID-guided Streaming Recommendation for Live platformを紹介します。
提案するフレームワークは、生成モジュールと識別モジュールを統一アーキテクチャに統合する。
生成コンポーネントは、エンコーダデコーダ設計を用いて、静的および動的SIDの両方を生成し、マルチモーダル情報を活用しながら、ライブルーム内容のタイムリーな表現を可能にする。
識別コンポーネントは、SIDとユーザ特徴を組み合わせることでタスク固有の表現を洗練し、ユーザとストリームのインタラクションデータを強化し、マルチタスク予測を実行する。
実世界の展開におけるオンラインA/Bテストは、ウォッチタイム(+3.38%)、GMV(+0.72%)、フォロワー成長(+3.12%)、インタラクションボリューム(+2.92%)など、明確なメリットを示している。
これらの改善はSSRLiveの有効性とビジネス価値を強調している。
関連論文リスト
- Bridging Short Videos and Live Streams: Reasoning-Guided Multimodal LLMs for Cross-Domain Representation Learning [38.08336224801579]
Reasoning-Guided Cross-Domain Representation Learning (RGCD-Rep)
RGCD-Repは、短いビデオからライブストリームへのクロスドメインレコメンデーションのための推論誘導フレームワークである。
完全にデプロイされ、毎日4億人のユーザーが利用している。
論文 参考訳(メタデータ) (2026-06-03T04:49:01Z) - Advancing Narrative Long Video Generation via Training-Free Identity-Aware Memory [79.01059178883817]
IAMFlowはトレーニング不要のID対応メモリフレームワークで、永続的なエンティティのIDを明示的にモデル化し追跡する。
VLMは、レンダリングフレームから属性を非同期に検証し、洗練し、暗黙の類似性ベースのマッチングの代わりに明示的なエンティティ追跡を可能にする。
NarraStream-Benchは,6次元にまたがる324のマルチプロンプトスクリプトを備えた,ナラストリームビデオ生成のためのベンチマークである。
論文 参考訳(メタデータ) (2026-05-18T17:54:34Z) - Action-Aware Generative Sequence Modeling for Short Video Recommendation [50.74467504063892]
ショートビデオには様々な部分が含まれており、ユーザーはそれらすべてに対して同じ態度を取ることはできない。
従来のバイナリ分類レコメンデーションモデルは、ビデオを単一の全体的エンティティとして扱うが、そのような微妙な好みを正確に捉えるには限界に直面している。
本稿では,時間的次元に沿ってユーザアクションを洗練させる行動認識生成系列ネットワーク(A2Gen)を提案する。
論文 参考訳(メタデータ) (2026-04-28T16:41:04Z) - OneLive: Dynamically Unified Generative Framework for Live-Streaming Recommendation [49.95897358060393]
ライブストリーミングに適した動的に統一された生成レコメンデーションフレームワークであるOneLiveを提案する。
OneLiveは4つの重要なコンポーネントを統合している: (i) (i) (i) (i) (i) (ii) (II) 時間的決定のための時間的ダイナミクスを明示的にモデル化するタイムアウェア・ゲーテッド・アテンション機構; (iii) シーケンシャル MTP と QK Norm で強化された効率的なデコーダのみ生成アーキテクチャ。
論文 参考訳(メタデータ) (2026-02-09T12:56:39Z) - Efficient Multimodal Streaming Recommendation via Expandable Side Mixture-of-Experts [38.55001831149498]
マルチモーダルストリーミングレコメンダシステムは、ユーザの関心が時間とともに変化する現実世界のアプリケーションに広くデプロイされている。
マルチモーダルストリーミングレコメンデーションのためのメモリ効率の高いフレームワークであるXSMoE(Expandable Side Mixture-of-Experts)を提案する。
XSMoEは、凍結したトレーニング済みエンコーダに軽量なサイドチューニングモジュールをアタッチし、ユーザのフィードバックの進化に応じて徐々に拡張する。
論文 参考訳(メタデータ) (2025-08-08T04:00:05Z) - Iris: Breaking GUI Complexity with Adaptive Focus and Self-Refining [67.87810796668981]
インフォメーション・インフォメーション・インフォメーション・クロッピング(ISC)と自己精製デュアルラーニング(SRDL)
Irisは850KのGUIアノテーションだけで、複数のベンチマークで最先端のパフォーマンスを実現している。
これらの改善は、WebとOSエージェントの両方の下流タスクで大幅に向上した。
論文 参考訳(メタデータ) (2024-12-13T18:40:10Z) - Two-stream Multi-level Dynamic Point Transformer for Two-person Interaction Recognition [45.0131792009999]
本稿では,2人インタラクション認識のための2ストリームマルチレベル動的ポイント変換器を提案する。
本モデルでは,局所空間情報,外観情報,動作情報を組み込むことで,対人インタラクションを認識するという課題に対処する。
我々のネットワークは、ほとんどの標準的な評価設定において最先端のアプローチよりも優れています。
論文 参考訳(メタデータ) (2023-07-22T03:51:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。