論文の概要: Action-Aware Generative Sequence Modeling for Short Video Recommendation
- arxiv url: http://arxiv.org/abs/2604.25834v1
- Date: Tue, 28 Apr 2026 16:41:04 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-29 16:49:17.953173
- Title: Action-Aware Generative Sequence Modeling for Short Video Recommendation
- Title(参考訳): ショートビデオレコメンデーションのための行動認識生成シーケンスモデリング
- Authors: Wenhao Li, Zihan Lin, Zhengxiao Guo, Jie Zhou, Shukai Liu, Yongqi Liu, Chuan Luo, Chaoyi Ma, Ruiming Tang, Han Li,
- Abstract要約: ショートビデオには様々な部分が含まれており、ユーザーはそれらすべてに対して同じ態度を取ることはできない。
従来のバイナリ分類レコメンデーションモデルは、ビデオを単一の全体的エンティティとして扱うが、そのような微妙な好みを正確に捉えるには限界に直面している。
本稿では,時間的次元に沿ってユーザアクションを洗練させる行動認識生成系列ネットワーク(A2Gen)を提案する。
- 参考スコア(独自算出の注目度): 50.74467504063892
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: With the rapid development of the Internet, users have increasingly higher expectations for the recommendation accuracy of online content consumption platforms. However, short videos often contain diverse segments, and users may not hold the same attitude toward all of them. Traditional binary-classification recommendation models, which treat a video as a single holistic entity, face limitations in accurately capturing such nuanced preferences. Considering that user consumption is a temporal process, this paper demonstrates that the timing of user actions can represent diverse intentions through statistical analysis and examination of action patterns. Based on this insight, we propose a novel modeling paradigm: Action-Aware Generative Sequence Network (A2Gen), which refines user actions along the temporal dimension and chains them into sequences for unified processing and prediction. First, we introduce the Context-aware Attention Module (CAM) to model action sequences enriched with item-specific contextual features. Building upon this, we develop the Hierarchical Sequence Encoder (HSE) to learn temporal action patterns from users' historical actions. Finally, through leveraging CAM, we design a module for action sequence generation: the Action-seq Autoregressive Generator (AAG). Extensive offline experiments on the Kuaishou's dataset and the Tmall public dataset demonstrate the superiority of our proposed model. Furthermore, through large-scale online A/B testing deployed on Kuaishou's platform, our model achieves significant improvements over baseline methods in multi-task prediction by leveraging sequential information. Specifically, it yields increases of 0.34% in user watch time, 8.1% in interaction rate, and 0.162% in overall user retention (LifeTime-7), leading to successful deployment across all traffic, serving over 400 million users every day.
- Abstract(参考訳): インターネットの急速な発展に伴い、ユーザーはオンラインコンテンツ消費プラットフォームの推奨精度に対する期待がますます高まっている。
しかし、短いビデオには様々な部分が含まれており、ユーザーはそれらすべてに対して同じ態度を取ることはないかもしれない。
従来のバイナリ分類レコメンデーションモデルは、ビデオを単一の全体的エンティティとして扱うが、そのような微妙な好みを正確に捉えるには限界に直面している。
ユーザの消費が時間的プロセスであることを考えると,ユーザの行動のタイミングは,統計的分析や行動パターンの検証を通じて,多様な意図を表わすことができることを示す。
そこで本研究では,時間的次元に沿ってユーザアクションを洗練し,それらを一貫した処理と予測のためにシーケンスにチェーンする行動認識生成シーケンスネットワーク(A2Gen)を提案する。
まず、アイテム固有のコンテキスト特徴に富んだアクションシーケンスをモデル化するために、Context-aware Attention Module (CAM)を導入する。
そこで我々は階層型シーケンスエンコーダ(HSE)を開発し,ユーザの過去の行動から時間的行動パターンを学習する。
最後に、CAMを活用することで、アクションシーケンス生成のためのモジュール、Action-seq Autoregressive Generator (AAG)を設計する。
KuaishouのデータセットとTmallのパブリックデータセットに関する大規模なオフライン実験は、提案したモデルの優位性を実証している。
さらに,Kuaishouのプラットフォーム上での大規模オンラインA/Bテストにより,逐次情報を活用することで,マルチタスク予測におけるベースライン手法に対する大幅な改善を実現した。
具体的には、ユーザウォッチタイムの0.34%、インタラクションレートの8.1%、全体のユーザ保持率(LifeTime-7)の0.162%が増加し、全トラフィックにわたってデプロイが成功し、毎日4億人以上のユーザが利用している。
関連論文リスト
- CTR Prediction on Alibaba's Taobao Advertising Dataset Using Traditional and Deep Learning Models [14.51041016589099]
Alibabaがリリースした大規模なTaobaoデータセットを使用して、クリックスルー率をより効果的にモデル化する方法を検討する。
ユーザの意図をモデル化するために、22日間にわたって、数億のインタラクションからの行動データを組み合わせました。
弊社の研究は、クリックスルー率の予測を推し進め、その価値をeコマースを超えて拡張するためのロードマップを提供する。
論文 参考訳(メタデータ) (2025-11-26T22:51:02Z) - Multi-granularity Interest Retrieval and Refinement Network for Long-Term User Behavior Modeling in CTR Prediction [68.90783662117936]
クリックスルーレート(CTR)の予測は、オンラインパーソナライズプラットフォームにとって不可欠である。
近年の進歩は、リッチなユーザの振る舞いをモデル化することで、CTR予測の性能を大幅に改善できることを示している。
マルチグラニュラリティ興味検索ネットワーク(MIRRN)を提案する。
論文 参考訳(メタデータ) (2024-11-22T15:29:05Z) - RETE: Retrieval-Enhanced Temporal Event Forecasting on Unified Query
Product Evolutionary Graph [18.826901341496143]
時間的イベント予測は、統合クエリ製品進化グラフにおける新しいユーザ行動予測タスクである。
本稿では,新しいイベント予測フレームワークを提案する。
既存手法とは違って,グラフ全体の大まかに連結されたエンティティを通じてユーザ表現を強化する手法を提案する。
論文 参考訳(メタデータ) (2022-02-12T19:27:56Z) - Empowering General-purpose User Representation with Full-life Cycle
Behavior Modeling [11.698166058448555]
本稿では,この課題に対処するために,フルライフサイクルユーザ表現モデル(LURM)と呼ばれる新しいフレームワークを提案する。
LURMは2つのカスケードサブモデルで構成されている: (I) Bag-of-Interests (BoI) は、任意の期間におけるユーザの振る舞いを超高次元のスパースベクトル(例:105)にエンコードする。
SMENは、ユーザ関心の異なる側面を学習できる新しいマルチアンカーモジュールの恩恵を受け、ほぼ次元の削減を実現している。
論文 参考訳(メタデータ) (2021-10-20T08:24:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。