論文の概要: MARS: Modality-Aligned Retrieval for Sequence Augmented CTR Prediction
- arxiv url: http://arxiv.org/abs/2509.01184v1
- Date: Mon, 01 Sep 2025 07:08:44 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-04 15:17:03.571489
- Title: MARS: Modality-Aligned Retrieval for Sequence Augmented CTR Prediction
- Title(参考訳): MARS: シーケンス拡張CTR予測のためのモダリティアライズド検索
- Authors: Yutian Xiao, Shukuan Wang, Binhao Wang, Zhao Zhang, Yanze Zhang, Shanqi Liu, Chao Feng, Xiang Li, Fuzhen Zhuang,
- Abstract要約: 新たなフレームワーク textbfMARS(textbfModality-textbfAligned textbfRetrieval for textbfSequence Augmented CTR Prediction)を提案する。
MARSは、Steinカーネルベースのアプローチを使用して、テキストと画像の特徴を統一的でバイアスのないセマンティック空間にアライメントし、マルチモーダルなユーザ埋め込みを構築する。
一貫して最先端のベースラインを上回り、コアビジネスメトリクスでかなりの成長を遂げています。
- 参考スコア(独自算出の注目度): 23.789479369353675
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Click-through rate (CTR) prediction serves as a cornerstone of recommender systems. Despite the strong performance of current CTR models based on user behavior modeling, they are still severely limited by interaction sparsity, especially in low-active user scenarios. To address this issue, data augmentation of user behavior is a promising research direction. However, existing data augmentation methods heavily rely on collaborative signals while overlooking the rich multimodal features of items, leading to insufficient modeling of low-active users. To alleviate this problem, we propose a novel framework \textbf{MARS} (\textbf{M}odality-\textbf{A}ligned \textbf{R}etrieval for \textbf{S}equence Augmented CTR Prediction). MARS utilizes a Stein kernel-based approach to align text and image features into a unified and unbiased semantic space to construct multimodal user embeddings. Subsequently, each low-active user's behavior sequence is augmented by retrieving, filtering, and concentrating the most similar behavior sequence of high-active users via multimodal user embeddings. Validated by extensive offline experiments and online A/B tests, our framework MARS consistently outperforms state-of-the-art baselines and achieves substantial growth on core business metrics within Kuaishou~\footnote{https://www.kuaishou.com/}. Consequently, MARS has been successfully deployed, serving the main traffic for hundreds of millions of users. To ensure reproducibility, we provide anonymous access to the implementation code~\footnote{https://github.com/wangshukuan/MARS}.
- Abstract(参考訳): クリックスルー率(CTR)予測はレコメンダシステムの基盤となる。
ユーザ・ビヘイビア・モデリングに基づく現行のCTRモデルの性能は高いが、特に低アクティブなユーザ・シナリオにおいて、インタラクション・スペシャリティによって著しく制限されている。
この問題に対処するためには、ユーザ行動のデータの増大が有望な研究方向である。
しかし、既存のデータ拡張手法は、アイテムのリッチなマルチモーダルな特徴を見落としながら、協調的な信号に大きく依存しているため、低能率ユーザのモデリングは不十分である。
この問題を緩和するために、新しいフレームワーク \textbf{MARS} (\textbf{M}odality-\textbf{A}ligned \textbf{R}etrieval for \textbf{S}equence Augmented CTR Prediction)を提案する。
MARSは、Steinカーネルベースのアプローチを使用して、テキストと画像の特徴を統一的でバイアスのないセマンティック空間にアライメントし、マルチモーダルなユーザ埋め込みを構築する。
その後、各低能率ユーザの行動シーケンスは、マルチモーダルユーザ埋め込みを通じて、高能率ユーザの行動シーケンスを検索、フィルタリング、集中することにより強化される。
大規模なオフライン実験とオンラインA/Bテストによって検証された私たちのフレームワークMARSは、一貫して最先端のベースラインを上回り、Kuaishou~\footnote{https://www.kuaishou.com/} の中核ビジネスメトリクスでかなりの成長を遂げています。
その結果、MARSはうまくデプロイされ、数億のユーザに対して主要なトラフィックを提供します。
再現性を確保するため、実装コード~\footnote{https://github.com/wangshukuan/MARS} に匿名アクセスを提供する。
関連論文リスト
- Multi-granularity Interest Retrieval and Refinement Network for Long-Term User Behavior Modeling in CTR Prediction [68.90783662117936]
クリックスルーレート(CTR)の予測は、オンラインパーソナライズプラットフォームにとって不可欠である。
近年の進歩は、リッチなユーザの振る舞いをモデル化することで、CTR予測の性能を大幅に改善できることを示している。
マルチグラニュラリティ興味検索ネットワーク(MIRRN)を提案する。
論文 参考訳(メタデータ) (2024-11-22T15:29:05Z) - Impression-Informed Multi-Behavior Recommender System: A Hierarchical
Graph Attention Approach [4.03161352925235]
textbfHierarchical textbfMulti-behavior textbfGraph Attention textbfNetwork (HMGN)を紹介する。
この先駆的なフレームワークは、注意機構を利用して、行動内および行動内の両方から情報を識別する。
従来のグラフニューラルネットワーク手法に比べて,NDCG@100で最大64%の顕著なパフォーマンス向上を登録する。
論文 参考訳(メタデータ) (2023-09-06T17:09:43Z) - TBIN: Modeling Long Textual Behavior Data for CTR Prediction [15.056265935931377]
クリックスルー率(CTR)予測は、レコメンデーションの成功において重要な役割を果たす。
近年の言語モデル(LM)の発展に触発されて,テキストテキスト形式でユーザ行動データを整理することで,予測を改善する作業が急増している。
有望ではあるが、これらの研究は、LMにおける自己注意の2次計算オーバーヘッドを減らすために、テキストデータを切り離さなければならない。
本稿では,textbfTextual textbfBehavior-based textbfInterest Chunking textbfNを提案する。
論文 参考訳(メタデータ) (2023-08-09T03:48:41Z) - Sampling Is All You Need on Modeling Long-Term User Behaviors for CTR
Prediction [15.97120392599086]
textbfM(textbfSampling-based textbfDeep textbfModeling)を提案する。
提案手法は, 長期ユーザ行動のモデル化において, 標準的な注意モデルと同等に機能することが理論的, 実験的に示されている。
論文 参考訳(メタデータ) (2022-05-20T15:20:52Z) - Multi-Interactive Attention Network for Fine-grained Feature Learning in
CTR Prediction [48.267995749975476]
クリックスルー率(ctr)予測シナリオでは、ユーザのシーケンシャルな動作を利用してユーザの関心を捉える。
既存の手法は主にユーザの行動に注意を払っているが、CTR予測には必ずしも適していない。
マルチインタラクティブ・アテンション・ネットワーク (MIAN) を提案し, 各種微細な特徴間の潜在関係を総合的に抽出する。
論文 参考訳(メタデータ) (2020-12-13T05:46:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。