論文の概要: Search-based User Interest Modeling with Lifelong Sequential Behavior
Data for Click-Through Rate Prediction
- arxiv url: http://arxiv.org/abs/2006.05639v2
- Date: Mon, 29 Jun 2020 03:27:18 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-23 06:09:19.271518
- Title: Search-based User Interest Modeling with Lifelong Sequential Behavior
Data for Click-Through Rate Prediction
- Title(参考訳): クリックスルーレート予測のための時系列行動データを用いた検索ベースユーザ興味モデリング
- Authors: Pi Qi, Xiaoqiang Zhu, Guorui Zhou, Yujing Zhang, Zhe Wang, Lejian Ren,
Ying Fan, and Kun Gai
- Abstract要約: 我々は検索ベース興味モデル(SIM)と呼ばれる新しいモデリングパラダイムを提案する。
SIMは2つのカスケード検索ユニットでユーザ興味を抽出する。
2019年以降、SIMはAlibabaのディスプレイ広告システムにデプロイされ、CTRは7.1%、リフトは4.4%となっている。
- 参考スコア(独自算出の注目度): 23.460147230576855
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Rich user behavior data has been proven to be of great value for
click-through rate prediction tasks, especially in industrial applications such
as recommender systems and online advertising. Both industry and academy have
paid much attention to this topic and propose different approaches to modeling
with long sequential user behavior data. Among them, memory network based model
MIMN proposed by Alibaba, achieves SOTA with the co-design of both learning
algorithm and serving system. MIMN is the first industrial solution that can
model sequential user behavior data with length scaling up to 1000. However,
MIMN fails to precisely capture user interests given a specific candidate item
when the length of user behavior sequence increases further, say, by 10 times
or more. This challenge exists widely in previously proposed approaches. In
this paper, we tackle this problem by designing a new modeling paradigm, which
we name as Search-based Interest Model (SIM). SIM extracts user interests with
two cascaded search units: (i) General Search Unit acts as a general search
from the raw and arbitrary long sequential behavior data, with query
information from candidate item, and gets a Sub user Behavior Sequence which is
relevant to candidate item; (ii) Exact Search Unit models the precise
relationship between candidate item and SBS. This cascaded search paradigm
enables SIM with a better ability to model lifelong sequential behavior data in
both scalability and accuracy. Apart from the learning algorithm, we also
introduce our hands-on experience on how to implement SIM in large scale
industrial systems. Since 2019, SIM has been deployed in the display
advertising system in Alibaba, bringing 7.1\% CTR and 4.4\% RPM lift, which is
significant to the business. Serving the main traffic in our real system now,
SIM models user behavior data with maximum length reaching up to 54000, pushing
SOTA to 54x.
- Abstract(参考訳): リッチなユーザー行動データはクリックスルー率予測タスク、特にレコメンデーションシステムやオンライン広告のような産業アプリケーションにとって非常に有用であることが証明されている。
業界とアカデミーは、このトピックに多くの注意を払っており、長いシーケンシャルなユーザー行動データでモデリングするための異なるアプローチを提案している。
その中でも,Alibaba が提案するメモリネットワークモデル MIMN は,学習アルゴリズムとサービスシステムの共同設計により SOTA を実現する。
MIMNは、1000までのスケーリングでシーケンシャルなユーザ行動データをモデル化できる最初の産業用ソリューションである。
しかし、MIMNは、ユーザの行動シーケンスの長さが10倍以上に増加すると、特定の候補アイテムから与えられたユーザの興味を正確に捉えることができない。
この挑戦は以前に提案されたアプローチで広く存在する。
本稿では,検索ベース興味モデル(SIM)と呼ばれる新しいモデルパラダイムを設計することで,この問題に対処する。
SIMは2つのケースド検索ユニットでユーザーの興味を抽出する。
(i)一般検索部は、生及び任意に長い逐次行動データから、候補項目からの問い合わせ情報を検索し、候補項目に関連するサブユーザ行動シーケンスを取得する。
(ii)Exact Search Unitは、候補項目とSBSの正確な関係をモデル化する。
このカスケード検索パラダイムによってsimは、スケーラビリティと正確性の両方において、生涯のシーケンシャルな動作データをモデル化できる。
学習アルゴリズムとは別に,大規模産業システムにおけるSIMの実装方法についての実践経験も紹介する。
2019年以降、SIMはAlibabaのディスプレイ広告システムにデプロイされ、CTRは7.1\%、RPMは4.4\%となっている。
実際のシステムの主なトラフィックを提供するため、simは最大54000までのユーザ行動データをモデル化し、somaを54倍にプッシュします。
関連論文リスト
- Multi-granularity Interest Retrieval and Refinement Network for Long-Term User Behavior Modeling in CTR Prediction [68.90783662117936]
クリックスルーレート(CTR)の予測は、オンラインパーソナライズプラットフォームにとって不可欠である。
近年の進歩は、リッチなユーザの振る舞いをモデル化することで、CTR予測の性能を大幅に改善できることを示している。
マルチグラニュラリティ興味検索ネットワーク(MIRRN)を提案する。
論文 参考訳(メタデータ) (2024-11-22T15:29:05Z) - SEMINAR: Search Enhanced Multi-modal Interest Network and Approximate Retrieval for Lifelong Sequential Recommendation [16.370075234443245]
本稿では,SEMINAR-Search Enhanced Multi-Modal Interest Network と Approximate Retrieval という,一生涯にわたるマルチモーダルシーケンスモデルを提案する。
具体的には、Pretraining Search Unitと呼ばれるネットワークが、事前トレーニング-ファインタニング方式で、マルチモーダルクエリ-イテムペアの寿命のシーケンスを学習する。
マルチモーダル埋め込みのオンライン検索速度を高速化するために,マルチモーダルなコードブックベースの製品量子化戦略を提案する。
論文 参考訳(メタデータ) (2024-07-15T13:33:30Z) - BASES: Large-scale Web Search User Simulation with Large Language Model
based Agents [108.97507653131917]
BASESは、大きな言語モデル(LLM)を持つ新しいユーザーシミュレーションフレームワークである。
シミュレーションフレームワークは,大規模に独自のユーザプロファイルを生成することができ,その結果,多様な検索行動が生まれる。
WARRIORSは、中国語と英語の両方のバージョンを含む、Web検索ユーザ行動を含む、新しい大規模なデータセットである。
論文 参考訳(メタデータ) (2024-02-27T13:44:09Z) - Recommender Systems with Generative Retrieval [58.454606442670034]
本稿では,対象候補の識別子を自己回帰的に復号する新たな生成検索手法を提案する。
そのために、各項目のセマンティックIDとして機能するために、意味論的に意味のあるコードワードを作成します。
提案手法を用いて学習した推薦システムは,様々なデータセット上での現在のSOTAモデルよりも大幅に優れていることを示す。
論文 参考訳(メタデータ) (2023-05-08T21:48:17Z) - Neighbor Based Enhancement for the Long-Tail Ranking Problem in Video
Rank Models [0.0]
本稿では,対象ユーザや項目の表現のトレーニングを支援する新しい隣人拡張構造を提案する。
有名な公開データセットMovieLens 1Mの実験は、この手法の効率を実証している。
論文 参考訳(メタデータ) (2023-02-16T07:38:51Z) - Federated Privacy-preserving Collaborative Filtering for On-Device Next
App Prediction [52.16923290335873]
本稿では,モバイルデバイス使用時の次のアプリの起動を予測するための新しいSeqMFモデルを提案する。
古典行列分解モデルの構造を修正し、学習手順を逐次学習に更新する。
提案手法のもうひとつの要素は,ユーザからリモートサーバへの送信データの保護を保証する,新たなプライバシメカニズムである。
論文 参考訳(メタデータ) (2023-02-05T10:29:57Z) - Sampling Is All You Need on Modeling Long-Term User Behaviors for CTR
Prediction [15.97120392599086]
textbfM(textbfSampling-based textbfDeep textbfModeling)を提案する。
提案手法は, 長期ユーザ行動のモデル化において, 標準的な注意モデルと同等に機能することが理論的, 実験的に示されている。
論文 参考訳(メタデータ) (2022-05-20T15:20:52Z) - Modeling Dynamic User Preference via Dictionary Learning for Sequential
Recommendation [133.8758914874593]
ユーザの好みのダイナミックさを捉えることは、ユーザの将来の行動を予測する上で非常に重要です。
浅いものも深いものも含む、既存のレコメンデーションアルゴリズムの多くは、このようなダイナミクスを独立してモデル化することが多い。
本稿では、ユーザのシーケンシャルな振る舞いを、ユーザ好みの潜伏した空間に埋め込むことの問題について考察する。
論文 参考訳(メタデータ) (2022-04-02T03:23:46Z) - Sequential Search with Off-Policy Reinforcement Learning [48.88165680363482]
本稿では,RNN学習フレームワークとアテンションモデルからなる,スケーラブルなハイブリッド学習モデルを提案する。
新たな最適化のステップとして、1つのRNNパスに複数の短いユーザシーケンスをトレーニングバッチ内に収める。
また、マルチセッションパーソナライズされた検索ランキングにおける非政治強化学習の利用についても検討する。
論文 参考訳(メタデータ) (2022-02-01T06:52:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。