論文の概要: Attention Weighted Mixture of Experts with Contrastive Learning for
Personalized Ranking in E-commerce
- arxiv url: http://arxiv.org/abs/2306.05011v1
- Date: Thu, 8 Jun 2023 07:59:08 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-09 15:46:02.910533
- Title: Attention Weighted Mixture of Experts with Contrastive Learning for
Personalized Ranking in E-commerce
- Title(参考訳): 電子商取引における個人格付けのためのコントラスト学習専門家の注意重み付け
- Authors: Juan Gong, Zhenlin Chen, Chaoyi Ma, Zhuojian Xiao, Haonan Wang, Guoyu
Tang, Lin Liu, Sulong Xu, Bo Long, Yunjiang Jiang
- Abstract要約: 本稿では,個人格付けのためのコントラスト学習を伴うAW-MoE(Attention Weighted Mixture of Experts)を提案する。
AW-MoEはJDのeコマース検索エンジンでうまく展開されている。
- 参考スコア(独自算出の注目度): 21.7796124109
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Ranking model plays an essential role in e-commerce search and
recommendation. An effective ranking model should give a personalized ranking
list for each user according to the user preference. Existing algorithms
usually extract a user representation vector from the user behavior sequence,
then feed the vector into a feed-forward network (FFN) together with other
features for feature interactions, and finally produce a personalized ranking
score. Despite tremendous progress in the past, there is still room for
improvement. Firstly, the personalized patterns of feature interactions for
different users are not explicitly modeled. Secondly, most of existing
algorithms have poor personalized ranking results for long-tail users with few
historical behaviors due to the data sparsity. To overcome the two challenges,
we propose Attention Weighted Mixture of Experts (AW-MoE) with contrastive
learning for personalized ranking. Firstly, AW-MoE leverages the MoE framework
to capture personalized feature interactions for different users. To model the
user preference, the user behavior sequence is simultaneously fed into expert
networks and the gate network. Within the gate network, one gate unit and one
activation unit are designed to adaptively learn the fine-grained activation
vector for experts using an attention mechanism. Secondly, a random masking
strategy is applied to the user behavior sequence to simulate long-tail users,
and an auxiliary contrastive loss is imposed to the output of the gate network
to improve the model generalization for these users. This is validated by a
higher performance gain on the long-tail user test set. Experiment results on a
JD real production dataset and a public dataset demonstrate the effectiveness
of AW-MoE, which significantly outperforms state-of-art methods. Notably,
AW-MoE has been successfully deployed in the JD e-commerce search engine, ...
- Abstract(参考訳): ランキングモデルはeコマースの検索とレコメンデーションにおいて重要な役割を果たす。
効果的なランキングモデルでは、ユーザの好みに応じて、パーソナライズされたランキングリストを提供する必要がある。
既存のアルゴリズムは通常、ユーザの動作シーケンスからユーザ表現ベクターを抽出し、そのベクターをフィードフォワードネットワーク(ffn)に送信し、他の機能とともに機能インタラクションを行い、最終的にパーソナライズされたランキングスコアを生成する。
過去の大きな進歩にもかかわらず、改善の余地はまだある。
まず、異なるユーザに対する機能インタラクションのパーソナライズされたパターンは、明示的にモデル化されていない。
第二に、既存のアルゴリズムのほとんどが、データスパーシティによる履歴行動の少ないロングテールユーザーに対して、パーソナライズされたランキング結果が貧弱である。
この2つの課題を克服するために,個別のランク付けのための対照的な学習を伴うAW-MoE(Attention Weighted Mixture of Experts)を提案する。
まず、AW-MoEはMoEフレームワークを利用して、異なるユーザー向けにパーソナライズされた機能インタラクションをキャプチャする。
ユーザの好みをモデル化するために、ユーザ行動シーケンスを専門家ネットワークとゲートネットワークに同時に供給する。
ゲートネットワーク内の1つのゲートユニットと1つのアクティベーションユニットは、アテンション機構を用いて専門家のためのきめ細かいアクティベーションベクトルを適応的に学習するように設計されている。
次に、ユーザ行動シーケンスにランダムマスキング戦略を適用してロングテールユーザをシミュレートし、ゲートネットワークの出力に補助的なコントラスト損失を課し、それらのユーザに対するモデル一般化を改善する。
これはlong-tailユーザテストセットのパフォーマンス向上によって検証される。
JD実運用データセットと公開データセットの実験結果は、最先端の手法を大幅に上回るAW-MoEの有効性を示す。
特に、AW-MoEはJD eコマース検索エンジンでうまく展開されている。
関連論文リスト
- Multi-granularity Interest Retrieval and Refinement Network for Long-Term User Behavior Modeling in CTR Prediction [68.90783662117936]
クリックスルーレート(CTR)の予測は、オンラインパーソナライズプラットフォームにとって不可欠である。
近年の進歩は、リッチなユーザの振る舞いをモデル化することで、CTR予測の性能を大幅に改善できることを示している。
マルチグラニュラリティ興味検索ネットワーク(MIRRN)を提案する。
論文 参考訳(メタデータ) (2024-11-22T15:29:05Z) - USE: Dynamic User Modeling with Stateful Sequence Models [26.74966828348815]
User Stateful Embedding (USE)は、徹底的な再処理を必要とせずに、ユーザ埋め込みを生成する。
我々は,次世代の予測の限界を超越するために,将来のW行動予測という新たな訓練目標を導入する。
静的(固定されたユーザ行動シーケンス)および動的(定期的に更新されたユーザ行動シーケンス)設定の両方で、Snapchatユーザーの行動ログを使用して、8つの下流タスクで実験を行う。
論文 参考訳(メタデータ) (2024-03-20T07:05:19Z) - AdaptSSR: Pre-training User Model with Augmentation-Adaptive
Self-Supervised Ranking [19.1857792382924]
本稿では,Augmentation-Supervised Ranking (AdaptSSR)を提案する。
我々は、暗黙的に拡張されたビュー、明示的な拡張されたビュー、および他のユーザからのビューの類似性の順序をキャプチャするために、ユーザモデルを訓練する複数のペアランキング損失を採用する。
6つの下流タスクを持つパブリックデータセットとインダストリアルデータセットの実験は、AdaptSSRの有効性を検証する。
論文 参考訳(メタデータ) (2023-10-15T02:19:28Z) - TransAct: Transformer-based Realtime User Action Model for
Recommendation at Pinterest [17.247452803197362]
本稿では、PinterestのHomefeedランキングアーキテクチャについて述べる。
本研究では,リアルタイム活動からユーザの短期的嗜好を抽出するシーケンシャルモデルであるTransActを提案する。
本稿では, アブレーション研究の結果, 生産時の課題, オンラインA/B実験の結果について述べる。
論文 参考訳(メタデータ) (2023-05-31T23:45:29Z) - Neighbor Based Enhancement for the Long-Tail Ranking Problem in Video
Rank Models [0.0]
本稿では,対象ユーザや項目の表現のトレーニングを支援する新しい隣人拡張構造を提案する。
有名な公開データセットMovieLens 1Mの実験は、この手法の効率を実証している。
論文 参考訳(メタデータ) (2023-02-16T07:38:51Z) - Latent User Intent Modeling for Sequential Recommenders [92.66888409973495]
逐次リコメンデータモデルは、プラットフォーム上での氏のインタラクション履歴に基づいて、ユーザが次に対話する可能性のあるアイテムを予測することを学習する。
しかし、ほとんどのシーケンシャルなレコメンデータは、ユーザの意図に対する高いレベルの理解を欠いている。
したがって、インテントモデリングはユーザー理解と長期ユーザーエクスペリエンスの最適化に不可欠である。
論文 参考訳(メタデータ) (2022-11-17T19:00:24Z) - Meta-Wrapper: Differentiable Wrapping Operator for User Interest
Selection in CTR Prediction [97.99938802797377]
クリックスルー率(CTR)予測は、ユーザーが商品をクリックする確率を予測することを目的としており、リコメンデーションシステムにおいてますます重要になっている。
近年,ユーザの行動からユーザの興味を自動的に抽出する深層学習モデルが大きな成功を収めている。
そこで我々は,メタラッパー(Meta-Wrapper)と呼ばれるラッパー手法の枠組みに基づく新しい手法を提案する。
論文 参考訳(メタデータ) (2022-06-28T03:28:15Z) - PinnerFormer: Sequence Modeling for User Representation at Pinterest [60.335384724891746]
我々は、ユーザの将来的なエンゲージメントを予測するためにトレーニングされたユーザ表現であるPinnerFormerを紹介する。
従来のアプローチとは異なり、新しい密集した全アクション損失を通じて、モデリングをバッチインフラストラクチャに適応させます。
その結果,1日に1回発生するバッチユーザ埋め込みと,ユーザがアクションを行うたびに発生するリアルタイムユーザ埋め込みとの間には,大きなギャップがあることが判明した。
論文 参考訳(メタデータ) (2022-05-09T18:26:51Z) - Modeling Dynamic User Preference via Dictionary Learning for Sequential
Recommendation [133.8758914874593]
ユーザの好みのダイナミックさを捉えることは、ユーザの将来の行動を予測する上で非常に重要です。
浅いものも深いものも含む、既存のレコメンデーションアルゴリズムの多くは、このようなダイナミクスを独立してモデル化することが多い。
本稿では、ユーザのシーケンシャルな振る舞いを、ユーザ好みの潜伏した空間に埋め込むことの問題について考察する。
論文 参考訳(メタデータ) (2022-04-02T03:23:46Z) - Sequence Adaptation via Reinforcement Learning in Recommender Systems [8.909115457491522]
そこで我々は,SARモデルを提案する。SARモデルは,ユーザとイテムの相互作用のシーケンス長をパーソナライズされた方法で調整する。
さらに,逐次レコメンデーションの精度を批評家ネットワークの予測累積報酬と整合させるために,共同損失関数を最適化する。
実世界の4つのデータセットに対する実験的な評価は,提案モデルがいくつかのベースラインアプローチよりも優れていることを示す。
論文 参考訳(メタデータ) (2021-07-31T13:56:46Z) - Dynamic Graph Collaborative Filtering [64.87765663208927]
動的レコメンデーションは,逐次データに基づくリアルタイム予測を提供するレコメンデータシステムにとって不可欠である。
本稿では、動的グラフを利用して協調関係とシーケンシャル関係をキャプチャする新しいフレームワーク、Dynamic Graph Collaborative Filtering (DGCF)を提案する。
提案手法は, 動的協調情報の統合の有効性を示すため, 動作繰り返しの少ないデータセットでは高い性能を実現する。
論文 参考訳(メタデータ) (2021-01-08T04:16:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。