論文の概要: JDRec: Practical Actor-Critic Framework for Online Combinatorial
Recommender System
- arxiv url: http://arxiv.org/abs/2207.13311v1
- Date: Wed, 27 Jul 2022 05:47:12 GMT
- ステータス: 処理完了
- システム内更新日: 2022-07-28 13:10:36.542733
- Title: JDRec: Practical Actor-Critic Framework for Online Combinatorial
Recommender System
- Title(参考訳): JDRec:オンラインコンビニアルレコメンダシステムのための実践的アクター批判フレームワーク
- Authors: Xin Zhao (1), Zhiwei Fang (1), Yuchen Guo (2), Jie He (1), Wenlong
Chen (1), Changping Peng (1) ((1) JD.com, (2) Tsinghua University)
- Abstract要約: 推薦者システム(CR)は、ユーザ行動がコンテキスト情報とアイテムの両方に影響される結果ページにおいて、ユーザに対してアイテムのリストを出力する。
その重要性にもかかわらず、オンライン環境における効率性、ダイナミクス、パーソナライズ要件のため、実用的なCRシステムを構築することは依然として課題である。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: A combinatorial recommender (CR) system feeds a list of items to a user at a
time in the result page, in which the user behavior is affected by both
contextual information and items. The CR is formulated as a combinatorial
optimization problem with the objective of maximizing the recommendation reward
of the whole list. Despite its importance, it is still a challenge to build a
practical CR system, due to the efficiency, dynamics, personalization
requirement in online environment. In particular, we tear the problem into two
sub-problems, list generation and list evaluation. Novel and practical model
architectures are designed for these sub-problems aiming at jointly optimizing
effectiveness and efficiency. In order to adapt to online case, a bootstrap
algorithm forming an actor-critic reinforcement framework is given to explore
better recommendation mode in long-term user interaction. Offline and online
experiment results demonstrate the efficacy of proposed JDRec framework. JDRec
has been applied in online JD recommendation, improving click through rate by
2.6% and synthetical value for the platform by 5.03%. We will publish the
large-scale dataset used in this study to contribute to the research community.
- Abstract(参考訳): 複合レコメンデータ(CR)システムは、ユーザ行動がコンテキスト情報とアイテムの両方に影響される結果ページにおいて、ユーザに対してアイテムのリストを出力する。
CRは、リスト全体のレコメンデーション報酬を最大化する目的で、組合せ最適化問題として定式化される。
その重要性にもかかわらず、オンライン環境における効率性、ダイナミクス、パーソナライズ要件のため、実用的なCRシステムを構築することは依然として課題である。
特に、問題をリスト生成とリスト評価という2つのサブ問題に分割する。
新しい実用的なモデルアーキテクチャは、効率と効率を共同で最適化することを目的とした、これらのサブプロブレムのために設計されている。
オンラインのケースに適応するために,アクター-批判強化フレームワークを構成するブートストラップアルゴリズムを用い,長期的なユーザインタラクションにおいて,より優れたレコメンデーションモードを検討する。
オフラインおよびオンライン実験の結果は、提案したJDRecフレームワークの有効性を示す。
JDRecはオンラインJDレコメンデーションに採用され、クリックスルー率を2.6%改善し、プラットフォームの合成価値を5.03%改善した。
本研究で使用する大規模データセットを公開し,研究コミュニティに貢献する。
関連論文リスト
- EASRec: Elastic Architecture Search for Efficient Long-term Sequential
Recommender Systems [82.76483989905961]
現在のSRS(Sequential Recommender Systems)は、計算とリソースの非効率に悩まされている。
我々は、効率的な長期シーケンスレコメンダシステム(EASRec)のための弾性アーキテクチャー探索を開発する。
EASRecは、入力データバッチから履歴情報を活用するデータ認識ゲートを導入し、レコメンデーションネットワークの性能を改善する。
論文 参考訳(メタデータ) (2024-02-01T07:22:52Z) - Beyond Two-Tower Matching: Learning Sparse Retrievable
Cross-Interactions for Recommendation [80.19762472699814]
2-towerモデルは、産業アプリケーションに広くデプロイされている推奨のための一般的なマッチングフレームワークである。
機能間相互作用の制限と、オンラインサービスにおける精度の低下など、主な課題が2つある。
我々は,高度な機能相互作用だけでなく,効率的な検索もサポートするSparCodeという新しいマッチングパラダイムを提案する。
論文 参考訳(メタデータ) (2023-11-30T03:13:36Z) - Recommendation Unlearning via Matrix Correction [17.457533987238975]
本稿では,非学習を推奨するためのインタラクション・マッピング・マトリクス補正(IMCorrect)手法を提案する。
IMCorrectは完全性、実用性、効率性が優れており、多くのレコメンデーションアンラーニングシナリオに適用可能であることを示す。
論文 参考訳(メタデータ) (2023-07-29T11:36:38Z) - Broad Recommender System: An Efficient Nonlinear Collaborative Filtering
Approach [56.12815715932561]
我々はBroad Collaborative Filtering (BroadCF)と呼ばれる新しい広帯域リコメンデータシステムを提案する。
深層ニューラルネットワーク(DNN)の代わりに、ユーザとアイテム間の複雑な非線形関係を学習するためのマッピング機能として、Broad Learning System(BLS)が使用されている。
7つのベンチマークデータセットで実施された大規模な実験により、提案したBroadCFアルゴリズムの有効性が確認された。
論文 参考訳(メタデータ) (2022-04-20T01:25:08Z) - Choosing the Best of Both Worlds: Diverse and Novel Recommendations
through Multi-Objective Reinforcement Learning [68.45370492516531]
本稿では,Recommender Systems (RS) 設定のための拡張多目的強化学習(SMORL)を紹介する。
SMORLエージェントは、標準レコメンデーションモデルを拡張し、RLレイヤーを追加し、3つの主要な目的(正確性、多様性、新しいレコメンデーション)を同時に満たすように強制する。
実世界の2つのデータセットに対する実験結果から,集約的多様性の顕著な増加,精度の適度な向上,レコメンデーションの反復性の低下,および相補的目的としての多様性と新規性の強化の重要性が示された。
論文 参考訳(メタデータ) (2021-10-28T13:22:45Z) - Building an Efficient and Effective Retrieval-based Dialogue System via
Mutual Learning [27.04857039060308]
検索システムを構築するために,両世界の長所を組み合わせることを提案する。
従来の機能ベースの事前検索モデルを置き換えるために、高速なバイエンコーダを使用します。
我々は、相互学習を通じて、事前検索モデルと再評価モデルとを同時に訓練する。
論文 参考訳(メタデータ) (2021-10-01T01:32:33Z) - Leveraging Historical Interaction Data for Improving Conversational
Recommender System [105.90963882850265]
アイテムと属性に基づく嗜好シーケンスを統合するための,新しい事前学習手法を提案する。
実世界の2つのデータセットの実験結果から,本手法の有効性が示された。
論文 参考訳(メタデータ) (2020-08-19T03:43:50Z) - Self-Supervised Reinforcement Learning for Recommender Systems [77.38665506495553]
逐次リコメンデーションタスクのための自己指導型強化学習を提案する。
提案手法は,2つの出力層を持つ標準レコメンデーションモデルを強化する。
このようなアプローチに基づいて、自己監督型Q-ラーニング(SQN)と自己監督型アクター・クライブ(SAC)という2つのフレームワークを提案する。
論文 参考訳(メタデータ) (2020-06-10T11:18:57Z) - Maximizing Cumulative User Engagement in Sequential Recommendation: An
Online Optimization Perspective [26.18096797120916]
ユーザエンゲージメントの向上とユーザブラウジングの促進という、潜在的に矛盾する2つの目標をトレードオフするためには、しばしば必要となる。
より長いユーザブラウジング期間と高いユーザエンゲージメントを明示的にトレードオフする,フレキシブルで実用的なフレームワークを提案する。
このアプローチは大規模なEコマースプラットフォームにデプロイされ、累積クリックの7%以上の改善が達成されている。
論文 参考訳(メタデータ) (2020-06-02T09:02:51Z) - A Text-based Deep Reinforcement Learning Framework for Interactive
Recommendation [15.723042747172688]
インタラクティブレコメンデータシステム(IRS)のためのテキストベースのDeep Deterministic Policy Gradient Framework(TDDPG-Rec)を提案する。
具体的には,テキスト情報を利用してアイテムやユーザを特徴空間にマッピングすることで,空間性の問題を大幅に軽減する。
TDDPG-Recは,複数のベースラインに対して,時間効率で最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2020-04-14T16:46:01Z) - RNE: A Scalable Network Embedding for Billion-scale Recommendation [21.6366085346674]
データ効率のよいレコメンデーションベースのネットワーク埋め込み手法であるRNEを提案し、ユーザに対してパーソナライズされた多様なアイテムを提供する。
一方,提案手法は,ユーザの関心の多様性と動的特性をモデル化し,推薦品質を高めるとともに,ユーザとアイテム間の局所的な構造を維持できる。
当社は、中国最大のEコマースプラットフォームであるTaobaoのレコメンデーションシナリオにRNEをデプロイし、それを10億規模のユーザテムグラフでトレーニングしています。
論文 参考訳(メタデータ) (2020-03-10T07:08:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。