論文の概要: JDRec: Practical Actor-Critic Framework for Online Combinatorial
Recommender System
- arxiv url: http://arxiv.org/abs/2207.13311v1
- Date: Wed, 27 Jul 2022 05:47:12 GMT
- ステータス: 処理完了
- システム内更新日: 2022-07-28 13:10:36.542733
- Title: JDRec: Practical Actor-Critic Framework for Online Combinatorial
Recommender System
- Title(参考訳): JDRec:オンラインコンビニアルレコメンダシステムのための実践的アクター批判フレームワーク
- Authors: Xin Zhao (1), Zhiwei Fang (1), Yuchen Guo (2), Jie He (1), Wenlong
Chen (1), Changping Peng (1) ((1) JD.com, (2) Tsinghua University)
- Abstract要約: 推薦者システム(CR)は、ユーザ行動がコンテキスト情報とアイテムの両方に影響される結果ページにおいて、ユーザに対してアイテムのリストを出力する。
その重要性にもかかわらず、オンライン環境における効率性、ダイナミクス、パーソナライズ要件のため、実用的なCRシステムを構築することは依然として課題である。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: A combinatorial recommender (CR) system feeds a list of items to a user at a
time in the result page, in which the user behavior is affected by both
contextual information and items. The CR is formulated as a combinatorial
optimization problem with the objective of maximizing the recommendation reward
of the whole list. Despite its importance, it is still a challenge to build a
practical CR system, due to the efficiency, dynamics, personalization
requirement in online environment. In particular, we tear the problem into two
sub-problems, list generation and list evaluation. Novel and practical model
architectures are designed for these sub-problems aiming at jointly optimizing
effectiveness and efficiency. In order to adapt to online case, a bootstrap
algorithm forming an actor-critic reinforcement framework is given to explore
better recommendation mode in long-term user interaction. Offline and online
experiment results demonstrate the efficacy of proposed JDRec framework. JDRec
has been applied in online JD recommendation, improving click through rate by
2.6% and synthetical value for the platform by 5.03%. We will publish the
large-scale dataset used in this study to contribute to the research community.
- Abstract(参考訳): 複合レコメンデータ(CR)システムは、ユーザ行動がコンテキスト情報とアイテムの両方に影響される結果ページにおいて、ユーザに対してアイテムのリストを出力する。
CRは、リスト全体のレコメンデーション報酬を最大化する目的で、組合せ最適化問題として定式化される。
その重要性にもかかわらず、オンライン環境における効率性、ダイナミクス、パーソナライズ要件のため、実用的なCRシステムを構築することは依然として課題である。
特に、問題をリスト生成とリスト評価という2つのサブ問題に分割する。
新しい実用的なモデルアーキテクチャは、効率と効率を共同で最適化することを目的とした、これらのサブプロブレムのために設計されている。
オンラインのケースに適応するために,アクター-批判強化フレームワークを構成するブートストラップアルゴリズムを用い,長期的なユーザインタラクションにおいて,より優れたレコメンデーションモードを検討する。
オフラインおよびオンライン実験の結果は、提案したJDRecフレームワークの有効性を示す。
JDRecはオンラインJDレコメンデーションに採用され、クリックスルー率を2.6%改善し、プラットフォームの合成価値を5.03%改善した。
本研究で使用する大規模データセットを公開し,研究コミュニティに貢献する。
関連論文リスト
- Efficient and Robust Regularized Federated Recommendation [52.24782464815489]
推薦システム(RSRS)は、ユーザの好みとプライバシの両方に対処する。
通信効率を向上させるために,非一様勾配勾配勾配を取り入れた新しい手法を提案する。
RFRecFの強靭性は、多様なベースラインに比べて優れている。
論文 参考訳(メタデータ) (2024-11-03T12:10:20Z) - Online and Offline Evaluations of Collaborative Filtering and Content Based Recommender Systems [0.0]
本研究では,イランにおける大規模レコメンデーションシステムの比較分析を行った。
このシステムは、コンテンツベース、協調フィルタリング、トレンドベース手法、ハイブリッドアプローチを用いた、ユーザベースおよびアイテムベースのレコメンデーションを採用している。
評価方法は,手動による評価,ヒットレート@kやnDCGなどの評価指標を含むオフラインテスト,クリックスルーレート(CTR)によるオンラインテストなどである。
論文 参考訳(メタデータ) (2024-11-02T20:05:31Z) - A Thorough Performance Benchmarking on Lightweight Embedding-based Recommender Systems [67.52782366565658]
State-of-the-art recommender system (RS) は、埋め込みベクトルによって符号化される分類的特徴に依存し、結果として非常に大きな埋め込みテーブルとなる。
軽量埋め込み型RSの繁栄にもかかわらず、評価プロトコルには幅広い多様性が見られる。
本研究では, LERSの性能, 効率, クロスタスク転送性について, 徹底的なベンチマークによる検討を行った。
論文 参考訳(メタデータ) (2024-06-25T07:45:00Z) - EASRec: Elastic Architecture Search for Efficient Long-term Sequential
Recommender Systems [82.76483989905961]
現在のSRS(Sequential Recommender Systems)は、計算とリソースの非効率に悩まされている。
我々は、効率的な長期シーケンスレコメンダシステム(EASRec)のための弾性アーキテクチャー探索を開発する。
EASRecは、入力データバッチから履歴情報を活用するデータ認識ゲートを導入し、レコメンデーションネットワークの性能を改善する。
論文 参考訳(メタデータ) (2024-02-01T07:22:52Z) - Broad Recommender System: An Efficient Nonlinear Collaborative Filtering
Approach [56.12815715932561]
我々はBroad Collaborative Filtering (BroadCF)と呼ばれる新しい広帯域リコメンデータシステムを提案する。
深層ニューラルネットワーク(DNN)の代わりに、ユーザとアイテム間の複雑な非線形関係を学習するためのマッピング機能として、Broad Learning System(BLS)が使用されている。
7つのベンチマークデータセットで実施された大規模な実験により、提案したBroadCFアルゴリズムの有効性が確認された。
論文 参考訳(メタデータ) (2022-04-20T01:25:08Z) - Building an Efficient and Effective Retrieval-based Dialogue System via
Mutual Learning [27.04857039060308]
検索システムを構築するために,両世界の長所を組み合わせることを提案する。
従来の機能ベースの事前検索モデルを置き換えるために、高速なバイエンコーダを使用します。
我々は、相互学習を通じて、事前検索モデルと再評価モデルとを同時に訓練する。
論文 参考訳(メタデータ) (2021-10-01T01:32:33Z) - Leveraging Historical Interaction Data for Improving Conversational
Recommender System [105.90963882850265]
アイテムと属性に基づく嗜好シーケンスを統合するための,新しい事前学習手法を提案する。
実世界の2つのデータセットの実験結果から,本手法の有効性が示された。
論文 参考訳(メタデータ) (2020-08-19T03:43:50Z) - Self-Supervised Reinforcement Learning for Recommender Systems [77.38665506495553]
逐次リコメンデーションタスクのための自己指導型強化学習を提案する。
提案手法は,2つの出力層を持つ標準レコメンデーションモデルを強化する。
このようなアプローチに基づいて、自己監督型Q-ラーニング(SQN)と自己監督型アクター・クライブ(SAC)という2つのフレームワークを提案する。
論文 参考訳(メタデータ) (2020-06-10T11:18:57Z) - A Text-based Deep Reinforcement Learning Framework for Interactive
Recommendation [15.723042747172688]
インタラクティブレコメンデータシステム(IRS)のためのテキストベースのDeep Deterministic Policy Gradient Framework(TDDPG-Rec)を提案する。
具体的には,テキスト情報を利用してアイテムやユーザを特徴空間にマッピングすることで,空間性の問題を大幅に軽減する。
TDDPG-Recは,複数のベースラインに対して,時間効率で最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2020-04-14T16:46:01Z) - RNE: A Scalable Network Embedding for Billion-scale Recommendation [21.6366085346674]
データ効率のよいレコメンデーションベースのネットワーク埋め込み手法であるRNEを提案し、ユーザに対してパーソナライズされた多様なアイテムを提供する。
一方,提案手法は,ユーザの関心の多様性と動的特性をモデル化し,推薦品質を高めるとともに,ユーザとアイテム間の局所的な構造を維持できる。
当社は、中国最大のEコマースプラットフォームであるTaobaoのレコメンデーションシナリオにRNEをデプロイし、それを10億規模のユーザテムグラフでトレーニングしています。
論文 参考訳(メタデータ) (2020-03-10T07:08:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。