Fugu-MT 論文翻訳(概要): JDRec: Practical Actor-Critic Framework for Online Combinatorial Recommender System

論文の概要: JDRec: Practical Actor-Critic Framework for Online Combinatorial Recommender System

arxiv url: http://arxiv.org/abs/2207.13311v1
Date: Wed, 27 Jul 2022 05:47:12 GMT
ステータス: 翻訳完了
システム内更新日: 2022-07-28 13:10:36.542733
Title: JDRec: Practical Actor-Critic Framework for Online Combinatorial Recommender System
Title（参考訳）: JDRec:オンラインコンビニアルレコメンダシステムのための実践的アクター批判フレームワーク
Authors: Xin Zhao (1), Zhiwei Fang (1), Yuchen Guo (2), Jie He (1), Wenlong Chen (1), Changping Peng (1) ((1) JD.com, (2) Tsinghua University)
Abstract要約: 推薦者システム(CR)は、ユーザ行動がコンテキスト情報とアイテムの両方に影響される結果ページにおいて、ユーザに対してアイテムのリストを出力する。その重要性にもかかわらず、オンライン環境における効率性、ダイナミクス、パーソナライズ要件のため、実用的なCRシステムを構築することは依然として課題である。
参考スコア（独自算出の注目度）: 0.0
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: A combinatorial recommender (CR) system feeds a list of items to a user at a time in the result page, in which the user behavior is affected by both contextual information and items. The CR is formulated as a combinatorial optimization problem with the objective of maximizing the recommendation reward of the whole list. Despite its importance, it is still a challenge to build a practical CR system, due to the efficiency, dynamics, personalization requirement in online environment. In particular, we tear the problem into two sub-problems, list generation and list evaluation. Novel and practical model architectures are designed for these sub-problems aiming at jointly optimizing effectiveness and efficiency. In order to adapt to online case, a bootstrap algorithm forming an actor-critic reinforcement framework is given to explore better recommendation mode in long-term user interaction. Offline and online experiment results demonstrate the efficacy of proposed JDRec framework. JDRec has been applied in online JD recommendation, improving click through rate by 2.6% and synthetical value for the platform by 5.03%. We will publish the large-scale dataset used in this study to contribute to the research community.
Abstract（参考訳）: 複合レコメンデータ(CR)システムは、ユーザ行動がコンテキスト情報とアイテムの両方に影響される結果ページにおいて、ユーザに対してアイテムのリストを出力する。 CRは、リスト全体のレコメンデーション報酬を最大化する目的で、組合せ最適化問題として定式化される。その重要性にもかかわらず、オンライン環境における効率性、ダイナミクス、パーソナライズ要件のため、実用的なCRシステムを構築することは依然として課題である。特に、問題をリスト生成とリスト評価という2つのサブ問題に分割する。新しい実用的なモデルアーキテクチャは、効率と効率を共同で最適化することを目的とした、これらのサブプロブレムのために設計されている。オンラインのケースに適応するために,アクター-批判強化フレームワークを構成するブートストラップアルゴリズムを用い,長期的なユーザインタラクションにおいて,より優れたレコメンデーションモードを検討する。オフラインおよびオンライン実験の結果は、提案したJDRecフレームワークの有効性を示す。 JDRecはオンラインJDレコメンデーションに採用され、クリックスルー率を2.6%改善し、プラットフォームの合成価値を5.03%改善した。本研究で使用する大規模データセットを公開し,研究コミュニティに貢献する。

関連論文リスト

An End-to-End Multi-objective Ensemble Ranking Framework for Video Recommendation [20.59012057446529]
本稿では,多目的アンサンブルランキングモジュールのための新しいエンド・ツー・エンド多目的アンサンブルランキングフレームワーク(EMER)を提案する。 EMERは手作業で設計された公式をエンドツーエンドのモデリングパラダイムに置き換えることで強化する。当社のフレームワークは,毎日数億人のアクティブユーザがいるショートビデオレコメンデーションプラットフォームであるKuaishouの主要なシナリオにデプロイされています。
論文参考訳（メタデータ） (2025-08-07T07:21:46Z)
RADAR: Recall Augmentation through Deferred Asynchronous Retrieval [0.0]
Deferred Asynchronous Retrieval (RADAR)によるリコール拡張について紹介する。 RADARは、完全な複雑性ランキングモデルを使用して、ユーザに対してはるかに大きな候補セットを事前にランク付けする。 RADARは、検索されたより大きな候補セットとより強力なランキングモデルを効果的に組み合わせることでリコールを大幅に強化する。
論文参考訳（メタデータ） (2025-06-08T19:21:46Z)
Search-Based Interaction For Conversation Recommendation via Generative Reward Model Based Simulated User [117.82681846559909]
会話レコメンデーションシステム(CRS)は、マルチターンインタラクションを使用してユーザの好みを捉え、パーソナライズされたレコメンデーションを提供する。本稿では,CRSと自動インタラクションを行うための生成報酬モデルに基づくシミュレーションユーザGRSUを提案する。
論文参考訳（メタデータ） (2025-04-29T06:37:30Z)
Review, Refine, Repeat: Understanding Iterative Decoding of AI Agents with Dynamic Evaluation and Selection [71.92083784393418]
Best-of-N (BON) サンプリングのような推論時間法は、パフォーマンスを改善するための単純で効果的な代替手段を提供する。本稿では,反復的改良と動的候補評価,検証器による選択を併用した反復的エージェント復号(IAD)を提案する。
論文参考訳（メタデータ） (2025-04-02T17:40:47Z)
Efficient and Robust Regularized Federated Recommendation [52.24782464815489]
推薦システム(RSRS)は、ユーザの好みとプライバシの両方に対処する。通信効率を向上させるために,非一様勾配勾配勾配を取り入れた新しい手法を提案する。 RFRecFの強靭性は、多様なベースラインに比べて優れている。
論文参考訳（メタデータ） (2024-11-03T12:10:20Z)
Online and Offline Evaluations of Collaborative Filtering and Content Based Recommender Systems [0.0]
本研究では,イランにおける大規模レコメンデーションシステムの比較分析を行った。このシステムは、コンテンツベース、協調フィルタリング、トレンドベース手法、ハイブリッドアプローチを用いた、ユーザベースおよびアイテムベースのレコメンデーションを採用している。評価方法は,手動による評価,ヒットレート@kやnDCGなどの評価指標を含むオフラインテスト,クリックスルーレート(CTR)によるオンラインテストなどである。
論文参考訳（メタデータ） (2024-11-02T20:05:31Z)
CART: A Generative Cross-Modal Retrieval Framework with Coarse-To-Fine Semantic Modeling [53.97609687516371]
クロスモーダル検索は、異なるモーダルデータの相互作用を通じて、クエリと意味的に関連するインスタンスを検索することを目的としている。従来のソリューションでは、クエリと候補の間のスコアを明示的に計算するために、シングルトウワーまたはデュアルトウワーのフレームワークを使用している。粗大なセマンティックモデリングに基づく生成的クロスモーダル検索フレームワーク(CART)を提案する。
論文参考訳（メタデータ） (2024-06-25T12:47:04Z)
A Thorough Performance Benchmarking on Lightweight Embedding-based Recommender Systems [67.52782366565658]
State-of-the-art recommender system (RS) は、埋め込みベクトルによって符号化される分類的特徴に依存し、結果として非常に大きな埋め込みテーブルとなる。軽量埋め込み型RSの繁栄にもかかわらず、評価プロトコルには幅広い多様性が見られる。本研究では, LERSの性能, 効率, クロスタスク転送性について, 徹底的なベンチマークによる検討を行った。
論文参考訳（メタデータ） (2024-06-25T07:45:00Z)
EASRec: Elastic Architecture Search for Efficient Long-term Sequential Recommender Systems [82.76483989905961]
現在のSRS(Sequential Recommender Systems)は、計算とリソースの非効率に悩まされている。我々は、効率的な長期シーケンスレコメンダシステム(EASRec)のための弾性アーキテクチャー探索を開発する。 EASRecは、入力データバッチから履歴情報を活用するデータ認識ゲートを導入し、レコメンデーションネットワークの性能を改善する。
論文参考訳（メタデータ） (2024-02-01T07:22:52Z)
Broad Recommender System: An Efficient Nonlinear Collaborative Filtering Approach [56.12815715932561]
我々はBroad Collaborative Filtering (BroadCF)と呼ばれる新しい広帯域リコメンデータシステムを提案する。深層ニューラルネットワーク(DNN)の代わりに、ユーザとアイテム間の複雑な非線形関係を学習するためのマッピング機能として、Broad Learning System(BLS)が使用されている。 7つのベンチマークデータセットで実施された大規模な実験により、提案したBroadCFアルゴリズムの有効性が確認された。
論文参考訳（メタデータ） (2022-04-20T01:25:08Z)
Building an Efficient and Effective Retrieval-based Dialogue System via Mutual Learning [27.04857039060308]
検索システムを構築するために,両世界の長所を組み合わせることを提案する。従来の機能ベースの事前検索モデルを置き換えるために、高速なバイエンコーダを使用します。我々は、相互学習を通じて、事前検索モデルと再評価モデルとを同時に訓練する。
論文参考訳（メタデータ） (2021-10-01T01:32:33Z)
Leveraging Historical Interaction Data for Improving Conversational Recommender System [105.90963882850265]
アイテムと属性に基づく嗜好シーケンスを統合するための,新しい事前学習手法を提案する。実世界の2つのデータセットの実験結果から,本手法の有効性が示された。
論文参考訳（メタデータ） (2020-08-19T03:43:50Z)
Self-Supervised Reinforcement Learning for Recommender Systems [77.38665506495553]
逐次リコメンデーションタスクのための自己指導型強化学習を提案する。提案手法は,2つの出力層を持つ標準レコメンデーションモデルを強化する。このようなアプローチに基づいて、自己監督型Q-ラーニング(SQN)と自己監督型アクター・クライブ(SAC)という2つのフレームワークを提案する。
論文参考訳（メタデータ） (2020-06-10T11:18:57Z)
A Text-based Deep Reinforcement Learning Framework for Interactive Recommendation [15.723042747172688]
インタラクティブレコメンデータシステム(IRS)のためのテキストベースのDeep Deterministic Policy Gradient Framework(TDDPG-Rec)を提案する。具体的には,テキスト情報を利用してアイテムやユーザを特徴空間にマッピングすることで,空間性の問題を大幅に軽減する。 TDDPG-Recは,複数のベースラインに対して,時間効率で最先端のパフォーマンスを実現する。
論文参考訳（メタデータ） (2020-04-14T16:46:01Z)
RNE: A Scalable Network Embedding for Billion-scale Recommendation [21.6366085346674]
データ効率のよいレコメンデーションベースのネットワーク埋め込み手法であるRNEを提案し、ユーザに対してパーソナライズされた多様なアイテムを提供する。一方,提案手法は,ユーザの関心の多様性と動的特性をモデル化し,推薦品質を高めるとともに,ユーザとアイテム間の局所的な構造を維持できる。当社は、中国最大のEコマースプラットフォームであるTaobaoのレコメンデーションシナリオにRNEをデプロイし、それを10億規模のユーザテムグラフでトレーニングしています。
論文参考訳（メタデータ） (2020-03-10T07:08:57Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。