論文の概要: FedSlate:A Federated Deep Reinforcement Learning Recommender System
- arxiv url: http://arxiv.org/abs/2409.14872v1
- Date: Mon, 23 Sep 2024 10:10:24 GMT
- ステータス: 処理完了
- システム内更新日: 2024-11-06 20:39:08.811436
- Title: FedSlate:A Federated Deep Reinforcement Learning Recommender System
- Title(参考訳): FedSlate:Federated Deep Reinforcement Learning Recommender System
- Authors: Yongxin Deng, Xiaoyu Tan, Xihe Qiu, Yaochu Jin,
- Abstract要約: 推薦システムにおける長期ユーザエンゲージメントの最適化に強化学習法が用いられている。
潜在的な解決策の1つは、さまざまなプラットフォームから集中した場所にデータを集約し、集約されたデータをトレーニングに使用することである。
このアプローチは、通信コストの増加やユーザプライバシに対する潜在的な脅威など、経済的および法的懸念を提起する。
法的なレベルでの共有が禁止されている情報を効果的に活用する強化学習推薦アルゴリズムである textbfFedSlate を提案する。
- 参考スコア(独自算出の注目度): 18.641244204682536
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Reinforcement learning methods have been used to optimize long-term user engagement in recommendation systems. However, existing reinforcement learning-based recommendation systems do not fully exploit the relevance of individual user behavior across different platforms. One potential solution is to aggregate data from various platforms in a centralized location and use the aggregated data for training. However, this approach raises economic and legal concerns, including increased communication costs and potential threats to user privacy. To address these challenges, we propose \textbf{FedSlate}, a federated reinforcement learning recommendation algorithm that effectively utilizes information that is prohibited from being shared at a legal level. We employ the SlateQ algorithm to assist FedSlate in learning users' long-term behavior and evaluating the value of recommended content. We extend the existing application scope of recommendation systems from single-user single-platform to single-user multi-platform and address cross-platform learning challenges by introducing federated learning. We use RecSim to construct a simulation environment for evaluating FedSlate and compare its performance with state-of-the-art benchmark recommendation models. Experimental results demonstrate the superior effects of FedSlate over baseline methods in various environmental settings, and FedSlate facilitates the learning of recommendation strategies in scenarios where baseline methods are completely inapplicable. Code is available at \textit{https://github.com/TianYaDY/FedSlate}.
- Abstract(参考訳): 推薦システムにおける長期ユーザエンゲージメントの最適化に強化学習法が用いられている。
しかし、既存の強化学習に基づくレコメンデーションシステムは、異なるプラットフォーム間での個々のユーザー行動の関連性を十分に活用していない。
潜在的な解決策の1つは、さまざまなプラットフォームから集中した場所にデータを集約し、集約されたデータをトレーニングに使用することである。
しかし、このアプローチは、通信コストの増加やユーザプライバシに対する潜在的な脅威など、経済的および法的懸念を提起する。
これらの課題に対処するため、法レベルでの共有が禁止されている情報を効果的に活用する強化学習推薦アルゴリズムである「textbf{FedSlate}」を提案する。
我々は,ユーザの長期的行動の学習と推奨コンテンツの価値評価において,FedSlateを支援するためにSlateQアルゴリズムを採用している。
我々は,既存のアプリケーションの範囲をシングルユーザプラットフォームからシングルユーザマルチプラットフォームに拡張し,フェデレート学習を導入することで,クロスプラットフォーム学習の課題に対処する。
我々はRecSimを用いて、FedSlateの評価のためのシミュレーション環境を構築し、その性能を最先端のベンチマーク推薦モデルと比較する。
実験により, 各種環境条件下でのベースライン手法よりもFedSlateの方が優れた効果を示し, ベースライン手法が完全に適用不可能なシナリオにおける推奨戦略の学習を容易にする。
コードは \textit{https://github.com/TianYaDY/FedSlate} で公開されている。
関連論文リスト
- Efficient and Robust Regularized Federated Recommendation [52.24782464815489]
推薦システム(RSRS)は、ユーザの好みとプライバシの両方に対処する。
通信効率を向上させるために,非一様勾配勾配勾配を取り入れた新しい手法を提案する。
RFRecFの強靭性は、多様なベースラインに比べて優れている。
論文 参考訳(メタデータ) (2024-11-03T12:10:20Z) - Algorithmic Drift: A Simulation Framework to Study the Effects of Recommender Systems on User Preferences [7.552217586057245]
本稿では,長期シナリオにおけるユーザ-リコメンダ間のインタラクションを模倣するシミュレーションフレームワークを提案する。
本稿では,ユーザの嗜好に対するアルゴリズムの影響を定量化する2つの新しい指標について紹介する。
論文 参考訳(メタデータ) (2024-09-24T21:54:22Z) - CURE4Rec: A Benchmark for Recommendation Unlearning with Deeper Influence [55.21518669075263]
CURE4Recは、レコメンデーションアンラーニング評価のための最初の包括的なベンチマークである。
さまざまな影響レベルのデータに対する推薦公正性と堅牢性に対するアンラーニングの影響について検討する。
論文 参考訳(メタデータ) (2024-08-26T16:21:50Z) - A Comprehensive Survey on Self-Supervised Learning for Recommendation [19.916057705072177]
本稿では,レコメンデータシステム用に設計された自己指導型学習フレームワークのレビューを行い,170以上の論文を網羅的に分析する。
本稿では,異なる自己指導型学習パラダイム,すなわちコントラスト学習,生成学習,対人学習について詳述し,SSLが様々な文脈におけるレコメンダシステムをどのように強化するかの技術的詳細を述べる。
論文 参考訳(メタデータ) (2024-04-04T10:45:23Z) - User Consented Federated Recommender System Against Personalized
Attribute Inference Attack [55.24441467292359]
本稿では,ユーザの異なるプライバシーニーズを柔軟に満たすために,ユーザ合意型フェデレーションレコメンデーションシステム(UC-FedRec)を提案する。
UC-FedRecは、ユーザーが様々な要求を満たすためにプライバシー設定を自己定義し、ユーザーの同意を得てレコメンデーションを行うことを可能にする。
論文 参考訳(メタデータ) (2023-12-23T09:44:57Z) - On the resilience of Collaborative Learning-based Recommender Systems Against Community Detection Attack [1.9093042949944972]
フェデレートラーニング(FL)やゴシップラーニング(GL)といった協調学習技術の成功により、協調学習に基づく推薦システムが登場した。
これらのシステムでは、ユーザはデバイス上で消費されたアイテムの履歴を維持しながらレコメンデーションシステムのトレーニングに参加します。
最近の研究で、協調学習は様々なプライバシー攻撃に弱いことが判明している。
論文 参考訳(メタデータ) (2023-06-15T08:02:07Z) - Semi-decentralized Federated Ego Graph Learning for Recommendation [58.21409625065663]
デバイス上でのレコメンデーションのための半分散型フェデレーションエゴグラフ学習フレームワークであるSemiDFEGLを提案する。
提案するフレームワークはモデルに依存しないため、既存のグラフニューラルネットワークベースのレコメンデーションメソッドやプライバシ保護技術とシームレスに統合できる。
論文 参考訳(メタデータ) (2023-02-10T03:57:45Z) - FedGRec: Federated Graph Recommender System with Lazy Update of Latent
Embeddings [108.77460689459247]
プライバシー問題を軽減するためのフェデレートグラフレコメンダシステム(FedGRec)を提案する。
本システムでは,ユーザとサーバは,ユーザとアイテムに対する遅延埋め込みを明示的に記憶する。
我々は,遅延埋め込みを相互作用グラフの欠落のプロキシとして用いることの有効性を検証するために,広範な実験的な評価を行った。
論文 参考訳(メタデータ) (2022-10-25T01:08:20Z) - Generative Inverse Deep Reinforcement Learning for Online Recommendation [62.09946317831129]
オンラインレコメンデーションのための新しい逆強化学習手法InvRecを提案する。
InvRecは、オンラインレコメンデーションのために、ユーザの行動から報酬関数を自動的に抽出する。
論文 参考訳(メタデータ) (2020-11-04T12:12:25Z) - How to Put Users in Control of their Data in Federated Top-N
Recommendation with Learning to Rank [16.256897977543982]
FPLは、ユーザがデバイスを離れる機密データの量を制御しながら、中央分解モデルのトレーニングに協力するアーキテクチャである。
提案手法は,フェデレートラーニングの原則に従うことで,ペアワイズ学習とランク最適化を実現する。
論文 参考訳(メタデータ) (2020-08-17T10:13:15Z) - Recommendation system using a deep learning and graph analysis approach [1.2183405753834562]
本稿では,行列係数化とグラフ解析に基づく新しい推薦手法を提案する。
さらに,ディープオートエンコーダを利用してユーザやアイテムの潜伏要因を初期化し,ディープ埋め込み手法によってユーザの潜伏要因をユーザ信頼グラフから収集する。
論文 参考訳(メタデータ) (2020-04-17T08:05:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。