論文の概要: Proxy Model-Guided Reinforcement Learning for Client Selection in Federated Recommendation
- arxiv url: http://arxiv.org/abs/2508.10401v1
- Date: Thu, 14 Aug 2025 07:03:39 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-15 22:24:48.209041
- Title: Proxy Model-Guided Reinforcement Learning for Client Selection in Federated Recommendation
- Title(参考訳): フェデレーション・リコメンデーションにおけるクライアント選択のためのプロキシモデルによる強化学習
- Authors: Liang Qu, Jianxin Li, Wei Yuan, Penghui Ruan, Yuhui Shi, Hongzhi Yin,
- Abstract要約: フェデレートされたレコメンデーターシステムは、ユーザの生データを公開せずにパーソナライズされたレコメンデーションサービスを可能にする、有望なプライバシー保護パラダイムとして登場した。
既存のFedRSフレームワークのほとんどは、トレーニングラウンド毎に完全にランダムなクライアント選択戦略を採用しています。
本稿では,クライアント選択に適したプロキシモデル誘導強化学習フレームワークであるProxyRL-FRSを提案する。
- 参考スコア(独自算出の注目度): 41.93915547763831
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Federated recommender systems have emerged as a promising privacy-preserving paradigm, enabling personalized recommendation services without exposing users' raw data. By keeping data local and relying on a central server to coordinate training across distributed clients, FedRSs protect user privacy while collaboratively learning global models. However, most existing FedRS frameworks adopt fully random client selection strategy in each training round, overlooking the statistical heterogeneity of user data arising from diverse preferences and behavior patterns, thereby resulting in suboptimal model performance. While some client selection strategies have been proposed in the broader federated learning literature, these methods are typically designed for generic tasks and fail to address the unique challenges of recommendation scenarios, such as expensive contribution evaluation due to the large number of clients, and sparse updates resulting from long-tail item distributions. To bridge this gap, we propose ProxyRL-FRS, a proxy model-guided reinforcement learning framework tailored for client selection in federated recommendation. Specifically, we first introduce ProxyNCF, a dual-branch model deployed on each client, which augments standard Neural Collaborative Filtering with an additional proxy model branch that provides lightweight contribution estimation, thus eliminating the need for expensive per-round local training traditionally required to evaluate a client's contribution. Furthermore, we design a staleness-aware SA reinforcement learning agent that selects clients based on the proxy-estimated contribution, and is guided by a reward function balancing recommendation accuracy and embedding staleness, thereby enriching the update coverage of item embeddings. Experiments conducted on public recommendation datasets demonstrate the effectiveness of ProxyRL-FRS.
- Abstract(参考訳): フェデレートされたレコメンデーターシステムは、ユーザの生データを公開せずにパーソナライズされたレコメンデーションサービスを可能にする、有望なプライバシー保護パラダイムとして登場した。
データをローカルに保ち、分散クライアント間のトレーニングを調整するために中央サーバに依存することにより、FedRSはグローバルモデルを共同で学習しながら、ユーザのプライバシを保護する。
しかし、既存のFedRSフレームワークの多くは、各トレーニングラウンドで完全にランダムなクライアント選択戦略を採用しており、様々な好みや行動パターンから生じるユーザデータの統計的不均一性を見落とし、結果として、サブ最適モデルのパフォーマンスをもたらす。
いくつかのクライアント選択戦略は、より広範なフェデレートされた学習文献で提案されているが、これらの手法は一般的に汎用的なタスク用に設計されており、多くのクライアントによる高価なコントリビューション評価や、ロングテールアイテムの分布によるスパース更新など、レコメンデーションシナリオのユニークな課題に対処できない。
このギャップを埋めるために,クライアント選択に適したプロキシモデル誘導強化学習フレームワークであるProxyRL-FRSを提案する。
具体的には、まず、各クライアントにデプロイされるデュアルブランチモデルであるProxyNCFを紹介します。これは、標準のニューラルコラボレーティブ・フィルタリングを、軽量なコントリビューション推定を提供するプロキシモデルブランチで強化することで、従来、クライアントのコントリビューションを評価するのに必要とされる、ラウンド毎のローカライズトレーニングを不要にします。
さらに,提案手法を用いてクライアントを選定し,レコメンデーション精度と埋込み安定化のバランスをとる報奨関数で案内し,アイテム埋め込みの更新カバレッジを向上する安定化対応SA強化学習エージェントを設計する。
パブリックレコメンデーションデータセットで実施された実験は、ProxyRL-FRSの有効性を示す。
関連論文リスト
- Client-Centric Federated Adaptive Optimization [78.30827455292827]
Federated Learning(FL)は、クライアントが独自のデータをプライベートに保ちながら、協調的にモデルをトレーニングする分散学習パラダイムである。
本稿では,新しいフェデレーション最適化手法のクラスであるフェデレーション中心適応最適化を提案する。
論文 参考訳(メタデータ) (2025-01-17T04:00:50Z) - Co-clustering for Federated Recommender System [33.70723179405055]
Federated Recommender System(FRS)は、高品質なレコメンデーションの提供とユーザのプライバシの保護のバランスをとるソリューションを提供する。
パーソナライズされた意思決定パターンによって一般的に観察されるFRSにおける統計的不均一性の存在は、課題を引き起こす可能性がある。
本稿では,Co-clustering Federated RecommendationメカニズムであるCoFedRecを提案する。
論文 参考訳(メタデータ) (2024-11-03T21:32:07Z) - Efficient and Robust Regularized Federated Recommendation [52.24782464815489]
推薦システム(RSRS)は、ユーザの好みとプライバシの両方に対処する。
通信効率を向上させるために,非一様勾配勾配勾配を取り入れた新しい手法を提案する。
RFRecFの強靭性は、多様なベースラインに比べて優れている。
論文 参考訳(メタデータ) (2024-11-03T12:10:20Z) - PDC-FRS: Privacy-preserving Data Contribution for Federated Recommender System [15.589541738576528]
フェデレートされたレコメンデーションシステム(FedRecs)は、デバイス上のレコメンデーションにおいてユーザのプライバシを保護するために人気のある研究方向として登場した。
FedRecsでは、ユーザーはデータをローカルに保持し、モデルパラメータを中央サーバにアップロードすることで、ローカルのコラボレーティブな情報のみをコントリビュートする。
本稿では,新しいフェデレーション・レコメンデーション・フレームワークであるPDC-FRSを提案する。具体的には,ユーザが異なるプライバシ保証でデータを共有できるように,プライバシ保護データコントリビューション機構を設計する。
論文 参考訳(メタデータ) (2024-09-12T06:13:07Z) - Privacy and Accuracy Implications of Model Complexity and Integration in Heterogeneous Federated Learning [8.842172558292027]
分散機械学習のプライバシ保護ソリューションとしてフェデレートラーニング(FL)が提案されている。
近年の研究では、クライアントデータのプライバシを損なうことができるMIA攻撃の影響が指摘されている。
論文 参考訳(メタデータ) (2023-11-29T15:54:15Z) - Blockchain-based Optimized Client Selection and Privacy Preserved
Framework for Federated Learning [2.4201849657206496]
フェデレートラーニング(Federated Learning)は、大規模ニューラルネットワークモデルをトレーニングする分散メカニズムで、複数のクライアントが参加する。
この機能により、フェデレーション学習はデータのプライバシー問題に対するセキュアなソリューションとみなされる。
ブロックチェーンベースの最適化クライアント選択とプライバシ保護フレームワークを提案しました。
論文 参考訳(メタデータ) (2023-07-25T01:35:51Z) - Fed-CBS: A Heterogeneity-Aware Client Sampling Mechanism for Federated
Learning via Class-Imbalance Reduction [76.26710990597498]
本研究では,ランダムに選択したクライアントからのグループデータのクラス不均衡が,性能の大幅な低下につながることを示す。
我々のキーとなる観測に基づいて、我々は効率的なクライアントサンプリング機構、すなわちフェデレートクラスバランスサンプリング(Fed-CBS)を設計する。
特に、クラス不均衡の尺度を提案し、その後、同型暗号化を用いてプライバシー保護方式でこの尺度を導出する。
論文 参考訳(メタデータ) (2022-09-30T05:42:56Z) - Personalized Federated Learning with First Order Model Optimization [76.81546598985159]
そこで我々は,各クライアントが他のクライアントと連携して,クライアント固有の目的ごとのより強力なモデルを得る,フェデレーション学習の代替案を提案する。
基礎となるデータ分布やクライアントの類似性に関する知識を前提とせず、各クライアントが関心のある任意のターゲット分布を最適化できるようにします。
この手法は既存の代替品を上回り、ローカルデータ配信以外の転送のようなパーソナライズされたFLの新機能を可能にする。
論文 参考訳(メタデータ) (2020-12-15T19:30:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。