論文の概要: Federated Online Clustering of Bandits
- arxiv url: http://arxiv.org/abs/2208.14865v1
- Date: Wed, 31 Aug 2022 13:46:02 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-01 13:38:06.632684
- Title: Federated Online Clustering of Bandits
- Title(参考訳): バンディットのフェデレーションオンラインクラスタリング
- Authors: Xutong Liu, Haoru Zhao, Tong Yu, Shuai Li, John C.S. Lui
- Abstract要約: コンテキスト多重武装バンディット(MAB)はレコメンデーションシステムにおいて重要な意思決定問題である。
本稿では,プライバシとコミュニケーションの考慮事項を満足しつつ,全体の後悔を最小限に抑えることを目的とした,B bandit (FCLUB) 問題の連合オンラインクラスタリングについて検討する。
- 参考スコア(独自算出の注目度): 35.21933787486559
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Contextual multi-armed bandit (MAB) is an important sequential
decision-making problem in recommendation systems. A line of works, called the
clustering of bandits (CLUB), utilize the collaborative effect over users and
dramatically improve the recommendation quality. Owing to the increasing
application scale and public concerns about privacy, there is a growing demand
to keep user data decentralized and push bandit learning to the local server
side. Existing CLUB algorithms, however, are designed under the centralized
setting where data are available at a central server. We focus on studying the
federated online clustering of bandit (FCLUB) problem, which aims to minimize
the total regret while satisfying privacy and communication considerations. We
design a new phase-based scheme for cluster detection and a novel asynchronous
communication protocol for cooperative bandit learning for this problem. To
protect users' privacy, previous differential privacy (DP) definitions are not
very suitable, and we propose a new DP notion that acts on the user cluster
level. We provide rigorous proofs to show that our algorithm simultaneously
achieves (clustered) DP, sublinear communication complexity and sublinear
regret. Finally, experimental evaluations show our superior performance
compared with benchmark algorithms.
- Abstract(参考訳): コンテキスト多重武装バンディット(MAB)はレコメンデーションシステムにおいて重要な意思決定問題である。
CLUB(Clustering of bandits)と呼ばれる一連の作業は、ユーザに対する協調的な効果を活用し、推奨品質を劇的に改善する。
アプリケーションの規模が拡大し、プライバシに関する公の関心が高まる中、ユーザデータの分散化と、ローカルサーバ側へのバンディット学習のプッシュが求められている。
しかし、既存のCLUBアルゴリズムは、中央サーバでデータが利用できる集中型環境下で設計されている。
我々は,プライバシやコミュニケーションの考慮事項を満足しつつ,全体の後悔を最小限に抑えることを目的とした,FCLUB(Bandit)問題の連合的オンラインクラスタリングの研究に焦点をあてる。
本稿では,クラスタ検出のための新しいフェーズベーススキームと,協調バンディット学習のための新しい非同期通信プロトコルを提案する。
ユーザのプライバシを保護するため,従来の差分プライバシー(DP)定義はあまり適切ではなく,ユーザクラスタレベルで機能する新しいDP概念を提案する。
本稿では,このアルゴリズムがDP,サブ線形通信複雑性,サブ線形後悔を同時に達成することを示す厳密な証明を提供する。
最後に,ベンチマークアルゴリズムよりも優れた性能を示す実験評価を行った。
関連論文リスト
- Reinforcement Graph Clustering with Unknown Cluster Number [91.4861135742095]
本稿では,Reinforcement Graph Clusteringと呼ばれる新しいディープグラフクラスタリング手法を提案する。
提案手法では,クラスタ数決定と教師なし表現学習を統一的なフレームワークに統合する。
フィードバック動作を行うために、クラスタリング指向の報酬関数を提案し、同一クラスタの凝集を高め、異なるクラスタを分離する。
論文 参考訳(メタデータ) (2023-08-13T18:12:28Z) - On Differentially Private Federated Linear Contextual Bandits [9.51828574518325]
我々は、差分プライバシーの下で、クロスサイロフェデレーション線形文脈帯域問題(LCB)を考える。
現状の3つの課題は, (i) 主張されたプライバシ保護の失敗, (ii) ノイズの計算ミスによる不正確な後悔,である。
我々は,信頼されたサーバを使わずに,アルゴリズムがほぼ最適であることを示す。
論文 参考訳(メタデータ) (2023-02-27T16:47:49Z) - Semi-decentralized Federated Ego Graph Learning for Recommendation [58.21409625065663]
デバイス上でのレコメンデーションのための半分散型フェデレーションエゴグラフ学習フレームワークであるSemiDFEGLを提案する。
提案するフレームワークはモデルに依存しないため、既存のグラフニューラルネットワークベースのレコメンデーションメソッドやプライバシ保護技術とシームレスに統合できる。
論文 参考訳(メタデータ) (2023-02-10T03:57:45Z) - Privacy-Preserving Joint Edge Association and Power Optimization for the
Internet of Vehicles via Federated Multi-Agent Reinforcement Learning [74.53077322713548]
プライバシ保護型共同エッジアソシエーションと電力配分問題について検討する。
提案されたソリューションは、最先端のソリューションよりも高いプライバシレベルを維持しながら、魅力的なトレードオフにぶつかる。
論文 参考訳(メタデータ) (2023-01-26T10:09:23Z) - On Differential Privacy for Federated Learning in Wireless Systems with
Multiple Base Stations [90.53293906751747]
複数の基地局とセル間干渉を持つ無線システムにおける連合学習モデルを考える。
本稿では,学習過程の収束挙動を,その最適性ギャップの上限を導出することによって示す。
提案するスケジューラは,ランダムなスケジューラと比較して予測平均精度を向上する。
論文 参考訳(メタデータ) (2022-08-25T03:37:11Z) - Decentralized Stochastic Optimization with Inherent Privacy Protection [103.62463469366557]
分散最適化は、現代の協調機械学習、分散推定と制御、大規模センシングの基本的な構成要素である。
データが関与して以降、分散最適化アルゴリズムの実装において、プライバシ保護がますます重要になっている。
論文 参考訳(メタデータ) (2022-05-08T14:38:23Z) - Decentralized Collaborative Learning Framework for Next POI
Recommendation [39.65626819903099]
Next Point-of-Interest (POI)レコメンデーションは位置情報ベースのソーシャルネットワーク(LBSN)において必須の機能となっている。
正確なレコメンデーションには、膨大な量の履歴チェックインデータが必要であるため、位置情報に敏感なデータをクラウドサーバで処理する必要があるため、ユーザのプライバシを脅かすことになる。
本稿では,POIレコメンデーション(DCLR)のための分散協調学習フレームワークを提案する。
論文 参考訳(メタデータ) (2022-03-30T11:00:11Z) - Near-Optimal Correlation Clustering with Privacy [37.94795032297396]
相関クラスタリングは教師なし学習における中心的な問題である。
本稿では,相関クラスタリング問題と証明可能なプライバシ保証のための,シンプルで効率的なアルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-03-02T22:30:19Z) - Local Clustering in Contextual Multi-Armed Bandits [44.11480686973274]
コンテキスト型マルチアームバンディット(MAB)におけるユーザクラスタの識別について検討する。
本稿では,局所クラスタリング手法を組み込んだ帯域幅アルゴリズム LOCB を提案する。
提案アルゴリズムは,最先端のベースラインよりも優れた様々な側面から評価する。
論文 参考訳(メタデータ) (2021-02-26T21:59:29Z) - Differentially Private k-Means Clustering with Guaranteed Convergence [5.335316436366718]
反復的なクラスタリングアルゴリズムは、データの背後にある洞察を学習するのに役立ちます。
敵は、背景知識によって個人のプライバシーを推測することができる。
このような推論攻撃に対して個人のプライバシを保護するため、反復クラスタリングアルゴリズムの差分プライバシー(DP)を広く研究している。
論文 参考訳(メタデータ) (2020-02-03T22:53:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。