Fugu-MT 論文翻訳(概要): Federated Online Clustering of Bandits

論文の概要: Federated Online Clustering of Bandits

arxiv url: http://arxiv.org/abs/2208.14865v1
Date: Wed, 31 Aug 2022 13:46:02 GMT
ステータス: 翻訳完了
システム内更新日: 2022-09-01 13:38:06.632684
Title: Federated Online Clustering of Bandits
Title（参考訳）: バンディットのフェデレーションオンラインクラスタリング
Authors: Xutong Liu, Haoru Zhao, Tong Yu, Shuai Li, John C.S. Lui
Abstract要約: コンテキスト多重武装バンディット(MAB)はレコメンデーションシステムにおいて重要な意思決定問題である。本稿では,プライバシとコミュニケーションの考慮事項を満足しつつ,全体の後悔を最小限に抑えることを目的とした,B bandit (FCLUB) 問題の連合オンラインクラスタリングについて検討する。
参考スコア（独自算出の注目度）: 35.21933787486559
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Contextual multi-armed bandit (MAB) is an important sequential decision-making problem in recommendation systems. A line of works, called the clustering of bandits (CLUB), utilize the collaborative effect over users and dramatically improve the recommendation quality. Owing to the increasing application scale and public concerns about privacy, there is a growing demand to keep user data decentralized and push bandit learning to the local server side. Existing CLUB algorithms, however, are designed under the centralized setting where data are available at a central server. We focus on studying the federated online clustering of bandit (FCLUB) problem, which aims to minimize the total regret while satisfying privacy and communication considerations. We design a new phase-based scheme for cluster detection and a novel asynchronous communication protocol for cooperative bandit learning for this problem. To protect users' privacy, previous differential privacy (DP) definitions are not very suitable, and we propose a new DP notion that acts on the user cluster level. We provide rigorous proofs to show that our algorithm simultaneously achieves (clustered) DP, sublinear communication complexity and sublinear regret. Finally, experimental evaluations show our superior performance compared with benchmark algorithms.
Abstract（参考訳）: コンテキスト多重武装バンディット(MAB)はレコメンデーションシステムにおいて重要な意思決定問題である。 CLUB(Clustering of bandits)と呼ばれる一連の作業は、ユーザに対する協調的な効果を活用し、推奨品質を劇的に改善する。アプリケーションの規模が拡大し、プライバシに関する公の関心が高まる中、ユーザデータの分散化と、ローカルサーバ側へのバンディット学習のプッシュが求められている。しかし、既存のCLUBアルゴリズムは、中央サーバでデータが利用できる集中型環境下で設計されている。我々は,プライバシやコミュニケーションの考慮事項を満足しつつ,全体の後悔を最小限に抑えることを目的とした,FCLUB(Bandit)問題の連合的オンラインクラスタリングの研究に焦点をあてる。本稿では,クラスタ検出のための新しいフェーズベーススキームと,協調バンディット学習のための新しい非同期通信プロトコルを提案する。ユーザのプライバシを保護するため,従来の差分プライバシー(DP)定義はあまり適切ではなく,ユーザクラスタレベルで機能する新しいDP概念を提案する。本稿では,このアルゴリズムがDP,サブ線形通信複雑性,サブ線形後悔を同時に達成することを示す厳密な証明を提供する。最後に,ベンチマークアルゴリズムよりも優れた性能を示す実験評価を行った。

関連論文リスト

Online Clustering of Dueling Bandits [59.09590979404303]
本稿では、優先フィードバックに基づく協調的な意思決定を可能にするために、最初の「デュエルバンディットアルゴリズムのクラスタリング」を導入する。本稿では,(1)ユーザ報酬関数をコンテキストベクトルの線形関数としてモデル化する線形デューリング帯域のクラスタリング(COLDB)と,(2)ニューラルネットワークを用いて複雑な非線形ユーザ報酬関数をモデル化するニューラルデューリング帯域のクラスタリング(CONDB)の2つの新しいアルゴリズムを提案する。
論文参考訳（メタデータ） (2025-02-04T07:55:41Z)
Meta Clustering of Neural Bandits [45.77505279698894]
ニューラルバンドのクラスタリング(Clustering of Neural Bandits)という新しい問題を,任意の報酬関数に拡張することで研究する。本稿では,メタラーナーを用いて動的クラスタを高速に表現・適応する,M-CNBという新しいアルゴリズムを提案する。 M-CNBはレコメンデーションとオンラインの分類シナリオの両方で広範な実験を行い、SOTAベースラインを上回ります。
論文参考訳（メタデータ） (2024-08-10T16:09:51Z)
Privacy Preserving Semi-Decentralized Mean Estimation over Intermittently-Connected Networks [59.43433767253956]
信頼できない無線ネットワークの異なるノードに分散するベクトルの平均をプライベートに推定する問題を考える。半分散的なセットアップでは、ノードは隣人と協力してローカルコンセンサスを計算し、中央サーバにリレーする。ノード間のデータ共有による協調中継とプライバシー漏洩のトレードオフについて検討する。
論文参考訳（メタデータ） (2024-06-06T06:12:15Z)
On Differentially Private Federated Linear Contextual Bandits [9.51828574518325]
我々は、差分プライバシーの下で、クロスサイロフェデレーション線形文脈帯域問題(LCB)を考える。現状の3つの課題は, (i) 主張されたプライバシ保護の失敗, (ii) ノイズの計算ミスによる不正確な後悔,である。我々は,信頼されたサーバを使わずに,アルゴリズムがほぼ最適であることを示す。
論文参考訳（メタデータ） (2023-02-27T16:47:49Z)
Semi-decentralized Federated Ego Graph Learning for Recommendation [58.21409625065663]
デバイス上でのレコメンデーションのための半分散型フェデレーションエゴグラフ学習フレームワークであるSemiDFEGLを提案する。提案するフレームワークはモデルに依存しないため、既存のグラフニューラルネットワークベースのレコメンデーションメソッドやプライバシ保護技術とシームレスに統合できる。
論文参考訳（メタデータ） (2023-02-10T03:57:45Z)
On Differential Privacy for Federated Learning in Wireless Systems with Multiple Base Stations [90.53293906751747]
複数の基地局とセル間干渉を持つ無線システムにおける連合学習モデルを考える。本稿では,学習過程の収束挙動を,その最適性ギャップの上限を導出することによって示す。提案するスケジューラは,ランダムなスケジューラと比較して予測平均精度を向上する。
論文参考訳（メタデータ） (2022-08-25T03:37:11Z)
Decentralized Stochastic Optimization with Inherent Privacy Protection [103.62463469366557]
分散最適化は、現代の協調機械学習、分散推定と制御、大規模センシングの基本的な構成要素である。データが関与して以降、分散最適化アルゴリズムの実装において、プライバシ保護がますます重要になっている。
論文参考訳（メタデータ） (2022-05-08T14:38:23Z)
Near-Optimal Correlation Clustering with Privacy [37.94795032297396]
相関クラスタリングは教師なし学習における中心的な問題である。本稿では,相関クラスタリング問題と証明可能なプライバシ保証のための,シンプルで効率的なアルゴリズムを提案する。
論文参考訳（メタデータ） (2022-03-02T22:30:19Z)
Local Clustering in Contextual Multi-Armed Bandits [44.11480686973274]
コンテキスト型マルチアームバンディット(MAB)におけるユーザクラスタの識別について検討する。本稿では,局所クラスタリング手法を組み込んだ帯域幅アルゴリズム LOCB を提案する。提案アルゴリズムは,最先端のベースラインよりも優れた様々な側面から評価する。
論文参考訳（メタデータ） (2021-02-26T21:59:29Z)
Differentially Private k-Means Clustering with Guaranteed Convergence [5.335316436366718]
反復的なクラスタリングアルゴリズムは、データの背後にある洞察を学習するのに役立ちます。敵は、背景知識によって個人のプライバシーを推測することができる。このような推論攻撃に対して個人のプライバシを保護するため、反復クラスタリングアルゴリズムの差分プライバシー(DP)を広く研究している。
論文参考訳（メタデータ） (2020-02-03T22:53:47Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。