論文の概要: Personalized Federated X -armed Bandit
- arxiv url: http://arxiv.org/abs/2310.16323v1
- Date: Wed, 25 Oct 2023 03:11:32 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-26 17:09:06.935509
- Title: Personalized Federated X -armed Bandit
- Title(参考訳): パーソナライズされたfederated x-armed bandit
- Authors: Wenjie Li, Qifan Song, Jean Honorio
- Abstract要約: 我々は、フェデレートされた$mathcalX$-armed bandit問題について検討し、フェデレート学習パラダイムにおいて、クライアントの異種局所目的を同時に最適化する。
本手法では,非最適領域を安全に除去すると同時に,非最適領域の偏りはあるが効果的な局所目的評価を通じて協調を奨励する。
- 参考スコア(独自算出の注目度): 44.7483638955294
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this work, we study the personalized federated $\mathcal{X}$-armed bandit
problem, where the heterogeneous local objectives of the clients are optimized
simultaneously in the federated learning paradigm. We propose the
\texttt{PF-PNE} algorithm with a unique double elimination strategy, which
safely eliminates the non-optimal regions while encouraging federated
collaboration through biased but effective evaluations of the local objectives.
The proposed \texttt{PF-PNE} algorithm is able to optimize local objectives
with arbitrary levels of heterogeneity, and its limited communications protects
the confidentiality of the client-wise reward data. Our theoretical analysis
shows the benefit of the proposed algorithm over single-client algorithms.
Experimentally, \texttt{PF-PNE} outperforms multiple baselines on both
synthetic and real life datasets.
- Abstract(参考訳): 本研究では,フェデレーション学習のパラダイムにおいて,クライアントの異種な局所目標を同時に最適化する,パーソナライズされたフェデレートされた$\mathcal{x}$-armed bandit問題について検討する。
本稿では,非最適領域を安全に排除しつつ,局所目的の偏りはあるが効果的な評価を通じて協調協調を奨励する,一意的な二重除去戦略を持つ \texttt{pf-pne} アルゴリズムを提案する。
提案する \texttt{pf-pne} アルゴリズムは、任意のレベルの不均一性を持つ局所目的を最適化することができ、その限られた通信はクライアント側の報酬データの機密性を保護する。
本理論解析は,提案アルゴリズムの利点を示すものである。
実験的に、‘texttt{PF-PNE} は合成および実生活データセットの両方で複数のベースラインを上回っている。
関連論文リスト
- Asymmetrically Decentralized Federated Learning [22.21977974314497]
分散フェデレーションラーニング(DFL)が出現し、ピアツーピア(P2P)通信フレームワークでサーバを破棄する。
本稿では,非対称トポロジに基づくPush-Awareプロトコルを用いたDFedSGPSMアルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-10-08T09:46:26Z) - Theoretically Principled Federated Learning for Balancing Privacy and
Utility [61.03993520243198]
モデルパラメータを歪ませることでプライバシを保護する保護機構の一般学習フレームワークを提案する。
フェデレートされた学習における各コミュニケーションラウンドにおいて、各クライアント上の各モデルパラメータに対して、パーソナライズされたユーティリティプライバシトレードオフを実現することができる。
論文 参考訳(メタデータ) (2023-05-24T13:44:02Z) - Provable Offline Preference-Based Reinforcement Learning [95.00042541409901]
本研究では,PbRL(Preference-based Reinforcement Learning)の問題について,人間のフィードバックを用いて検討する。
我々は、報酬が軌道全体にわたって定義できる一般的な報酬設定について考察する。
我々は, 軌道毎の集中性によって上界に拘束できる新しい単極集中係数を導入する。
論文 参考訳(メタデータ) (2023-05-24T07:11:26Z) - Dynamic Regularized Sharpness Aware Minimization in Federated Learning: Approaching Global Consistency and Smooth Landscape [59.841889495864386]
フェデレートラーニング(FL)では、グローバルサーバの協調の下で、ローカルクライアントのクラスタがチェアリングされる。
クライアントは自身のオプティマに過度に適合する傾向にあり、グローバルな目標から非常に逸脱する。
tt Family FedSMOOは、グローバルな目的に対する局所的な最適性を保証するために動的正規化器を採用する。
理論解析により, tt Family FedSMOO は, 低境界一般化による高速$mathcalO (1/T)$収束率を達成することが示された。
論文 参考訳(メタデータ) (2023-05-19T10:47:44Z) - Federated X-Armed Bandit [36.39045680578951]
この研究は$mathcalX$-armed banditというフェデレートされた最初のフレームワークを確立します。
我々は,texttFed-PNE という,そのような問題に対する最初のフェデレーションアルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-05-30T17:25:51Z) - Federated Online Sparse Decision Making [24.856596181768364]
textttFedego Lassoは、新しいマルチクライアント・利己的なバンディットポリシー設計に依存している。
提案アルゴリズムの有効性を,合成データセットと実世界のデータセットの両方で実証した。
論文 参考訳(メタデータ) (2022-02-27T20:34:41Z) - Federated Linear Contextual Bandits [17.438169791449834]
Fed-PEは、ローカルな特徴ベクトルや生データを交換することなく、クライアント間の不均一性に対処するために提案されている。
提案アルゴリズムの有効性を,合成データセットと実世界のデータセットの両方で実証した。
論文 参考訳(メタデータ) (2021-10-27T05:18:58Z) - Faster Non-Convex Federated Learning via Global and Local Momentum [57.52663209739171]
textttFedGLOMOは最初の(一階)FLtexttFedGLOMOアルゴリズムです。
クライアントとサーバ間の通信においても,我々のアルゴリズムは確実に最適である。
論文 参考訳(メタデータ) (2020-12-07T21:05:31Z) - FedPD: A Federated Learning Framework with Optimal Rates and Adaptivity
to Non-IID Data [59.50904660420082]
フェデレートラーニング(FL)は、分散データから学ぶための一般的なパラダイムになっています。
クラウドに移行することなく、さまざまなデバイスのデータを効果的に活用するために、Federated Averaging(FedAvg)などのアルゴリズムでは、"Computation then aggregate"(CTA)モデルを採用している。
論文 参考訳(メタデータ) (2020-05-22T23:07:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。