論文の概要: Federated Linear Contextual Bandits
- arxiv url: http://arxiv.org/abs/2110.14177v1
- Date: Wed, 27 Oct 2021 05:18:58 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-29 03:34:08.052476
- Title: Federated Linear Contextual Bandits
- Title(参考訳): フェデレーション線形コンテキストバンディット
- Authors: Ruiquan Huang, Weiqiang Wu, Jing Yang, Cong Shen
- Abstract要約: Fed-PEは、ローカルな特徴ベクトルや生データを交換することなく、クライアント間の不均一性に対処するために提案されている。
提案アルゴリズムの有効性を,合成データセットと実世界のデータセットの両方で実証した。
- 参考スコア(独自算出の注目度): 17.438169791449834
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper presents a novel federated linear contextual bandits model, where
individual clients face different $K$-armed stochastic bandits coupled through
common global parameters. By leveraging the geometric structure of the linear
rewards, a collaborative algorithm called Fed-PE is proposed to cope with the
heterogeneity across clients without exchanging local feature vectors or raw
data. Fed-PE relies on a novel multi-client G-optimal design, and achieves
near-optimal regrets for both disjoint and shared parameter cases with
logarithmic communication costs. In addition, a new concept called
collinearly-dependent policies is introduced, based on which a tight minimax
regret lower bound for the disjoint parameter case is derived. Experiments
demonstrate the effectiveness of the proposed algorithms on both synthetic and
real-world datasets.
- Abstract(参考訳): 本稿では,各クライアントが共通のグローバルパラメータを組み合わさったK$の確率的バンディットに直面する,新しい線形コンテキストバンドイットモデルを提案する。
線形報酬の幾何学的構造を利用して、局所特徴ベクトルや生データを交換することなく、クライアント間の不均一性に対処するFed-PEと呼ばれる協調アルゴリズムを提案する。
fed-peは、新しいマルチクライアントg-optimal設計に依存し、対数通信コストを伴う非結合および共有パラメータケースの両方に対して、ほぼ最適に後悔する。
さらに、コリニアリ依存ポリシーと呼ばれる新しい概念が導入され、この不連続パラメータケースに対する狭いミニマックスの後悔の下限が導出される。
実験は、合成データと実世界のデータセットの両方における提案アルゴリズムの有効性を実証する。
関連論文リスト
- Near-Optimal Regret in Linear MDPs with Aggregate Bandit Feedback [38.61232011566285]
本稿では,最近提案されたRLモデルとアグリゲート帯域フィードバック(RL-ABF)について検討する。
本稿では,ABFを線形関数近似に拡張し,ほぼ最適後悔保証を伴う2つの効率的なアルゴリズムを開発する。
論文 参考訳(メタデータ) (2024-05-13T10:51:01Z) - Personalized Federated X -armed Bandit [44.7483638955294]
我々は、フェデレートされた$mathcalX$-armed bandit問題について検討し、フェデレート学習パラダイムにおいて、クライアントの異種局所目的を同時に最適化する。
本手法では,非最適領域を安全に除去すると同時に,非最適領域の偏りはあるが効果的な局所目的評価を通じて協調を奨励する。
論文 参考訳(メタデータ) (2023-10-25T03:11:32Z) - Stable Nonconvex-Nonconcave Training via Linear Interpolation [51.668052890249726]
本稿では,ニューラルネットワークトレーニングを安定化(大規模)するための原理的手法として,線形アヘッドの理論解析を提案する。
最適化過程の不安定性は、しばしば損失ランドスケープの非単調性によって引き起こされるものであり、非拡張作用素の理論を活用することによって線型性がいかに役立つかを示す。
論文 参考訳(メタデータ) (2023-10-20T12:45:12Z) - SIGMA: Scale-Invariant Global Sparse Shape Matching [50.385414715675076]
非剛体形状の正確なスパース対応を生成するための新しい混合整数プログラミング(MIP)法を提案する。
いくつかの挑戦的な3Dデータセットに対して,スパースな非剛性マッチングの最先端結果を示す。
論文 参考訳(メタデータ) (2023-08-16T14:25:30Z) - Differentially Private Federated Clustering over Non-IID Data [59.611244450530315]
クラスタリングクラスタ(FedC)問題は、巨大なクライアント上に分散されたラベルなしデータサンプルを、サーバのオーケストレーションの下で有限のクライアントに正確に分割することを目的としている。
本稿では,DP-Fedと呼ばれる差分プライバシー収束手法を用いた新しいFedCアルゴリズムを提案する。
提案するDP-Fedの様々な属性は、プライバシー保護の理論的解析、特に非識別的かつ独立に分散された(非i.d.)データの場合において得られる。
論文 参考訳(メタデータ) (2023-01-03T05:38:43Z) - Federated Online Sparse Decision Making [24.856596181768364]
textttFedego Lassoは、新しいマルチクライアント・利己的なバンディットポリシー設計に依存している。
提案アルゴリズムの有効性を,合成データセットと実世界のデータセットの両方で実証した。
論文 参考訳(メタデータ) (2022-02-27T20:34:41Z) - Faster Non-Convex Federated Learning via Global and Local Momentum [57.52663209739171]
textttFedGLOMOは最初の(一階)FLtexttFedGLOMOアルゴリズムです。
クライアントとサーバ間の通信においても,我々のアルゴリズムは確実に最適である。
論文 参考訳(メタデータ) (2020-12-07T21:05:31Z) - Perplexity-free Parametric t-SNE [11.970023029249083]
t-distributed Neighbor Embedding (t-SNE) アルゴリズムは、ユビキタスに使われている次元減少法である。
しかし、ユーザ定義のパープレキシティパラメータに拘束され、最近開発されたマルチスケールパープレキシティフリーアプローチと比較してDR品質が制限される。
そこで本稿では, パープレキシティチューニングから解放されたマルチスケールパラメトリックt-SNE方式と, マッピングを実装したディープニューラルネットワークを提案する。
論文 参考訳(メタデータ) (2020-10-03T13:47:01Z) - Tackling the Objective Inconsistency Problem in Heterogeneous Federated
Optimization [93.78811018928583]
本稿では、フェデレートされた異種最適化アルゴリズムの収束性を分析するためのフレームワークを提供する。
我々は,高速な誤差収束を保ちながら,客観的な矛盾を解消する正規化平均化手法であるFedNovaを提案する。
論文 参考訳(メタデータ) (2020-07-15T05:01:23Z) - DessiLBI: Exploring Structural Sparsity of Deep Networks via
Differential Inclusion Paths [45.947140164621096]
逆スケール空間の差分包摂に基づく新しい手法を提案する。
DessiLBIが早期に「優勝チケット」を発表することを示す。
論文 参考訳(メタデータ) (2020-07-04T04:40:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。