論文の概要: Federated Online Sparse Decision Making
- arxiv url: http://arxiv.org/abs/2202.13448v1
- Date: Sun, 27 Feb 2022 20:34:41 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-01 14:55:37.793482
- Title: Federated Online Sparse Decision Making
- Title(参考訳): フェデレーションオンラインスパース意思決定
- Authors: Chi-Hua Wang, Wenjie Li, Guang Cheng, and Guang Lin
- Abstract要約: textttFedego Lassoは、新しいマルチクライアント・利己的なバンディットポリシー設計に依存している。
提案アルゴリズムの有効性を,合成データセットと実世界のデータセットの両方で実証した。
- 参考スコア(独自算出の注目度): 24.856596181768364
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper presents a novel federated linear contextual bandits model, where
individual clients face different K-armed stochastic bandits with
high-dimensional decision context and coupled through common global parameters.
By leveraging the sparsity structure of the linear reward , a collaborative
algorithm named \texttt{Fedego Lasso} is proposed to cope with the
heterogeneity across clients without exchanging local decision context vectors
or raw reward data. \texttt{Fedego Lasso} relies on a novel multi-client
teamwork-selfish bandit policy design, and achieves near-optimal regrets for
shared parameter cases with logarithmic communication costs. In addition, a new
conceptual tool called federated-egocentric policies is introduced to delineate
exploration-exploitation trade-off. Experiments demonstrate the effectiveness
of the proposed algorithms on both synthetic and real-world datasets.
- Abstract(参考訳): 本稿では,各クライアントが高次元決定コンテキストを持つ異なるK腕確率的帯域に面し,共通グローバルパラメータを介して結合する,新しい線形文脈帯域幅モデルを提案する。
線形報酬の空間構造を活用することにより、局所的な決定コンテキストベクトルや生の報酬データを交換することなく、クライアント間の不均一性に対処するコラボレーティブアルゴリズム「texttt{Fedego Lasso}」を提案する。
\texttt{Fedego Lasso} は、新しいマルチクライアントなチームワーク中心のバンディットポリシー設計に依存し、対数通信コストを持つ共有パラメータケースに対して、ほぼ最適に後悔する。
さらに,フェデレーション・エゴシアン政策と呼ばれる新たな概念ツールを導入して,探査・探査のトレードオフを明確にする。
実験は、合成データと実世界のデータセットの両方における提案アルゴリズムの有効性を実証する。
関連論文リスト
- Federated Natural Policy Gradient Methods for Multi-task Reinforcement
Learning [49.65958529941962]
フェデレート強化学習(RL)は、ローカルデータトラジェクトリを共有することなく、複数の分散エージェントの協調的な意思決定を可能にする。
本研究では,各エージェントがそれぞれのタスクに対応する個別の報酬関数を持つマルチタスク設定について考察する。
我々は、分散された方法で全てのエージェントの割引された全報酬の総和を最大化する、世界的な最適政策を学習する。
論文 参考訳(メタデータ) (2023-11-01T00:15:18Z) - Personalized Federated X -armed Bandit [44.7483638955294]
我々は、フェデレートされた$mathcalX$-armed bandit問題について検討し、フェデレート学習パラダイムにおいて、クライアントの異種局所目的を同時に最適化する。
本手法では,非最適領域を安全に除去すると同時に,非最適領域の偏りはあるが効果的な局所目的評価を通じて協調を奨励する。
論文 参考訳(メタデータ) (2023-10-25T03:11:32Z) - Federated Learning for Heterogeneous Bandits with Unobserved Contexts [0.0]
我々は、未知のコンテキストを持つ多腕コンテキスト包帯のフェデレーション問題について検討する。
線形パラメタライズされた報酬関数に対して,除去に基づくアルゴリズムを提案し,後悔の束縛を証明した。
論文 参考訳(メタデータ) (2023-03-29T22:06:24Z) - Personalizing Federated Learning with Over-the-Air Computations [84.8089761800994]
フェデレートされたエッジ学習は、プライバシー保護の方法で無線ネットワークのエッジにインテリジェンスをデプロイする、有望な技術である。
このような設定の下で、複数のクライアントは、エッジサーバの調整の下でグローバルジェネリックモデルを協調的にトレーニングする。
本稿では,アナログオーバー・ザ・エア計算を用いて通信ボトルネックに対処する分散トレーニングパラダイムを提案する。
論文 参考訳(メタデータ) (2023-02-24T08:41:19Z) - Contextual bandits with concave rewards, and an application to fair
ranking [108.48223948875685]
CBCR (Contextual Bandits with Concave Rewards) に対する反省点のある最初のアルゴリズムを提案する。
我々は,スカラー・リワード問題に対するCBCRの後悔から,新たな縮小を導出した。
推薦の公正さによって動機づけられたCBCRの特別事例として,ランク付けと公正を意識した目的について述べる。
論文 参考訳(メタデータ) (2022-10-18T16:11:55Z) - Straggler-Resilient Personalized Federated Learning [55.54344312542944]
フェデレーション学習は、プライバシと通信の制限を尊重しながら、クライアントの大規模なネットワークに分散されたサンプルからのトレーニングモデルを可能にする。
これら2つのハードルを同時に処理する理論的なスピードアップを保証する新しいアルゴリズム手法を開発した。
提案手法は,すべてのクライアントのデータを用いてグローバルな共通表現を見つけ,各クライアントに対してパーソナライズされたソリューションにつながるパラメータの集合を学習するために,表現学習理論からのアイデアに依存している。
論文 参考訳(メタデータ) (2022-06-05T01:14:46Z) - On the Convergence of Clustered Federated Learning [57.934295064030636]
統合学習システムでは、例えばモバイルデバイスや組織参加者といったクライアントは通常、個人の好みや行動パターンが異なる。
本稿では,クライアントグループと各クライアントを統一最適化フレームワークで活用する,新しい重み付きクライアントベースクラスタリングFLアルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-02-13T02:39:19Z) - Federated Linear Contextual Bandits [17.438169791449834]
Fed-PEは、ローカルな特徴ベクトルや生データを交換することなく、クライアント間の不均一性に対処するために提案されている。
提案アルゴリズムの有効性を,合成データセットと実世界のデータセットの両方で実証した。
論文 参考訳(メタデータ) (2021-10-27T05:18:58Z) - FedChain: Chained Algorithms for Near-Optimal Communication Cost in
Federated Learning [24.812767482563878]
フェデレートラーニング(FL)は、多くのクライアントに分散した異種データ上でモデルをトレーニングする際のコミュニケーションの複雑さを最小限にすることを目的としている。
本稿では,局所的手法と大域的手法の強みを組み合わせたアルゴリズムフレームワークであるFedChainを提案する。
論文 参考訳(メタデータ) (2021-08-16T02:57:06Z) - When and Whom to Collaborate with in a Changing Environment: A
Collaborative Dynamic Bandit Solution [36.76450390135742]
協調バンディットアルゴリズムは、協調フィルタリング技術を用いて、オンラインインタラクティブレコメンデーションにおけるサンプル効率を改善する。
すべての既存の共同バンディット学習ソリューションは、環境に関する定常的な仮定を課します。
我々は,環境変化に対応するための協調型動的バンディットソリューションを開発した。
論文 参考訳(メタデータ) (2021-04-14T22:15:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。