論文の概要: Distributed Thompson sampling under constrained communication
- arxiv url: http://arxiv.org/abs/2410.15543v2
- Date: Mon, 09 Dec 2024 17:12:13 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-10 14:50:10.202426
- Title: Distributed Thompson sampling under constrained communication
- Title(参考訳): 制約通信下における分散トンプソンサンプリング
- Authors: Saba Zerefa, Zhaolin Ren, Haitong Ma, Na Li,
- Abstract要約: ガウス過程を代理モデルとして用いた分散トンプソンサンプリングをマルチエージェントベイズ最適化問題に適用する。
分散トンプソンサンプリング実装では、各エージェントが隣人からサンプルポイントを受け取り、そこで通信ネットワークはグラフに符号化される。
ベイズ平均後悔(Bayes average regret)とベイズ平均後悔(Bayes average regret)は、通信グラフの構造に依存する。
- 参考スコア(独自算出の注目度): 5.184819201210698
- License:
- Abstract: In Bayesian optimization, a black-box function is maximized via the use of a surrogate model. We apply distributed Thompson sampling, using a Gaussian process as a surrogate model, to approach the multi-agent Bayesian optimization problem. In our distributed Thompson sampling implementation, each agent receives sampled points from neighbors, where the communication network is encoded in a graph; each agent utilizes their own Gaussian process to model the objective function. We demonstrate theoretical bounds on Bayesian simple regret and Bayesian average regret, where the bound depends on the structure of the communication graph. Unlike in batch Bayesian optimization, this bound is applicable in cases where the communication graph amongst agents is constrained. When compared to sequential single-agent Thompson sampling, our bound guarantees faster convergence with respect to time as long as the communication graph is connected. We confirm the efficacy of our algorithm with numerical simulations on traditional optimization test functions, illustrating the significance of graph connectivity on improving regret convergence.
- Abstract(参考訳): ベイズ最適化では、サロゲートモデルを用いてブラックボックス関数を最大化する。
本稿では,ガウス過程を代理モデルとして用いた分散トンプソンサンプリングを適用し,マルチエージェントベイズ最適化問題にアプローチする。
分散トンプソンサンプリング実装では、各エージェントが隣人からサンプリングされた点を受信し、通信ネットワークをグラフに符号化し、各エージェントはそれぞれのガウス過程を用いて目的関数をモデル化する。
ベイズ平均後悔(Bayes average regret)とベイズ平均後悔(Bayes average regret)は、通信グラフの構造に依存する。
バッチベイズ最適化とは異なり、この境界はエージェント間の通信グラフが制約される場合に適用される。
逐次単エージェントトンプソンサンプリングと比較すると、通信グラフが接続されている限り、時間に関してより高速な収束が保証される。
本稿では,従来の最適化テスト関数に対する数値シミュレーションによるアルゴリズムの有効性を検証し,残差収束を改善する上でのグラフ接続の重要性について述べる。
関連論文リスト
- Distributed Markov Chain Monte Carlo Sampling based on the Alternating
Direction Method of Multipliers [143.6249073384419]
本論文では,乗算器の交互方向法に基づく分散サンプリング手法を提案する。
我々は,アルゴリズムの収束に関する理論的保証と,その最先端性に関する実験的証拠の両方を提供する。
シミュレーションでは,線形回帰タスクとロジスティック回帰タスクにアルゴリズムを配置し,その高速収束を既存の勾配法と比較した。
論文 参考訳(メタデータ) (2024-01-29T02:08:40Z) - Diffusion Stochastic Optimization for Min-Max Problems [33.73046548872663]
楽観的勾配法はミニマックス最適化問題に対処するのに有用である。
従来のバージョンでは大きなバッチサイズが必要であり,Samevareps-generativeOGOGと呼ばれる新しい定式化を導入,解析する。
論文 参考訳(メタデータ) (2024-01-26T01:16:59Z) - On diffusion-based generative models and their error bounds: The log-concave case with full convergence estimates [5.13323375365494]
我々は,強い対数対数データの下での拡散に基づく生成モデルの収束挙動を理論的に保証する。
スコア推定に使用される関数のクラスは、スコア関数上のリプシッツネスの仮定を避けるために、リプシッツ連続関数からなる。
この手法はサンプリングアルゴリズムにおいて最もよく知られた収束率をもたらす。
論文 参考訳(メタデータ) (2023-11-22T18:40:45Z) - On Regret-optimal Cooperative Nonstochastic Multi-armed Bandits [7.23389716633927]
我々は,FTRLアルゴリズムが,下界を一定要素に整合した個々の後悔の上界を有することを示す。
また、エッジ遅延パラメータによるスケーリングに関して、適切な正規化器を持つFTRLアルゴリズムが最適であることを示す。
論文 参考訳(メタデータ) (2022-11-30T16:46:41Z) - Langevin Monte Carlo for Contextual Bandits [72.00524614312002]
Langevin Monte Carlo Thompson Sampling (LMC-TS) が提案されている。
提案アルゴリズムは,文脈的帯域幅の特別な場合において,最高のトンプソンサンプリングアルゴリズムと同じサブ線形残差を達成できることを示す。
論文 参考訳(メタデータ) (2022-06-22T17:58:23Z) - Surrogate modeling for Bayesian optimization beyond a single Gaussian
process [62.294228304646516]
本稿では,探索空間の活用と探索のバランスをとるための新しいベイズ代理モデルを提案する。
拡張性のある関数サンプリングを実現するため、GPモデル毎にランダムな特徴ベースのカーネル近似を利用する。
提案した EGP-TS を大域的最適に収束させるため,ベイズ的後悔の概念に基づいて解析を行う。
論文 参考訳(メタデータ) (2022-05-27T16:43:10Z) - Forward Operator Estimation in Generative Models with Kernel Transfer
Operators [37.999297683250575]
本定式化により,高効率な分布近似とサンプリングが可能となり,驚くほど優れた実験性能が得られることを示す。
また、このアルゴリズムは小さなサンプルサイズ設定(脳画像)でも良好に動作することを示す。
論文 参考訳(メタデータ) (2021-12-01T06:54:31Z) - Adaptive Sampling for Best Policy Identification in Markov Decision
Processes [79.4957965474334]
本稿では,学習者が生成モデルにアクセスできる場合の,割引マルコフ決定(MDP)における最良の政治的識別の問題について検討する。
最先端アルゴリズムの利点を論じ、解説する。
論文 参考訳(メタデータ) (2020-09-28T15:22:24Z) - Bandit Samplers for Training Graph Neural Networks [63.17765191700203]
グラフ畳み込みネットワーク(GCN)の訓練を高速化するために, ばらつきを低減したサンプリングアルゴリズムが提案されている。
これらのサンプリングアルゴリズムは、グラフ注意ネットワーク(GAT)のような固定重みよりも学習重量を含む、より一般的なグラフニューラルネットワーク(GNN)には適用できない。
論文 参考訳(メタデータ) (2020-06-10T12:48:37Z) - Global Optimization of Gaussian processes [52.77024349608834]
少数のデータポイントで学習したガウス過程を訓練した空間定式化を提案する。
このアプローチはまた、より小さく、計算的にもより安価なサブソルバを低いバウンディングに導く。
提案手法の順序の順序による時間収束を,総じて低減する。
論文 参考訳(メタデータ) (2020-05-21T20:59:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。