論文の概要: No-Regret Algorithms for Time-Varying Bayesian Optimization
- arxiv url: http://arxiv.org/abs/2102.06296v1
- Date: Thu, 11 Feb 2021 22:35:32 GMT
- ステータス: 処理完了
- システム内更新日: 2021-02-15 18:15:52.935554
- Title: No-Regret Algorithms for Time-Varying Bayesian Optimization
- Title(参考訳): 時間変動ベイズ最適化のためのノレグレットアルゴリズム
- Authors: Xingyu Zhou and Ness Shroff
- Abstract要約: 我々は,時間変動環境を捉えるために,一般変動予算モデルを採用する。
R-GP-UCBとSW-GP-UCBの2つのGP-UCB型アルゴリズムを紹介します。
この結果は,線形カーネルを用いた場合の先行線形バンディット結果を回復するだけでなく,時間変動ガウス過程バンディットの先行後悔解析を補完するものである。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this paper, we consider the time-varying Bayesian optimization problem.
The unknown function at each time is assumed to lie in an RKHS (reproducing
kernel Hilbert space) with a bounded norm. We adopt the general variation
budget model to capture the time-varying environment, and the variation is
characterized by the change of the RKHS norm. We adapt the restart and sliding
window mechanism to introduce two GP-UCB type algorithms: R-GP-UCB and
SW-GP-UCB, respectively. We derive the first (frequentist) regret guarantee on
the dynamic regret for both algorithms. Our results not only recover previous
linear bandit results when a linear kernel is used, but complement the previous
regret analysis of time-varying Gaussian process bandit under a Bayesian-type
regularity assumption, i.e., each function is a sample from a Gaussian process.
- Abstract(参考訳): 本稿では,時変ベイズ最適化問題を考察する。
各時点の未知の関数は、有界ノルムを持つ RKHS (再生核ヒルベルト空間) にあると仮定される。
時変環境を捉えるために,一般変動予算モデルを採用し,その変動はRKHS基準の変更によって特徴づけられる。
R-GP-UCBとSW-GP-UCBの2種類のGP-UCB型アルゴリズムを導入した。
両アルゴリズムの動的後悔に対する最初の(頻繁な)後悔の保証を導き出す。
この結果は,線形カーネルを用いた場合の先行線形バンディット結果を復元するだけでなく,ベイズ型正規性仮定の下での時間変動ガウス過程バンディットの先行後悔解析,すなわち各関数はガウス過程からのサンプルである。
関連論文リスト
- On the Sublinear Regret of GP-UCB [58.25014663727544]
ガウス過程上信頼境界 (GP-UCB) アルゴリズムは, ほぼ最適の後悔率を有することを示す。
私たちの改善は、基盤となるカーネルの滑らかさに比例してカーネルリッジ推定を正規化するという、重要な技術的貢献に依存しています。
論文 参考訳(メタデータ) (2023-07-14T13:56:11Z) - Sharp Variance-Dependent Bounds in Reinforcement Learning: Best of Both
Worlds in Stochastic and Deterministic Environments [48.96971760679639]
マルコフ決定過程(MDP)の分散依存的後悔境界について検討する。
環境の微細な分散特性を特徴付けるための2つの新しい環境規範を提案する。
モデルに基づく手法では、MVPアルゴリズムの変種を設計する。
特に、この境界は極小かつ決定論的 MDP に対して同時に最適である。
論文 参考訳(メタデータ) (2023-01-31T06:54:06Z) - Regret Bounds for Expected Improvement Algorithms in Gaussian Process
Bandit Optimization [63.8557841188626]
期待されている改善(EI)アルゴリズムは、不確実性の下で最適化するための最も一般的な戦略の1つである。
本稿では,GP予測平均を通した標準既存値を持つEIの変種を提案する。
我々のアルゴリズムは収束し、$mathcal O(gamma_TsqrtT)$の累積後悔境界を達成することを示す。
論文 参考訳(メタデータ) (2022-03-15T13:17:53Z) - Misspecified Gaussian Process Bandit Optimization [59.30399661155574]
カーネル化されたバンディットアルゴリズムは、この問題に対して強い経験的および理論的性能を示した。
本稿では、未知関数を$epsilon$-一様近似で近似できるエンフェミス特定カーネル化帯域設定を、ある再生カーネルヒルベルト空間(RKHS)において有界ノルムを持つ関数で導入する。
提案アルゴリズムは,不特定性に関する事前知識を伴わず,$epsilon$への最適依存を実現する。
論文 参考訳(メタデータ) (2021-11-09T09:00:02Z) - Weighted Gaussian Process Bandits for Non-stationary Environments [30.49357960656324]
We developed WGP-UCB, a novel UCB-type algorithm based on weighted Gaussian process regression。
鍵となる課題は、無限次元の特徴写像を扱う方法である。
重み付き最大情報ゲインに対して、普遍的上界と重み依存上界を提供する。
論文 参考訳(メタデータ) (2021-07-06T03:37:33Z) - Hierarchical Non-Stationary Temporal Gaussian Processes With
$L^1$-Regularization [11.408721072077604]
我々は、明示的に構築された非定常共分散関数と微分方程式に基づく2つのよく使われるNSGP構成を考える。
これらのNSGPは、スパース性を誘導するために、プロセスに$L1$-regularizationを含めることで拡張する。
結果の正規化NSGP(R-NSGP)回帰問題を解決するために,乗算器の交互方向法(ADMM)に基づく手法を開発した。
論文 参考訳(メタデータ) (2021-05-20T12:15:33Z) - Convergence of adaptive algorithms for weakly convex constrained
optimization [59.36386973876765]
モローエンベロープの勾配のノルムに対して$mathcaltilde O(t-1/4)$収束率を証明する。
我々の分析では、最小バッチサイズが1ドル、定数が1位と2位のモーメントパラメータが1ドル、そしておそらくスムーズな最適化ドメインで機能する。
論文 参考訳(メタデータ) (2020-06-11T17:43:19Z) - Regret and Belief Complexity Trade-off in Gaussian Process Bandits via
Information Thresholding [42.669970064867556]
GPバンディットアルゴリズムの残差境界と後部分布の複雑さのトレードオフを特徴付ける方法を示す。
大域的最適化に応用したGPバンディットアルゴリズムの精度と複雑性のトレードオフを観察する。
論文 参考訳(メタデータ) (2020-03-23T21:05:15Z) - Optimal Randomized First-Order Methods for Least-Squares Problems [56.05635751529922]
このアルゴリズムのクラスは、最小二乗問題に対する最も高速な解法のうち、いくつかのランダム化手法を含んでいる。
我々は2つの古典的埋め込み、すなわちガウス射影とアダマール変換のサブサンプリングに焦点を当てる。
得られたアルゴリズムは条件数に依存しない最小二乗問題の解法として最も複雑である。
論文 参考訳(メタデータ) (2020-02-21T17:45:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。