論文の概要: Gaussian Process Upper Confidence Bound Achieves Nearly-Optimal Regret in Noise-Free Gaussian Process Bandits
- arxiv url: http://arxiv.org/abs/2502.19006v1
- Date: Wed, 26 Feb 2025 10:10:51 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-27 14:56:59.448959
- Title: Gaussian Process Upper Confidence Bound Achieves Nearly-Optimal Regret in Noise-Free Gaussian Process Bandits
- Title(参考訳): ガウス過程上信頼境界がノイズフリーガウス過程帯域のほぼ最適回帰を達成する
- Authors: Shogo Iwazaki,
- Abstract要約: ノイズフリーGP-UCBのほぼ最適残響上限を示す。
具体的には、二乗指数核とマタン核のノイズフリー設定において、最初の一定の累積的後悔を示す。
- 参考スコア(独自算出の注目度): 3.6985338895569204
- License:
- Abstract: We study the noise-free Gaussian Process (GP) bandits problem, in which the learner seeks to minimize regret through noise-free observations of the black-box objective function lying on the known reproducing kernel Hilbert space (RKHS). Gaussian process upper confidence bound (GP-UCB) is the well-known GP-bandits algorithm whose query points are adaptively chosen based on the GP-based upper confidence bound score. Although several existing works have reported the practical success of GP-UCB, the current theoretical results indicate its suboptimal performance. However, GP-UCB tends to perform well empirically compared with other nearly optimal noise-free algorithms that rely on a non-adaptive sampling scheme of query points. This paper resolves this gap between theoretical and empirical performance by showing the nearly optimal regret upper bound of noise-free GP-UCB. Specifically, our analysis shows the first constant cumulative regret in the noise-free settings for the squared exponential kernel and Mat\'ern kernel with some degree of smoothness.
- Abstract(参考訳): 学習者は、既知の再生カーネルヒルベルト空間(RKHS)上にあるブラックボックス目的関数のノイズフリーな観測を通して、後悔を最小限に抑えようとする。
ガウス過程上信頼バウンダリ(GP-UCB)は、GPに基づく上信頼バウンダリスコアに基づいて、クエリポイントを適応的に選択するよく知られたGP帯域幅アルゴリズムである。
いくつかの既存の研究がGP-UCBの実用的成功を報告しているが、現在の理論的結果は、その準最適性能を示している。
しかし、GP-UCBは、クエリポイントの非適応サンプリング方式に依存する他のほぼ最適なノイズフリーアルゴリズムと比較して、経験的にうまく機能する傾向にある。
本稿では, 雑音のないGP-UCBのほぼ最適残差上限を示すことにより, 理論的性能と経験的性能のギャップを解消する。
具体的には、二乗指数核とMat\'ern核に対する雑音のない設定において、ある程度の滑らかさで最初の一定の累積的後悔を示す。
関連論文リスト
- Improved Regret Analysis in Gaussian Process Bandits: Optimality for Noiseless Reward, RKHS norm, and Non-Stationary Variance [6.379833644595456]
我々は,未知の報酬関数の下で後悔を最小限に抑えることを目標とするガウス過程(GP)バンドイット問題について検討する。
本稿では,GPの雑音分散パラメータの依存性を改善するために,最大後方分散の新たな上限を示す。
MVR と PE に基づくアルゴリズムは雑音分散依存的後悔の上界を達成でき、これは我々の後悔の低い下界と一致する。
論文 参考訳(メタデータ) (2025-02-10T11:29:27Z) - On Improved Regret Bounds In Bayesian Optimization with Gaussian Noise [2.250251490529229]
BOアルゴリズムの収束解析は、目的のためのベイズ的および頻繁な設定の下での累積的後悔に焦点を当てている。
我々はガウス雑音の頻繁な設定の下で,GPの予測誤差に新たな点を定めている。
GP-UCB と GP-TS の累積後悔結合の収束率の改善を証明した。
論文 参考訳(メタデータ) (2024-12-25T05:57:27Z) - Regret Optimality of GP-UCB [12.323109084902228]
ガウス過程 上信頼境界 (GP-UCB) は、ノイズの多い観測でブラックボックス関数を最適化する最も一般的な方法の1つである。
GP-UCB の単純かつ累積的後悔の両面に新たな上限を確立する。
同じレベルの探索で、GP-UCBは単純かつ累積的後悔の両方において、同時に最適性を達成することができる。
論文 参考訳(メタデータ) (2023-12-03T13:20:08Z) - On the Sublinear Regret of GP-UCB [58.25014663727544]
ガウス過程上信頼境界 (GP-UCB) アルゴリズムは, ほぼ最適の後悔率を有することを示す。
私たちの改善は、基盤となるカーネルの滑らかさに比例してカーネルリッジ推定を正規化するという、重要な技術的貢献に依存しています。
論文 参考訳(メタデータ) (2023-07-14T13:56:11Z) - Clipped Stochastic Methods for Variational Inequalities with
Heavy-Tailed Noise [64.85879194013407]
単調なVIPと非単調なVIPの解法における信頼度に対数的依存を持つ最初の高確率結果が証明された。
この結果は光尾の場合で最もよく知られたものと一致し,非単調な構造問題に新鮮である。
さらに,多くの実用的な定式化の勾配雑音が重く,クリッピングによりSEG/SGDAの性能が向上することを示す。
論文 参考訳(メタデータ) (2022-06-02T15:21:55Z) - Regret Bounds for Expected Improvement Algorithms in Gaussian Process
Bandit Optimization [63.8557841188626]
期待されている改善(EI)アルゴリズムは、不確実性の下で最適化するための最も一般的な戦略の1つである。
本稿では,GP予測平均を通した標準既存値を持つEIの変種を提案する。
我々のアルゴリズムは収束し、$mathcal O(gamma_TsqrtT)$の累積後悔境界を達成することを示す。
論文 参考訳(メタデータ) (2022-03-15T13:17:53Z) - Misspecified Gaussian Process Bandit Optimization [59.30399661155574]
カーネル化されたバンディットアルゴリズムは、この問題に対して強い経験的および理論的性能を示した。
本稿では、未知関数を$epsilon$-一様近似で近似できるエンフェミス特定カーネル化帯域設定を、ある再生カーネルヒルベルト空間(RKHS)において有界ノルムを持つ関数で導入する。
提案アルゴリズムは,不特定性に関する事前知識を伴わず,$epsilon$への最適依存を実現する。
論文 参考訳(メタデータ) (2021-11-09T09:00:02Z) - High Probability Complexity Bounds for Non-Smooth Stochastic Optimization with Heavy-Tailed Noise [51.31435087414348]
アルゴリズムが高い確率で小さな客観的残差を与えることを理論的に保証することが不可欠である。
非滑らか凸最適化の既存の方法は、信頼度に依存した複雑性境界を持つ。
そこで我々は,勾配クリッピングを伴う2つの手法に対して,新たなステップサイズルールを提案する。
論文 参考訳(メタデータ) (2021-06-10T17:54:21Z) - Corruption-Tolerant Gaussian Process Bandit Optimization [130.60115798580136]
未知(典型的には非生成)関数を有界ノルムで最適化する問題を考察する。
我々は「高速だが非ローバスト」と「スロー」に基づく高速スローGP-UCBに基づくアルゴリズムを提案する。
ある種の依存関係は、汚職レベルによっては要求できない、と我々は主張する。
論文 参考訳(メタデータ) (2020-03-04T09:46:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。