論文の概要: Randomized Gaussian Process Upper Confidence Bound with Tighter Bayesian
Regret Bounds
- arxiv url: http://arxiv.org/abs/2302.01511v2
- Date: Mon, 12 Jun 2023 02:27:53 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-14 01:21:54.898205
- Title: Randomized Gaussian Process Upper Confidence Bound with Tighter Bayesian
Regret Bounds
- Title(参考訳): Tighter Bayesian Regret boundsを用いたランダム化ガウス過程上層信頼境界
- Authors: Shion Takeno, Yu Inatsu, Masayuki Karasuyama
- Abstract要約: 本研究はまず,RGP-UCBの後悔解析をガンマ分布を含むより広範な分布に一般化する。
本稿では,2パラメータ指数分布に基づく改良されたRGP-UCBを提案する。
IRGP-UCBの広汎な実験による有効性を示す。
- 参考スコア(独自算出の注目度): 9.89553853547974
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Gaussian process upper confidence bound (GP-UCB) is a theoretically promising
approach for black-box optimization; however, the confidence parameter $\beta$
is considerably large in the theorem and chosen heuristically in practice.
Then, randomized GP-UCB (RGP-UCB) uses a randomized confidence parameter, which
follows the Gamma distribution, to mitigate the impact of manually specifying
$\beta$. This study first generalizes the regret analysis of RGP-UCB to a wider
class of distributions, including the Gamma distribution. Furthermore, we
propose improved RGP-UCB (IRGP-UCB) based on a two-parameter exponential
distribution, which achieves tighter Bayesian regret bounds. IRGP-UCB does not
require an increase in the confidence parameter in terms of the number of
iterations, which avoids over-exploration in the later iterations. Finally, we
demonstrate the effectiveness of IRGP-UCB through extensive experiments.
- Abstract(参考訳): gaussian process upper confidence bound (gp-ucb) は理論上有望なブラックボックス最適化のアプローチであるが、信頼度パラメータ $\beta$ は定理においてかなり大きく、実際ヒューリスティックに選択される。
次に、ランダム化されたGP-UCB(RGP-UCB)は、ガンマ分布に従うランダム化された信頼パラメータを用いて、手動で$\beta$を指定する影響を軽減する。
本研究はまず,RGP-UCBの後悔解析をガンマ分布を含むより広範な分布に一般化する。
さらに,2パラメータ指数分布に基づく改良されたRGP-UCB(IRGP-UCB)を提案する。
IRGP-UCBは、後続のイテレーションでの過剰探索を避けるため、イテレーション数の観点から信頼性パラメータの増加を必要としない。
最後に,IRGP-UCBの有効性を実験的に検証した。
関連論文リスト
- Data-Driven Upper Confidence Bounds with Near-Optimal Regret for Heavy-Tailed Bandits [0.0]
対称な報酬分布のための分布自由データ駆動型 UCB アルゴリズムを提案する。
パラメータフリーなRMM-UCB法では,重み付き分布であっても,ほぼ最適の残差を証明した。
論文 参考訳(メタデータ) (2024-06-09T10:06:50Z) - Regret Optimality of GP-UCB [12.323109084902228]
ガウス過程 上信頼境界 (GP-UCB) は、ノイズの多い観測でブラックボックス関数を最適化する最も一般的な方法の1つである。
GP-UCB の単純かつ累積的後悔の両面に新たな上限を確立する。
同じレベルの探索で、GP-UCBは単純かつ累積的後悔の両方において、同時に最適性を達成することができる。
論文 参考訳(メタデータ) (2023-12-03T13:20:08Z) - Posterior Sampling-Based Bayesian Optimization with Tighter Bayesian Regret Bounds [22.752728853701083]
ガウス過程上信頼境界(GP-UCB)とトンプソンサンプリング(TS)はベイズ累積後悔(BCR)に関する確立された理論的性質を持つよく知られた選択肢である。
GP-UCBとは異なり,PIMSはより厳密なBCR境界を実現し,ハイパーパラメータチューニングを回避する。
GP-UCB と TS の実践的問題を緩和する PIMS の有効性に着目し,幅広い実験を行った。
論文 参考訳(メタデータ) (2023-11-07T06:54:40Z) - On the Sublinear Regret of GP-UCB [58.25014663727544]
ガウス過程上信頼境界 (GP-UCB) アルゴリズムは, ほぼ最適の後悔率を有することを示す。
私たちの改善は、基盤となるカーネルの滑らかさに比例してカーネルリッジ推定を正規化するという、重要な技術的貢献に依存しています。
論文 参考訳(メタデータ) (2023-07-14T13:56:11Z) - Misspecified Gaussian Process Bandit Optimization [59.30399661155574]
カーネル化されたバンディットアルゴリズムは、この問題に対して強い経験的および理論的性能を示した。
本稿では、未知関数を$epsilon$-一様近似で近似できるエンフェミス特定カーネル化帯域設定を、ある再生カーネルヒルベルト空間(RKHS)において有界ノルムを持つ関数で導入する。
提案アルゴリズムは,不特定性に関する事前知識を伴わず,$epsilon$への最適依存を実現する。
論文 参考訳(メタデータ) (2021-11-09T09:00:02Z) - Likelihood-Free Inference with Deep Gaussian Processes [70.74203794847344]
サーロゲートモデルは、シミュレータ評価の回数を減らすために、可能性のない推論に成功している。
本稿では,より不規則な対象分布を扱えるディープガウス過程(DGP)サロゲートモデルを提案する。
本実験は,DGPがマルチモーダル分布を持つ目的関数上でGPよりも優れ,単調な場合と同等の性能を維持できることを示す。
論文 参考訳(メタデータ) (2020-06-18T14:24:05Z) - Uncertainty quantification using martingales for misspecified Gaussian
processes [52.22233158357913]
本稿では,ガウス過程(GP)の不確定な定量化を,不特定先行条件下で解決する。
マルティンゲール法を用いて未知関数に対する信頼シーケンス(CS)を構築する。
我々のCSは統計的に有効であり、実証的に標準GP法より優れています。
論文 参考訳(メタデータ) (2020-06-12T17:58:59Z) - Randomised Gaussian Process Upper Confidence Bound for Bayesian
Optimisation [60.93091603232817]
改良されたガウス過程上信頼境界(GP-UCB)取得関数を開発した。
これは、分布から探索・探索トレードオフパラメータをサンプリングすることによって行われる。
これにより、期待されるトレードオフパラメータが、関数のベイズ的後悔に縛られることなく、問題によりよく適合するように変更できることが証明される。
論文 参考訳(メタデータ) (2020-06-08T00:28:41Z) - Distributionally Robust Bayesian Quadrature Optimization [60.383252534861136]
確率分布が未知な分布の不確実性の下でBQOについて検討する。
標準的なBQOアプローチは、固定されたサンプル集合が与えられたときの真の期待目標のモンテカルロ推定を最大化する。
この目的のために,新しい後方サンプリングに基づくアルゴリズム,すなわち分布的に堅牢なBQO(DRBQO)を提案する。
論文 参考訳(メタデータ) (2020-01-19T12:00:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。