Fugu-MT 論文翻訳(概要): Bandit optimisation of functions in the Mat\'ern kernel RKHS

論文の概要: Bandit optimisation of functions in the Mat\'ern kernel RKHS

arxiv url: http://arxiv.org/abs/2001.10396v2
Date: Mon, 2 Mar 2020 14:50:32 GMT
ステータス: 翻訳完了
システム内更新日: 2023-01-06 02:05:07.219408
Title: Bandit optimisation of functions in the Mat\'ern kernel RKHS
Title（参考訳）: Mat\'ern kernel RKHSにおける関数の帯域最適化
Authors: David Janz, David R. Burt, Javier Gonz\'alez
Abstract要約: 我々は,Mt'ernカーネルの再生カーネルヒルベルト空間(RKHS)における関数の最適化に関する問題を,雑音フィードバックの下での領域上の滑らか度パラメータ$nu$[0,1]d$で考える。我々の貢献である$pi$-GP-UCBアルゴリズムは、すべての$nu>1$と$d geq 1$に対して保証されたサブ線形後悔を伴う最初の実践的アプローチである。
参考スコア（独自算出の注目度）: 14.051419173519308
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: We consider the problem of optimising functions in the reproducing kernel Hilbert space (RKHS) of a Mat\'ern kernel with smoothness parameter $\nu$ over the domain $[0,1]^d$ under noisy bandit feedback. Our contribution, the $\pi$-GP-UCB algorithm, is the first practical approach with guaranteed sublinear regret for all $\nu>1$ and $d \geq 1$. Empirical validation suggests better performance and drastically improved computational scalablity compared with its predecessor, Improved GP-UCB.
Abstract（参考訳）: 雑音帯域のフィードバックを受ける領域 $[0,1]^d$ 上で滑らか性パラメータ $\nu$ を持つ mat\'ern 核の再生核ヒルベルト空間 (rkhs) における関数の最適化の問題を考える。我々の貢献である$\pi$-GP-UCBアルゴリズムは、すべての$\nu>1$と$d \geq 1$に対して保証されたサブ線形後悔を伴う最初の実践的アプローチである。実験による検証では、前任のGP-UCBに比べて性能が向上し、計算精度が大幅に向上した。

関連論文リスト

Nearly Minimax Optimal Regret for Learning Linear Mixture Stochastic Shortest Path [80.60592344361073]
線形混合遷移カーネルを用いた最短経路(SSP)問題について検討する。エージェントは繰り返し環境と対話し、累積コストを最小化しながら特定の目標状態に到達する。既存の作業は、イテレーションコスト関数の厳密な下限や、最適ポリシーに対する期待長の上限を仮定することが多い。
論文参考訳（メタデータ） (2024-02-14T07:52:00Z)
Gradient-free optimization of highly smooth functions: improved analysis and a new algorithm [87.22224691317766]
この研究は、目的関数が極めて滑らかであるという仮定の下で、ゼロ次ノイズオラクル情報による問題を研究する。ゼロオーダー射影勾配勾配アルゴリズムを2種類検討する。
論文参考訳（メタデータ） (2023-06-03T17:05:13Z)
On Convergence of Incremental Gradient for Non-Convex Smooth Functions [63.51187646914962]
機械学習とネットワーク最適化では、ミスの数と優れたキャッシュを最小化するため、シャッフルSGDのようなアルゴリズムが人気である。本稿では任意のデータ順序付けによる収束特性SGDアルゴリズムについて述べる。
論文参考訳（メタデータ） (2023-05-30T17:47:27Z)
Lower Bounds on the Worst-Case Complexity of Efficient Global Optimization [11.523746174066702]
我々は、その対応する再生核ヒルベルト空間(RKHS)における球の計量エントロピーの観点から、効率的な大域最適化の複雑さに対する統一された下界を導出する。この下界は、一般に使用される2乗指数核とマタン核の非適応探索アルゴリズムによって達成された上界にほぼ一致することを示す。
論文参考訳（メタデータ） (2022-09-20T11:57:13Z)
Misspecified Gaussian Process Bandit Optimization [59.30399661155574]
カーネル化されたバンディットアルゴリズムは、この問題に対して強い経験的および理論的性能を示した。本稿では、未知関数を$epsilon$-一様近似で近似できるエンフェミス特定カーネル化帯域設定を、ある再生カーネルヒルベルト空間(RKHS)において有界ノルムを持つ関数で導入する。提案アルゴリズムは,不特定性に関する事前知識を伴わず,$epsilon$への最適依存を実現する。
論文参考訳（メタデータ） (2021-11-09T09:00:02Z)
Gaussian Process Bandit Optimization with Few Batches [49.896920704012395]
有限腕バンディットアルゴリズムにインスパイアされたバッチアルゴリズムを導入する。 O(log T)$ batches in time horizon $T$.sqrtTgamma_T)$ using $O(log T)$ batches in time horizon。さらに,アルゴリズムの修正版を提案し,バッチ数によって後悔がどう影響するかを特徴付ける。
論文参考訳（メタデータ） (2021-10-15T00:54:04Z)
Ada-BKB: Scalable Gaussian Process Optimization on Continuous Domain by Adaptive Discretization [21.859940486704264]
GPUCBのようなアルゴリズムは計算の複雑さを禁止している。関数のノアアルゴリズムは、連続最適化の真の問題を裏付ける。
論文参考訳（メタデータ） (2021-06-16T07:55:45Z)
Bayesian Optimistic Optimisation with Exponentially Decaying Regret [58.02542541410322]
現在の実用的なBOアルゴリズムは、$mathcalO(fraclogNsqrtN)$から$mathcalO(e-sqrtN)$まで、$N$は評価の数である。本稿では,boと木に基づく楽観的楽観化の概念を絡み合うことにより,無音環境における後悔を改善できる可能性について検討する。次数$mathcal O(N-sqrt)で指数的再帰を達成できる最初の実践的手法であるBOOアルゴリズムを提案する。
論文参考訳（メタデータ） (2021-05-10T13:07:44Z)
Multi-Scale Zero-Order Optimization of Smooth Functions in an RKHS [19.252319300590653]
ブラックボックス関数 $f:mathcalX mapto mathbbR$ は、$f$がよりスムーズで、与えられたカーネル $K$ に関連する RKHS の有界ノルムを持つという仮定の下で最適化される。本稿では,H の局所多項式 (LP) 推定器を用いて通常の GP 代理モデルを拡張した新しいアルゴリズム (textttLP-GP-UCB) を提案する。
論文参考訳（メタデータ） (2020-05-11T01:55:39Z)
Tight Regret Bounds for Bayesian Optimization in One Dimension [47.51554144092745]
ガウス過程とガウスサンプリングノイズの下で,ベイズ最適化(BO)の問題を一次元で考察する。我々は、カーネル上のかなり穏やかな技術的仮定の下で、最大$T$は$Omega(sqrtT)$および$O(sqrtTlog T)$として振る舞う。
論文参考訳（メタデータ） (2018-05-30T03:33:37Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。