論文の概要: Corruption-Tolerant Gaussian Process Bandit Optimization
- arxiv url: http://arxiv.org/abs/2003.01971v1
- Date: Wed, 4 Mar 2020 09:46:58 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-26 12:24:33.677647
- Title: Corruption-Tolerant Gaussian Process Bandit Optimization
- Title(参考訳): 汚損耐性ガウス過程バンディット最適化
- Authors: Ilija Bogunovic, Andreas Krause, Jonathan Scarlett
- Abstract要約: 未知(典型的には非生成)関数を有界ノルムで最適化する問題を考察する。
我々は「高速だが非ローバスト」と「スロー」に基づく高速スローGP-UCBに基づくアルゴリズムを提案する。
ある種の依存関係は、汚職レベルによっては要求できない、と我々は主張する。
- 参考スコア(独自算出の注目度): 130.60115798580136
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We consider the problem of optimizing an unknown (typically non-convex)
function with a bounded norm in some Reproducing Kernel Hilbert Space (RKHS),
based on noisy bandit feedback. We consider a novel variant of this problem in
which the point evaluations are not only corrupted by random noise, but also
adversarial corruptions. We introduce an algorithm Fast-Slow GP-UCB based on
Gaussian process methods, randomized selection between two instances labeled
"fast" (but non-robust) and "slow" (but robust), enlarged confidence bounds,
and the principle of optimism under uncertainty. We present a novel theoretical
analysis upper bounding the cumulative regret in terms of the corruption level,
the time horizon, and the underlying kernel, and we argue that certain
dependencies cannot be improved. We observe that distinct algorithmic ideas are
required depending on whether one is required to perform well in both the
corrupted and non-corrupted settings, and whether the corruption level is known
or not.
- Abstract(参考訳): 雑音フィードバックに基づいて未知の(典型的には非凸)関数を有界ノルムで最適化する問題を再現するケルネルヒルベルト空間(RKHS)において検討する。
本稿では,無作為な雑音によって点評価が損なわれるだけでなく,逆の腐敗も考慮する。
本稿では,ガウス過程法に基づく高速スローGP-UCBアルゴリズム,高速 (非ロバスト) と低 (ロバスト) の2つのインスタンス間のランダム選択,拡張された信頼境界,不確実性の下での楽観主義の原理を紹介する。
我々は, 腐敗レベル, 時間軸, 基礎となるカーネルの観点から, 累積的後悔を上限として, 新たな理論的解析を行い, 特定の依存関係は改善できないと主張する。
腐敗した設定と非腐敗設定の両方でうまく機能するよう要求されるか、腐敗レベルが分かっているかどうかによって異なるアルゴリズムのアイデアが必要であることを観察する。
関連論文リスト
- Near-Optimal Algorithm for Non-Stationary Kernelized Bandits [6.379833644595456]
時変ベイズ最適化(英語版)とも呼ばれる非定常カーネル化バンドイット問題(KB)について検討する。
我々は,2乗指数およびマタン核を持つ非定常KBに対して,アルゴリズムに依存しない最初のリフレッシュローバウンドを示す。
本稿では,ランダムな置換による位相除去を再開する手法を提案する。
論文 参考訳(メタデータ) (2024-10-21T14:28:26Z) - Corruption-Robust Algorithms with Uncertainty Weighting for Nonlinear
Contextual Bandits and Markov Decision Processes [59.61248760134937]
本稿では,$tildeO(sqrtT+zeta)$を後悔するアルゴリズムを提案する。
提案アルゴリズムは、最近開発された線形文脈帯域からの不確実性重み付き最小二乗回帰に依存する。
本稿では,提案アルゴリズムをエピソディックなMDP設定に一般化し,まず汚職レベル$zeta$への付加的依存を実現する。
論文 参考訳(メタデータ) (2022-12-12T15:04:56Z) - Nearly Optimal Algorithms for Linear Contextual Bandits with Adversarial
Corruptions [98.75618795470524]
本稿では,敵対的腐敗の存在下での線形文脈的包帯問題について検討する。
我々は不確実性に直面した楽観主義の原理に基づく新しいアルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-05-13T17:58:58Z) - A Robust Phased Elimination Algorithm for Corruption-Tolerant Gaussian
Process Bandits [118.22458816174144]
そこで本稿では,エポックで動作するロバストな除去型アルゴリズムを提案し,探索と頻繁な切替を併用して,小さなアクションサブセットを選択し,各アクションを複数タイミングで実行する。
我々のアルゴリズムであるGP Robust Phased Elimination (RGP-PE) は、探索とエクスプロイトによる汚職に対するロバストネスのバランスに成功している。
GPバンディット設定におけるロバスト性の最初の実証的研究を行い,アルゴリズムが様々な敵攻撃に対してロバストであることを示す。
論文 参考訳(メタデータ) (2022-02-03T21:19:36Z) - Misspecified Gaussian Process Bandit Optimization [59.30399661155574]
カーネル化されたバンディットアルゴリズムは、この問題に対して強い経験的および理論的性能を示した。
本稿では、未知関数を$epsilon$-一様近似で近似できるエンフェミス特定カーネル化帯域設定を、ある再生カーネルヒルベルト空間(RKHS)において有界ノルムを持つ関数で導入する。
提案アルゴリズムは,不特定性に関する事前知識を伴わず,$epsilon$への最適依存を実現する。
論文 参考訳(メタデータ) (2021-11-09T09:00:02Z) - Lenient Regret and Good-Action Identification in Gaussian Process
Bandits [43.03669155559218]
我々は、あるしきい値を超える関数値が「十分良い」という緩和された最適化基準の下で、ガウス過程(GP)バンディットの問題を研究する。
実用面では、既知のしきい値に従って1つの「良い行動」を見つけることの問題を考えるとともに、しきい値の知識を生かしたいくつかの善行動識別アルゴリズムを導入する。
論文 参考訳(メタデータ) (2021-02-11T01:16:58Z) - An Asymptotically Optimal Primal-Dual Incremental Algorithm for
Contextual Linear Bandits [129.1029690825929]
複数の次元に沿った最先端技術を改善する新しいアルゴリズムを提案する。
非文脈線形帯域の特別な場合において、学習地平線に対して最小限の最適性を確立する。
論文 参考訳(メタデータ) (2020-10-23T09:12:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。