論文の概要: Robust Bayesian Optimisation with Unbounded Corruptions
- arxiv url: http://arxiv.org/abs/2511.15315v1
- Date: Wed, 19 Nov 2025 10:28:56 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-20 15:51:28.758284
- Title: Robust Bayesian Optimisation with Unbounded Corruptions
- Title(参考訳): 非有界破壊を伴うロバストベイズ最適化
- Authors: Abdelhamid Ezzerg, Ilija Bogunovic, Jeremias Knoblauch,
- Abstract要約: 予算は規模ではなく、腐敗の頻度にのみ拘束される新しい敵を紹介します。
RCGP-UCBの安定かつ適応的なバージョンを示し、最大$O(T1/2)$の存在下でサブ線形後悔を達成することを証明した。
外れ値がない場合、RCGP-UCBの後悔境界は標準のGP-UCBアルゴリズムと一致する。
- 参考スコア(独自算出の注目度): 15.861490518746292
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Bayesian Optimization is critically vulnerable to extreme outliers. Existing provably robust methods typically assume a bounded cumulative corruption budget, which makes them defenseless against even a single corruption of sufficient magnitude. To address this, we introduce a new adversary whose budget is only bounded in the frequency of corruptions, not in their magnitude. We then derive RCGP-UCB, an algorithm coupling the famous upper confidence bound (UCB) approach with a Robust Conjugate Gaussian Process (RCGP). We present stable and adaptive versions of RCGP-UCB, and prove that they achieve sublinear regret in the presence of up to $O(T^{1/2})$ and $O(T^{1/3})$ corruptions with possibly infinite magnitude. This robustness comes at near zero cost: without outliers, RCGP-UCB's regret bounds match those of the standard GP-UCB algorithm.
- Abstract(参考訳): ベイズ最適化は極端な外れ値に対して極めて脆弱である。
既存の確固たる手法は、通常、有界な累積的な汚職予算を前提としており、十分な大きさの1つの汚職に対しても無防備である。
そこで本稿では, 予算を規模ではなく, 汚職の頻度に限定した新たな敵を導入する。
次に、ロバスト共役ガウス過程(RCGP)と有名な高信頼境界(UCB)アプローチを結合するアルゴリズムであるRCGP-UCBを導出する。
我々は、RCGP-UCBの安定かつ適応的なバージョンを示し、最大$O(T^{1/2})$と$O(T^{1/3})$汚職の存在下で、おそらく無限大のサブ線形後悔を達成することを証明した。
このロバスト性は、外れ値がなければ、RCGP-UCBの後悔境界は標準のGP-UCBアルゴリズムのそれとほぼ一致する。
関連論文リスト
- Corruption-Robust Algorithms with Uncertainty Weighting for Nonlinear
Contextual Bandits and Markov Decision Processes [59.61248760134937]
本稿では,$tildeO(sqrtT+zeta)$を後悔するアルゴリズムを提案する。
提案アルゴリズムは、最近開発された線形文脈帯域からの不確実性重み付き最小二乗回帰に依存する。
本稿では,提案アルゴリズムをエピソディックなMDP設定に一般化し,まず汚職レベル$zeta$への付加的依存を実現する。
論文 参考訳(メタデータ) (2022-12-12T15:04:56Z) - Nearly Optimal Algorithms for Linear Contextual Bandits with Adversarial
Corruptions [98.75618795470524]
本稿では,敵対的腐敗の存在下での線形文脈的包帯問題について検討する。
我々は不確実性に直面した楽観主義の原理に基づく新しいアルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-05-13T17:58:58Z) - A Robust Phased Elimination Algorithm for Corruption-Tolerant Gaussian
Process Bandits [118.22458816174144]
そこで本稿では,エポックで動作するロバストな除去型アルゴリズムを提案し,探索と頻繁な切替を併用して,小さなアクションサブセットを選択し,各アクションを複数タイミングで実行する。
我々のアルゴリズムであるGP Robust Phased Elimination (RGP-PE) は、探索とエクスプロイトによる汚職に対するロバストネスのバランスに成功している。
GPバンディット設定におけるロバスト性の最初の実証的研究を行い,アルゴリズムが様々な敵攻撃に対してロバストであることを示す。
論文 参考訳(メタデータ) (2022-02-03T21:19:36Z) - Misspecified Gaussian Process Bandit Optimization [59.30399661155574]
カーネル化されたバンディットアルゴリズムは、この問題に対して強い経験的および理論的性能を示した。
本稿では、未知関数を$epsilon$-一様近似で近似できるエンフェミス特定カーネル化帯域設定を、ある再生カーネルヒルベルト空間(RKHS)において有界ノルムを持つ関数で導入する。
提案アルゴリズムは,不特定性に関する事前知識を伴わず,$epsilon$への最適依存を実現する。
論文 参考訳(メタデータ) (2021-11-09T09:00:02Z) - Adversarial Robustness Guarantees for Gaussian Processes [22.403365399119107]
ガウス過程(GP)は、モデルの不確実性の原理的計算を可能にし、安全性に重要なアプリケーションに魅力的です。
境界付き摂動に対するモデル決定の不変性として定義されるGPの対向的堅牢性を分析するためのフレームワークを提案する。
我々は境界を洗練し、任意の$epsilon > 0$に対して、我々のアルゴリズムが有限個の反復で実際の値に$epsilon$-closeの値に収束することを保証していることを示す分岐とバウンドのスキームを開発する。
論文 参考訳(メタデータ) (2021-04-07T15:14:56Z) - Robust Structured Statistical Estimation via Conditional Gradient Type
Methods [25.816720329145102]
条件勾配(CG)型法は、構造化された統計的推定問題を解くためにしばしば用いられる。
本稿では,ハマーの汚職モデルと重み付きデータに対するCG型手法の堅牢化を提案する。
2つのPairwise CG法が安定であること、すなわちエラーを蓄積しないことを示す。
論文 参考訳(メタデータ) (2020-07-07T15:49:31Z) - Stochastic Linear Bandits Robust to Adversarial Attacks [117.665995707568]
我々はロバスト位相除去アルゴリズムの2つの変種を提供し、その1つは$C$を知っており、もう1つはそうでない。
いずれの変種も、倒壊しない場合には、それぞれ$C = 0$ となり、それぞれ追加の加法項が生じる。
文脈的設定では、単純な欲求的アルゴリズムは、明示的な探索を行わず、C$を知らないにもかかわらず、ほぼ最適加法的後悔項で証明可能な堅牢性を示す。
論文 参考訳(メタデータ) (2020-07-07T09:00:57Z) - Corruption-Tolerant Gaussian Process Bandit Optimization [130.60115798580136]
未知(典型的には非生成)関数を有界ノルムで最適化する問題を考察する。
我々は「高速だが非ローバスト」と「スロー」に基づく高速スローGP-UCBに基づくアルゴリズムを提案する。
ある種の依存関係は、汚職レベルによっては要求できない、と我々は主張する。
論文 参考訳(メタデータ) (2020-03-04T09:46:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。