論文の概要: Robust Bayesian Optimization via Tempered Posteriors
- arxiv url: http://arxiv.org/abs/2601.07094v1
- Date: Sun, 11 Jan 2026 23:34:24 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-13 19:08:01.161553
- Title: Robust Bayesian Optimization via Tempered Posteriors
- Title(参考訳): テーパ後部によるロバストベイズ最適化
- Authors: Jiguang Li, Hengrui Luo,
- Abstract要約: 我々は,局所的不特定条件下での過信を軽減するために,後続更新による頑健なGPベースBOを開発した。
テンパリングが標準の$(=1)$よりも早く、最も好ましい保証は古典的なEI選択の近くで行われることを示す。
- 参考スコア(独自算出の注目度): 1.6042394978941517
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Bayesian optimization (BO) iteratively fits a Gaussian process (GP) surrogate to accumulated evaluations and selects new queries via an acquisition function such as expected improvement (EI). In practice, BO often concentrates evaluations near the current incumbent, causing the surrogate to become overconfident and to understate predictive uncertainty in the region guiding subsequent decisions. We develop a robust GP-based BO via tempered posterior updates, which downweight the likelihood by a power $α\in (0,1]$ to mitigate overconfidence under local misspecification. We establish cumulative regret bounds for tempered BO under a family of generalized improvement rules, including EI, and show that tempering yields strictly sharper worst-case regret guarantees than the standard posterior $(α=1)$, with the most favorable guarantees occurring near the classical EI choice. Motivated by our theoretic findings, we propose a prequential procedure for selecting $α$ online: it decreases $α$ when realized prediction errors exceed model-implied uncertainty and returns $α$ toward one as calibration improves. Empirical results demonstrate that tempering provides a practical yet theoretically grounded tool for stabilizing BO surrogates under localized sampling.
- Abstract(参考訳): ベイズ最適化 (BO) はガウス過程 (GP) に反復的に適合し、累積評価を行い、期待される改善 (EI) のような獲得関数を介して新しいクエリを選択する。
実際には、BOは現時点の現時点に近い評価に集中しており、サロゲートが過信され、その後の決定を導く地域において予測上の不確実性が下されている。
局所的な不特定性の下での過信を軽減するために, パワー$α\in (0,1]$で重み付け可能なGPベースの頑健なBOを開発した。
EIを含む一般化された改善規則の族の下で, 仮設BOの累積後悔境界を定め, 古典的EI選択の近傍で最も有利な保証がなされる標準の$(α=1)$よりも, 仮設リフレッシュが厳格にシャープであることを示す。
提案手法は, 予測誤差がモデルによる不確実性を超えると$α$を減少させ, キャリブレーションが向上するにつれて$α$を1に戻す。
実験結果から, 局部サンプリング下でのBO置換体安定化のための実用的だが理論的に基礎的なツールとして, テンパリングが有効であることが示唆された。
関連論文リスト
- Decision from Suboptimal Classifiers: Excess Risk Pre- and Post-Calibration [52.70324949884702]
バッチ二分決定における近似的後続確率を用いた余剰リスクの定量化を行う。
我々は、再校正のみが後悔のほとんどに対処する体制と、後悔が集団的損失に支配される体制を識別する。
NLP実験では、これらの量によって、より高度なポストトレーニングの期待値が運用コストに値するかどうかが分かる。
論文 参考訳(メタデータ) (2025-03-23T10:52:36Z) - Robust Bayesian Optimization via Localized Online Conformal Prediction [37.549297668783254]
局所化オンライン共形予測に基づくベイズ最適化(LOCBO)を導入する。
LOCBOは局所オンライン共形予測(CP)によりGPモデルを校正する
観測対象関数を保留するLOCBOのイテレートについて理論的性能保証を行う。
論文 参考訳(メタデータ) (2024-11-26T12:45:54Z) - Regret Analysis for Randomized Gaussian Process Upper Confidence Bound [9.967062483758632]
本稿では,GP-UCBの改良型であるGP-UCBのランダム化変異を解析する。
一定の信頼度パラメータを用いたGP-UCBは,線形に増大する累積的後悔を生じさせることを示す。
論文 参考訳(メタデータ) (2024-09-02T06:49:29Z) - Model-Based Epistemic Variance of Values for Risk-Aware Policy Optimization [59.758009422067]
モデルベース強化学習における累積報酬に対する不確実性を定量化する問題を考察する。
我々は、解が値の真後分散に収束する新しい不確実性ベルマン方程式(UBE)を提案する。
本稿では,リスク・サーキングとリスク・アバース・ポリシー最適化のいずれにも適用可能な汎用ポリシー最適化アルゴリズムQ-Uncertainty Soft Actor-Critic (QU-SAC)を導入する。
論文 参考訳(メタデータ) (2023-12-07T15:55:58Z) - U-Calibration: Forecasting for an Unknown Agent [29.3181385170725]
単一のスコアリングルールに対する予測を最適化することは、すべてのエージェントに対して低い後悔を保証できないことを示す。
予測列の最大後悔度に匹敵するU校正と呼ばれる予測を評価するための新しい指標を提案する。
論文 参考訳(メタデータ) (2023-06-30T23:05:26Z) - Sample-Efficient Optimisation with Probabilistic Transformer Surrogates [66.98962321504085]
本稿では,ベイズ最適化における最先端確率変換器の適用可能性について検討する。
トレーニング手順と損失定義から生じる2つの欠点を観察し、ブラックボックス最適化のプロキシとして直接デプロイすることを妨げる。
1)非一様分散点を前処理するBO調整トレーニング,2)予測性能を向上させるために最適な定常点をフィルタする新しい近似後正則整定器トレードオフ精度と入力感度を導入する。
論文 参考訳(メタデータ) (2022-05-27T11:13:17Z) - Regularization Guarantees Generalization in Bayesian Reinforcement
Learning through Algorithmic Stability [48.62272919754204]
ベイズ RL の一般化を、おそらくほぼ正しい (PAC) フレームワークで研究する。
我々の主な貢献は、正規化を加えることで、最適な政策が適切な意味で安定することを示しています。
論文 参考訳(メタデータ) (2021-09-24T07:48:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。