論文の概要: Optimizing the Unknown: Black Box Bayesian Optimization with Energy-Based Model and Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2510.19530v1
- Date: Wed, 22 Oct 2025 12:36:49 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-25 03:08:15.76208
- Title: Optimizing the Unknown: Black Box Bayesian Optimization with Energy-Based Model and Reinforcement Learning
- Title(参考訳): エネルギーモデルと強化学習を用いたブラックボックスベイズ最適化の最適化
- Authors: Ruiyao Miao, Junren Xiao, Shiya Tsang, Hui Xiong, Yingnian Wu,
- Abstract要約: Black-Box Optimization (BBO) は様々な科学・工学分野で成功を収めている。
本稿では,ガウス過程(GP)を統合したReinforced Energy-based Model for Bayesian Optimization (REBMBO)を提案する。
我々は、REBMBOの優れた性能を確認するために、合成および実世界のベンチマークに関する広範な実験を行う。
- 参考スコア(独自算出の注目度): 42.508822373669936
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Existing Bayesian Optimization (BO) methods typically balance exploration and exploitation to optimize costly objective functions. However, these methods often suffer from a significant one-step bias, which may lead to convergence towards local optima and poor performance in complex or high-dimensional tasks. Recently, Black-Box Optimization (BBO) has achieved success across various scientific and engineering domains, particularly when function evaluations are costly and gradients are unavailable. Motivated by this, we propose the Reinforced Energy-Based Model for Bayesian Optimization (REBMBO), which integrates Gaussian Processes (GP) for local guidance with an Energy-Based Model (EBM) to capture global structural information. Notably, we define each Bayesian Optimization iteration as a Markov Decision Process (MDP) and use Proximal Policy Optimization (PPO) for adaptive multi-step lookahead, dynamically adjusting the depth and direction of exploration to effectively overcome the limitations of traditional BO methods. We conduct extensive experiments on synthetic and real-world benchmarks, confirming the superior performance of REBMBO. Additional analyses across various GP configurations further highlight its adaptability and robustness.
- Abstract(参考訳): 既存のベイズ最適化(BO)手法は、通常、コストのかかる目的関数を最適化するために探索と搾取のバランスをとる。
しかし、これらの手法は大きな1ステップの偏りに悩まされることが多く、複雑なタスクや高次元タスクにおいて局所的な最適性や性能の低下に収束する可能性がある。
近年,ブラックボックス最適化 (BBO) は様々な科学分野や工学分野において成功している。
そこで我々は,ガウス過程(GP)とエネルギーベースモデル(EBM)を統合し,グローバルな構造情報を収集するReinforced Energy-based Model for Bayesian Optimization(REBMBO)を提案する。
特に,各ベイズ最適化イテレーションをマルコフ決定プロセス (MDP) として定義し,適応的な多段階ルックアヘッドにPPO (Proximal Policy Optimization) を用い,探索の深さと方向を動的に調整し,従来のBO手法の限界を効果的に克服する。
我々は、REBMBOの優れた性能を確認するために、合成および実世界のベンチマークに関する広範な実験を行う。
様々なGP構成のさらなる分析は、適応性と堅牢性をさらに強調する。
関連論文リスト
- Divergence Minimization Preference Optimization for Diffusion Model Alignment [66.31417479052774]
Divergence Minimization Preference Optimization (DMPO) は、逆KL分散を最小化して拡散モデルを整列する原理的手法である。
DMPOは、異なるベースモデルとテストセットで既存のテクニックを一貫して上回り、適合させることができる。
論文 参考訳(メタデータ) (2025-07-10T07:57:30Z) - Direct Regret Optimization in Bayesian Optimization [10.705151736050967]
本稿では,最適モデルと非明視的獲得を共同で学習する,新たな直訳最適化手法を提案する。
提案手法はBOベースラインを一貫して上回り,より単純な後悔を減らし,より堅牢な探索を示す。
論文 参考訳(メタデータ) (2025-07-09T04:09:58Z) - Nonmyopic Global Optimisation via Approximate Dynamic Programming [14.389086937116582]
我々はIDWとRBFに基づくグローバルな最適化に適した新しい非筋力的獲得戦略を導入する。
具体的には、ロールアウトやマルチステップシナリオベースの最適化スキームを含む動的プログラミングベースのパラダイムを開発する。
論文 参考訳(メタデータ) (2024-12-06T09:25:00Z) - Batched Bayesian optimization by maximizing the probability of including the optimum [44.38372821900645]
純粋に活用する qPO (multipoint of Optimality) による離散最適化のための獲得戦略を提案する。
提案手法を大規模化学ライブラリのモデル誘導探索に適用し,バッチ化ベイズ最適化における他の最先端手法と競合することを示す実証的証拠を提供する。
論文 参考訳(メタデータ) (2024-10-08T20:13:12Z) - Enhanced Bayesian Optimization via Preferential Modeling of Abstract
Properties [49.351577714596544]
本研究では,非測定抽象特性に関する専門家の嗜好を代理モデルに組み込むための,人間とAIの協調型ベイズフレームワークを提案する。
優先判断において、誤った/誤解を招く専門家バイアスを処理できる効率的な戦略を提供する。
論文 参考訳(メタデータ) (2024-02-27T09:23:13Z) - Large Language Models to Enhance Bayesian Optimization [57.474613739645605]
本稿では,大規模言語モデル(LLM)の能力をベイズ最適化に組み込む新しいアプローチであるLLAMBOを提案する。
高いレベルでは、自然言語のBO問題を枠組み化し、LLMが歴史的評価に照らした有望な解を反復的に提案し、評価することを可能にする。
以上の結果から,LLAMBOはゼロショットウォームスタートに有効であり,サロゲートモデリングや候補サンプリングの促進,特に観察が不十分な場合の探索の初期段階において有効であることが示唆された。
論文 参考訳(メタデータ) (2024-02-06T11:44:06Z) - Poisson Process for Bayesian Optimization [126.51200593377739]
本稿では、Poissonプロセスに基づくランキングベースの代理モデルを提案し、Poisson Process Bayesian Optimization(PoPBO)と呼ばれる効率的なBOフレームワークを提案する。
従来のGP-BO法と比較すると,PoPBOはコストが低く,騒音に対する堅牢性も良好であり,十分な実験により検証できる。
論文 参考訳(メタデータ) (2024-02-05T02:54:50Z) - Learning Regions of Interest for Bayesian Optimization with Adaptive
Level-Set Estimation [84.0621253654014]
本稿では,高信頼領域を適応的にフィルタするBALLETというフレームワークを提案する。
理論的には、BALLETは探索空間を効率的に縮小することができ、標準BOよりも厳密な後悔を示すことができる。
論文 参考訳(メタデータ) (2023-07-25T09:45:47Z) - Sparse Bayesian Optimization [16.867375370457438]
よりスパースで解釈可能な構成を発見できる正規化ベースのアプローチをいくつか提示する。
そこで本研究では,同相連続に基づく新たな微分緩和法を提案し,空間的空間的空間的空間的空間的空間的空間的空間的空間的空間的空間的空間的空間的空間的空間的空間的空間的空間的空間的空間的空間的空間的空間的空間的空間的空間的空間的空間的空間的空間的空間的空間的空間的空間
スパシティのために効率的に最適化できることが示されています。
論文 参考訳(メタデータ) (2022-03-03T18:25:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。