論文の概要: Machine Learning Algorithms for Improving Black Box Optimization Solvers
- arxiv url: http://arxiv.org/abs/2509.25592v1
- Date: Mon, 29 Sep 2025 23:28:42 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-01 14:44:59.96052
- Title: Machine Learning Algorithms for Improving Black Box Optimization Solvers
- Title(参考訳): ブラックボックス最適化問題改善のための機械学習アルゴリズム
- Authors: Morteza Kimiaei, Vyacheslav Kungurtsev,
- Abstract要約: Black-box Optimization (BBO) は、コストのかかるクエリによってのみ目的がアクセス可能な問題に対処する。
近年の進歩は機械学習(ML)と強化学習(RL)を用いてBBOを強化している。
- 参考スコア(独自算出の注目度): 4.994218549120224
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Black-box optimization (BBO) addresses problems where objectives are accessible only through costly queries without gradients or explicit structure. Classical derivative-free methods -- line search, direct search, and model-based solvers such as Bayesian optimization -- form the backbone of BBO, yet often struggle in high-dimensional, noisy, or mixed-integer settings. Recent advances use machine learning (ML) and reinforcement learning (RL) to enhance BBO: ML provides expressive surrogates, adaptive updates, meta-learning portfolios, and generative models, while RL enables dynamic operator configuration, robustness, and meta-optimization across tasks. This paper surveys these developments, covering representative algorithms such as NNs with the modular model-based optimization framework (mlrMBO), zeroth-order adaptive momentum methods (ZO-AdaMM), automated BBO (ABBO), distributed block-wise optimization (DiBB), partition-based Bayesian optimization (SPBOpt), the transformer-based optimizer (B2Opt), diffusion-model-based BBO, surrogate-assisted RL for differential evolution (Surr-RLDE), robust BBO (RBO), coordinate-ascent model-based optimization with relative entropy (CAS-MORE), log-barrier stochastic gradient descent (LB-SGD), policy improvement with black-box (PIBB), and offline Q-learning with Mamba backbones (Q-Mamba). We also review benchmark efforts such as the NeurIPS 2020 BBO Challenge and the MetaBox framework. Overall, we highlight how ML and RL transform classical inexact solvers into more scalable, robust, and adaptive frameworks for real-world optimization.
- Abstract(参考訳): Black-box Optimization (BBO) は、目的がグラデーションや明示的な構造を持たない高価なクエリを通してのみアクセス可能な問題に対処する。
古典的微分自由法 -- 線探索、直接探索、ベイズ最適化のようなモデルに基づく解法 -- は、BBOのバックボーンを形成するが、高次元、ノイズ、混合整数設定でしばしば苦労する。
MLは表現力のあるサロゲート、適応的更新、メタラーニングポートフォリオ、生成モデルを提供し、RLは動的演算子構成、堅牢性、タスク間のメタ最適化を可能にする。
本稿では,モジュール型モデルベース最適化フレームワーク(mlrMBO),ゼロ階適応運動量法(ZO-AdaMM),自動BBO(ABBO),分散ブロックワイド最適化(DiBB),分割型ベイズ最適化(SPBOpt),変圧器ベース最適化(B2Opt),拡散型モデルベースBBO,微分進化のためのサロゲート支援RL(Surr-RLDE),ロバストBBO(RBO),相対エントロピーを用いた座標モデルベース最適化(CAS-MORE),ログバリア確率勾配降下(LB-SGD),ブラックボックス(BBP),オフラインQ-ラーニング(Mam-Qm-Qmbasbasbasbas)などの代表的アルゴリズムについて検討する。
また、NeurIPS 2020 BBO ChallengeやMetaBoxフレームワークといったベンチマークの取り組みもレビューします。
全体として、MLとRLは、従来の不正確な解法を、現実世界の最適化のためによりスケーラブルで堅牢で適応的なフレームワークに変換する方法を強調します。
関連論文リスト
- Intersection of Reinforcement Learning and Bayesian Optimization for Intelligent Control of Industrial Processes: A Safe MPC-based DPG using Multi-Objective BO [0.0]
Model Predictive Control (MPC)ベースのReinforcement Learning (RL)は、Deep Neural Network (DNN)ベースのRL手法の、構造化された解釈可能な代替手段を提供する。
標準MPC-RLアプローチは、収束の遅さ、パラメータ化の制限による最適条件学習、オンライン適応時の安全性の問題に悩まされることが多い。
MPC-RLと多目的ベイズ最適化(MOBO)を統合した新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2025-07-14T02:31:52Z) - BOFormer: Learning to Solve Multi-Objective Bayesian Optimization via Non-Markovian RL [15.127370150885348]
我々は,汎用的なQ-ラーニングフレームワークを提案し,このフレームワークをMOBOのシーケンス・モデリングによりサブスタンス化する textitBOFormer を提案する。
広範な評価により,BOFormerは,ベンチマークルールベースのアルゴリズムや学習ベースのアルゴリズムよりも常に優れていることを示す。
論文 参考訳(メタデータ) (2025-05-28T05:00:50Z) - Reinforcement Learning-based Self-adaptive Differential Evolution through Automated Landscape Feature Learning [7.765689048808507]
本稿ではメタ学習過程における自動特徴学習を支援するメタBBO手法を提案する。
我々は,マティーサ指数に基づく埋め込みを用いたアテンションベースニューラルネットワークを設計し,解人口を変換する。
また、多種多様なDEM演算子を含む包括的アルゴリズム構成空間を強化学習支援DACパラダイムに組み込む。
論文 参考訳(メタデータ) (2025-03-23T13:07:57Z) - Pretrained Optimization Model for Zero-Shot Black Box Optimization [16.391389860521134]
多様なタスクの最適化から得られた知識を活用する事前学習最適化モデル(POM)を提案する。
POMは、直接アプリケーションや数発のサンプルによる微調整を通じて、ゼロショット最適化の効率的なソリューションを提供する。
少数のサンプルと予算を持つ微調整POMは、大幅な性能改善をもたらす。
論文 参考訳(メタデータ) (2024-05-06T09:11:49Z) - Reinforced In-Context Black-Box Optimization [64.25546325063272]
RIBBOは、オフラインデータからエンドツーエンドでBBOアルゴリズムを強化学習する手法である。
RIBBOは、複数の動作アルゴリズムとタスクによって生成される最適化履歴を学習するために、表現的なシーケンスモデルを使用している。
提案手法の中心となるのは,テキストレグレット・ツー・ゴートークンによる最適化履歴の増大である。
論文 参考訳(メタデータ) (2024-02-27T11:32:14Z) - Meta-Learning with Neural Tangent Kernels [58.06951624702086]
メタモデルのニューラルタンジェントカーネル(NTK)によって誘導される再生カーネルヒルベルト空間(RKHS)における最初のメタラーニングパラダイムを提案する。
このパラダイムでは,MAMLフレームワークのように,最適な反復内ループ適応を必要としない2つのメタ学習アルゴリズムを導入する。
本研究の目的は,1) 適応をRKHSの高速適応正則化器に置き換えること,2) NTK理論に基づいて解析的に適応を解くことである。
論文 参考訳(メタデータ) (2021-02-07T20:53:23Z) - Optimization-driven Machine Learning for Intelligent Reflecting Surfaces
Assisted Wireless Networks [82.33619654835348]
インテリジェントサーフェス(IRS)は、個々の散乱素子の位相シフトを制御して無線チャネルを再形成するために用いられる。
散乱素子の規模が大きいため、受動ビームフォーミングは一般に高い計算複雑性によって挑戦される。
本稿では、IRS支援無線ネットワークの性能向上のための機械学習(ML)アプローチに焦点を当てる。
論文 参考訳(メタデータ) (2020-08-29T08:39:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。