論文の概要: COBRA++: Enhanced COBRA Optimizer with Augmented Surrogate Pool and Reinforced Surrogate Selection
- arxiv url: http://arxiv.org/abs/2601.22624v1
- Date: Fri, 30 Jan 2026 06:27:10 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-02 18:28:15.270739
- Title: COBRA++: Enhanced COBRA Optimizer with Augmented Surrogate Pool and Reinforced Surrogate Selection
- Title(参考訳): COBRA++: 拡張されたサロゲートプールと強化されたサロゲート選択によるCOBRA最適化
- Authors: Zepei Yu, Zhiyang Huang, Hongshu Guo, Yue-Jiao Gong, Zeyuan Ma,
- Abstract要約: 我々は,COBRAを2つの側面で強化する学習型適応戦略(COBRA++)を提案する。
RBFのようなサロゲートとの結合を断ち切るための強化されたサロゲートプールは、モデル多様性と近似能力を高める。
強化学習に基づくオンラインモデル選択ポリシーは、COBRA++の全体的なパフォーマンスを最大化するために訓練される。
- 参考スコア(独自算出の注目度): 13.848873000735416
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: The optimization problems in realistic world present significant challenges onto optimization algorithms, such as the expensive evaluation issue and complex constraint conditions. COBRA optimizer (including its up-to-date variants) is a representative and effective tool for addressing such optimization problems, which introduces 1) RBF surrogate to reduce online evaluation and 2) bi-stage optimization process to alternate search for feasible solution and optimal solution. Though promising, its design space, i.e., surrogate model pool and selection standard, is still manually decided by human expert, resulting in labor-intensive fine-tuning for novel tasks. In this paper, we propose a learning-based adaptive strategy (COBRA++) that enhances COBRA in two aspects: 1) An augmented surrogate pool to break the tie with RBF-like surrogate and hence enhances model diversity and approximation capability; 2) A reinforcement learning-based online model selection policy that empowers efficient and accurate optimization process. The model selection policy is trained to maximize overall performance of COBRA++ across a distribution of constrained optimization problems with diverse properties. We have conducted multi-dimensional validation experiments and demonstrate that COBRA++ achieves substantial performance improvement against vanilla COBRA and its adaptive variant. Ablation studies are provided to support correctness of each design component in COBRA++.
- Abstract(参考訳): 現実世界の最適化問題は、高価な評価問題や複雑な制約条件など、最適化アルゴリズムに重大な課題をもたらす。
COBRAオプティマイザ(最新版を含む)は、このような最適化問題に対処するための代表的で効果的なツールである。
1)RBFは、オンライン評価を減らし、補助する。
2) 実現可能な解と最適解を交互に探索する二段階最適化法。
有望ではあるが、モデルプールと選択標準を補助する設計空間は、まだ人間の専門家によって手作業で決められているため、新しい作業のための労働集約的な微調整がもたらされる。
本稿では,COBRAを2つの側面で強化する学習型適応戦略(COBRA++)を提案する。
1) RBFのようなサロゲートとの結合を断ち切るための強化されたサロゲートプールは、モデル多様性と近似能力を高める。
2)効率的かつ正確な最適化プロセスを支援する強化学習に基づくオンラインモデル選択政策。
モデル選択ポリシーは、様々な特性を持つ制約付き最適化問題の分布におけるCOBRA++の全体的な性能を最大化するために訓練される。
我々は,多次元検証実験を行い,バニラCOBRAとその適応型に対するCOBRA++の大幅な性能向上を実証した。
COBRA++の各デザインコンポーネントの正確性をサポートするためのアブレーション研究が提供されている。
関連論文リスト
- Preference Optimization for Combinatorial Optimization Problems [54.87466279363487]
強化学習(Reinforcement Learning, RL)は、ニューラルネットワーク最適化のための強力なツールとして登場した。
大幅な進歩にもかかわらず、既存のRLアプローチは報酬信号の減少や大規模な行動空間における非効率な探索といった課題に直面している。
統計的比較モデルを用いて定量的報酬信号を定性的選好信号に変換する新しい手法であるPreference Optimizationを提案する。
論文 参考訳(メタデータ) (2025-05-13T16:47:00Z) - Advancing CMA-ES with Learning-Based Cooperative Coevolution for Scalable Optimization [12.899626317088885]
本稿では,先駆的な学習に基づく協調的共進化フレームワークであるLCCを紹介する。
LCCは最適化プロセス中に動的に分解戦略をスケジュールする。
最適化の効率性とリソース消費の観点からは、最先端のベースラインに対して、ある種のアドバンテージを提供する。
論文 参考訳(メタデータ) (2025-04-24T14:09:22Z) - Evolutionary Reinforcement Learning for Interpretable Decision-Making in Supply Chain Management [3.195234044113248]
サプライチェーン管理(SCM)は、ほとんどのAIベースのソリューションの“ブラックボックス”の性質から、高度な最適化手法を採用する上での課題に直面している。
我々は、進化計算と強化学習(RL)を組み合わせた解釈可能な人工知能(IAI)アプローチを用いて、解釈可能な意思決定ポリシーを生成する。
このIAIソリューションは、現代のサプライチェーンの固有の不確実性や振舞いを処理するために特別に設計されたシミュレーションベースの最適化フレームワークに組み込まれている。
論文 参考訳(メタデータ) (2025-04-16T12:28:35Z) - Scaling Combinatorial Optimization Neural Improvement Heuristics with Online Search and Adaptation [0.40964539027092917]
リミテッドロールアウトビームサーチ(Limited Rollout Beam Search, LRBS)を導入する。
LRBSは, 分散性能と大規模問題インスタンスへの一般化の両方を著しく向上させることを示す。
また、事前訓練された改善ポリシーのオフラインおよびオンライン適応に検索戦略を採用し、検索性能を向上させる。
論文 参考訳(メタデータ) (2024-12-13T14:25:27Z) - Learning Joint Models of Prediction and Optimization [56.04498536842065]
Predict-Then-Thenフレームワークは、機械学習モデルを使用して、最適化問題の未知のパラメータを、解決前の機能から予測する。
本稿では,共同予測モデルを用いて観測可能特徴から最適解を直接学習する手法を提案する。
論文 参考訳(メタデータ) (2024-09-07T19:52:14Z) - Generative Adversarial Model-Based Optimization via Source Critic Regularization [25.19579059511105]
本稿ではアダプティブ・ソース・批評家正規化(aSCR)を用いた生成逆モデルに基づく最適化を提案する。
ASCRは、サロゲート関数が信頼できる設計空間の領域に最適化軌道を制約する。
本稿では,aSCRを標準的なベイズ最適化に活用することにより,オフライン生成設計タスクのスイートにおいて,既存の手法よりも優れた性能を発揮することを示す。
論文 参考訳(メタデータ) (2024-02-09T16:43:57Z) - Benchmarking PtO and PnO Methods in the Predictive Combinatorial Optimization Regime [59.27851754647913]
予測最適化(英: Predictive optimization)は、エネルギーコストを意識したスケジューリングや広告予算配分など、多くの現実世界のアプリケーションの正確なモデリングである。
我々は,広告のための新しい産業データセットを含む8つの問題に対して,既存のPtO/PnOメソッド11をベンチマークするモジュラーフレームワークを開発した。
本研究は,8ベンチマーク中7ベンチマークにおいて,PnOアプローチがPtOよりも優れていることを示すが,PnOの設計選択に銀の弾丸は見つからない。
論文 参考訳(メタデータ) (2023-11-13T13:19:34Z) - Advancements in Optimization: Adaptive Differential Evolution with
Diversification Strategy [0.0]
この研究は2次元空間において単目的最適化を採用し、複数の反復で各ベンチマーク関数上でADEDSを実行する。
ADEDSは、多くの局所最適化、プレート型、谷型、伸縮型、ノイズの多い機能を含む様々な最適化課題において、標準Dより一貫して優れている。
論文 参考訳(メタデータ) (2023-10-02T10:05:41Z) - Studying Evolutionary Solution Adaption Using a Flexibility Benchmark Based on a Metal Cutting Process [39.05320053926048]
システム柔軟性のためのバイオインスパイアされたフレームワークの観点から、異なる生産要件を最適化することを検討する。
NSGA-IIの柔軟性は,1)2つのタスクの解を同時に最適化し,より適応性が高いと期待されるソース間の解を得る,2)アクティベートあるいは非アクティベート可能な様々な可能性に対応する,アクティブな非アクティブなジェノタイプという2つの変種によって拡張される。
論文 参考訳(メタデータ) (2023-05-31T12:07:50Z) - Optimizer Amalgamation [124.33523126363728]
私たちは、Amalgamationという新しい問題の研究を動機付けています。"Teacher"アマルガメーションのプールを、より強力な問題固有のパフォーマンスを持つ単一の"学生"にどのように組み合わせるべきなのでしょうか?
まず、勾配降下による解析のプールをアマルガメートする3つの異なるメカニズムを定義する。
また, プロセスの分散を低減するため, 目標を摂動させることでプロセスの安定化を図る。
論文 参考訳(メタデータ) (2022-03-12T16:07:57Z) - Automatically Learning Compact Quality-aware Surrogates for Optimization
Problems [55.94450542785096]
未知パラメータで最適化問題を解くには、未知パラメータの値を予測し、これらの値を用いて問題を解くための予測モデルを学ぶ必要がある。
最近の研究によると、複雑なトレーニングモデルパイプラインのレイヤーとして最適化の問題を含めると、観測されていない意思決定の繰り返しを予測することになる。
我々は,大規模最適化問題の低次元サロゲートモデルを学習することにより,解の質を向上させることができることを示す。
論文 参考訳(メタデータ) (2020-06-18T19:11:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。