論文の概要: Surrogate Ensemble in Expensive Multi-Objective Optimization via Deep Q-Learning
- arxiv url: http://arxiv.org/abs/2602.00540v1
- Date: Sat, 31 Jan 2026 06:14:27 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-03 19:28:33.245775
- Title: Surrogate Ensemble in Expensive Multi-Objective Optimization via Deep Q-Learning
- Title(参考訳): 深部Q-Learningによる重大多目的最適化におけるサロゲートアンサンブル
- Authors: Yuxin Wu, Hongshu Guo, Ting Huang, Yue-Jiao Gong, Zeyuan Ma,
- Abstract要約: サロゲート支援進化アルゴリズム(SAEA)は、高価な最適化問題を解く上で有望な堅牢性を示している。
SAEAsの有効性に影響を与える重要な側面は、モデル選択の代理である。
一つの最適化プロセス内で異なる代理モデルをスケジューリングできるSEEMOOと呼ばれる強化学習支援アンサンブルフレームワークを提案する。
- 参考スコア(独自算出の注目度): 17.84264663466905
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Surrogate-assisted Evolutionary Algorithms~(SAEAs) have shown promising robustness in solving expensive optimization problems. A key aspect that impacts SAEAs' effectiveness is surrogate model selection, which in existing works is predominantly decided by human developer. Such human-made design choice introduces strong bias into SAEAs and may hurt their expected performance on out-of-scope tasks. In this paper, we propose a reinforcement learning-assisted ensemble framework, termed as SEEMOO, which is capable of scheduling different surrogate models within a single optimization process, hence boosting the overall optimization performance in a cooperative paradigm. Specifically, we focus on expensive multi-objective optimization problems, where multiple objective functions shape a compositional landscape and hence challenge surrogate selection. SEEMOO comprises following core designs: 1) A pre-collected model pool that maintains different surrogate models; 2) An attention-based state-extractor supports universal optimization state representation of problems with varied objective numbers; 3) a deep Q-network serves as dynamic surrogate selector: Given the optimization state, it selects desired surrogate model for current-step evaluation. SEEMOO is trained to maximize the overall optimization performance under a training problem distribution. Extensive benchmark results demonstrate SEEMOO's surrogate ensemble paradigm boosts the optimization performance of single-surrogate baselines. Further ablation studies underscore the importance of SEEMOO's design components.
- Abstract(参考訳): Surrogate-assisted Evolutionary Algorithms〜(SAEAs)は、高価な最適化問題を解く上で有望な堅牢性を示している。
SAEAsの有効性に影響を与える重要な側面は、モデル選択の代理である。
このような人為的な設計選択は、SAEAに強いバイアスをもたらし、スコープ外のタスクで期待されるパフォーマンスを損なう可能性がある。
本稿では,1つの最適化プロセス内で異なるサロゲートモデルをスケジューリングできるSEEMOOと呼ばれる強化学習支援アンサンブルフレームワークを提案する。
具体的には,高コストな多目的最適化問題に焦点をあて,複数の目的関数が構成的景観を形作り,従ってサロゲート選択に挑戦する。
SEEMOOは以下のコア設計で構成されている。
1) 異なる代理モデルを維持する事前収集されたモデルプール
2)注目に基づく状態抽出器は,種々の目的数を有する問題の普遍的最適化状態表現を支援する。
3) 深いQネットワークは動的サロゲートセレクタとして機能する: 最適化状態が与えられた場合、現在のステップ評価のために所望のサロゲートモデルを選択する。
SEEMOOは、トレーニング問題分布下での全体的な最適化性能を最大化するために訓練される。
SEEMOOのサロゲートアンサンブルパラダイムは,シングルサロゲートベースラインの最適化性能を向上させる。
さらなるアブレーション研究はSEEMOOの設計要素の重要性を強調している。
関連論文リスト
- Offline Multi-Task Multi-Objective Data-Driven Evolutionary Algorithm with Language Surrogate Model and Implicit Q-Learning [16.52427396199173]
プラグ・アンド・プレイ・サロゲート・モデリング手法としてQ-MetaSurを提案する。
マルチタスク・マルチオブジェクト最適化(MTMOO)をオフライン環境で検討する。
また,Q-MetaSurは,主観的近似精度において,主観的サロゲートベースラインよりも優れていることを示す。
論文 参考訳(メタデータ) (2025-12-17T07:30:11Z) - Benchmarking Generative AI Against Bayesian Optimization for Constrained Multi-Objective Inverse Design [0.15293427903448018]
本稿では,制約付き多目的回帰タスクを解くための生成可能な言語モデル(LLM)の性能について検討する。
最高の性能のLDM(Math-7B)は1.21の世代距離(GD)を達成した。
この知見は, 樹脂, レオロジー, 化学特性の定式化設計の最適化に, 直接工業的応用が期待できる。
論文 参考訳(メタデータ) (2025-10-29T10:37:09Z) - TCPO: Thought-Centric Preference Optimization for Effective Embodied Decision-making [75.29820290660065]
本稿では,効果的な具体的意思決定のための思考中心推論最適化(TCPO)を提案する。
モデルの中間的推論プロセスの整合性を強調し、モデル劣化の問題を緩和する。
ALFWorld環境での実験では、平均成功率は26.67%であり、RL4VLMよりも6%向上している。
論文 参考訳(メタデータ) (2025-09-10T11:16:21Z) - Preference-Guided Diffusion for Multi-Objective Offline Optimization [64.08326521234228]
オフライン多目的最適化のための優先誘導拡散モデルを提案する。
我々の指導は、ある設計が他の設計を支配する確率を予測するために訓練された選好モデルである。
本結果は,多種多様な高品質な解を生成する上での分類器誘導拡散モデルの有効性を浮き彫りにした。
論文 参考訳(メタデータ) (2025-03-21T16:49:38Z) - Bayesian Inverse Transfer in Evolutionary Multiobjective Optimization [29.580786235313987]
InvTrEMO(InvTrEMO)の第1回リバーストランスファー・マルチオブジェクト(InvTrEMO)を紹介する。
InvTrEMOは、決定空間がタスク間で正確に整合していない場合でも、多くの一般的な領域で共通の目的関数を利用する。
InvTrEMOは、高い精度の逆モデルを重要な副産物とし、オンデマンドで調整されたソリューションの生成を可能にする。
論文 参考訳(メタデータ) (2023-12-22T14:12:18Z) - Studying Evolutionary Solution Adaption Using a Flexibility Benchmark Based on a Metal Cutting Process [39.05320053926048]
システム柔軟性のためのバイオインスパイアされたフレームワークの観点から、異なる生産要件を最適化することを検討する。
NSGA-IIの柔軟性は,1)2つのタスクの解を同時に最適化し,より適応性が高いと期待されるソース間の解を得る,2)アクティベートあるいは非アクティベート可能な様々な可能性に対応する,アクティブな非アクティブなジェノタイプという2つの変種によって拡張される。
論文 参考訳(メタデータ) (2023-05-31T12:07:50Z) - Backpropagation of Unrolled Solvers with Folded Optimization [55.04219793298687]
ディープネットワークにおけるコンポーネントとしての制約付き最適化モデルの統合は、多くの専門的な学習タスクに有望な進歩をもたらした。
1つの典型的な戦略はアルゴリズムのアンローリングであり、これは反復解法の操作による自動微分に依存している。
本稿では,非ロール最適化の後方通過に関する理論的知見を提供し,効率よく解けるバックプロパゲーション解析モデルを生成するシステムに繋がる。
論文 参考訳(メタデータ) (2023-01-28T01:50:42Z) - Optimization-Inspired Learning with Architecture Augmentations and
Control Mechanisms for Low-Level Vision [74.9260745577362]
本稿では,GDC(Generative, Discriminative, and Corrective)の原則を集約する,最適化に着想を得た統合学習フレームワークを提案する。
フレキシブルな組み合わせで最適化モデルを効果的に解くために,3つのプロパゲーティブモジュールを構築した。
低レベル視覚タスクにおける実験は、GDCの有効性と適応性を検証する。
論文 参考訳(メタデータ) (2020-12-10T03:24:53Z) - Automatically Learning Compact Quality-aware Surrogates for Optimization
Problems [55.94450542785096]
未知パラメータで最適化問題を解くには、未知パラメータの値を予測し、これらの値を用いて問題を解くための予測モデルを学ぶ必要がある。
最近の研究によると、複雑なトレーニングモデルパイプラインのレイヤーとして最適化の問題を含めると、観測されていない意思決定の繰り返しを予測することになる。
我々は,大規模最適化問題の低次元サロゲートモデルを学習することにより,解の質を向上させることができることを示す。
論文 参考訳(メタデータ) (2020-06-18T19:11:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。