論文の概要: Hybrid Reinforcement Learning Framework for Mixed-Variable Problems
- arxiv url: http://arxiv.org/abs/2405.20500v1
- Date: Thu, 30 May 2024 21:42:33 GMT
- ステータス: 処理完了
- システム内更新日: 2024-06-03 18:05:15.014494
- Title: Hybrid Reinforcement Learning Framework for Mixed-Variable Problems
- Title(参考訳): 混合変数問題に対するハイブリッド強化学習フレームワーク
- Authors: Haoyan Zhai, Qianli Hu, Jiangning Chen,
- Abstract要約: 離散変数選択のためのRLと連続変数調整のためのベイズ最適化を組み合わせたハイブリッド強化学習(RL)フレームワークを提案する。
提案手法は,従来のRL,ランダム探索,スタンドアローンベイズ最適化を有効性と効率で常に上回っている。
- 参考スコア(独自算出の注目度): 0.7146036252503987
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Optimization problems characterized by both discrete and continuous variables are common across various disciplines, presenting unique challenges due to their complex solution landscapes and the difficulty of navigating mixed-variable spaces effectively. To Address these challenges, we introduce a hybrid Reinforcement Learning (RL) framework that synergizes RL for discrete variable selection with Bayesian Optimization for continuous variable adjustment. This framework stands out by its strategic integration of RL and continuous optimization techniques, enabling it to dynamically adapt to the problem's mixed-variable nature. By employing RL for exploring discrete decision spaces and Bayesian Optimization to refine continuous parameters, our approach not only demonstrates flexibility but also enhances optimization performance. Our experiments on synthetic functions and real-world machine learning hyperparameter tuning tasks reveal that our method consistently outperforms traditional RL, random search, and standalone Bayesian optimization in terms of effectiveness and efficiency.
- Abstract(参考訳): 離散変数と連続変数の両方によって特徴づけられる最適化問題は、様々な分野に共通しており、複雑な解のランドスケープと混合変数空間を効果的にナビゲートすることの難しさにより、固有の課題が提示される。
これらの課題に対処するために、離散変数選択のためのRLと連続変数調整のためのベイズ最適化を相乗化するハイブリッド強化学習(RL)フレームワークを導入する。
このフレームワークは、RLと継続的最適化の戦略的統合で際立っている。
離散的な決定空間を探索するためのRLと連続パラメータを洗練するためのベイズ最適化を用いることで、我々のアプローチは柔軟性を示すだけでなく、最適化性能も向上する。
合成関数と実世界の機械学習ハイパーパラメータチューニングタスクに関する実験により,従来のRL,ランダム探索,スタンドアローンベイズ最適化を効率と効率で一貫した性能向上を実現した。
関連論文リスト
- Integrating Chaotic Evolutionary and Local Search Techniques in Decision Space for Enhanced Evolutionary Multi-Objective Optimization [1.8130068086063336]
本稿では,SOMMOP(Single-Objective Multi-Modal Optimization)とMOO(Multi-Objective Optimization)の両方に焦点を当てる。
SOMMOPではニッチ技術とカオス進化を統合し,ガウス突然変異を併用したパーシスタンス・クラスタリングを行った。
MOOでは,これらの手法を不確実性に基づく選択,適応的チューニングを組み込んだ包括的フレームワークに拡張し,決定論的群集に半径(R)の概念を導入する。
論文 参考訳(メタデータ) (2024-11-12T15:18:48Z) - FADAS: Towards Federated Adaptive Asynchronous Optimization [56.09666452175333]
フェデレートラーニング(FL)は、プライバシ保護機械学習のトレーニングパラダイムとして広く採用されている。
本稿では、非同期更新を適応的フェデレーション最適化と証明可能な保証に組み込む新しい手法であるFADASについて紹介する。
提案アルゴリズムの収束率を厳格に確立し,FADASが他の非同期FLベースラインよりも優れていることを示す実験結果を得た。
論文 参考訳(メタデータ) (2024-07-25T20:02:57Z) - Combining Automated Optimisation of Hyperparameters and Reward Shape [7.407166175374958]
本稿では,ハイパーパラメータと報酬関数を組み合わせた最適化手法を提案する。
近似ポリシー最適化とソフト・アクター・クリティカルを用いた広範囲な実験を行った。
以上の結果から,統合最適化は環境の半分のベースライン性能よりも有意に向上し,他の環境との競争性能も向上することが示された。
論文 参考訳(メタデータ) (2024-06-26T12:23:54Z) - HarmoDT: Harmony Multi-Task Decision Transformer for Offline Reinforcement Learning [72.25707314772254]
本稿では,各タスクに対するパラメータの最適な調和部分空間を特定するための新しいソリューションであるHarmoDT(Harmony Multi-Task Decision Transformer)を紹介する。
このフレームワークの上位レベルは、調和部分空間を規定するタスク固有のマスクの学習に特化しており、内部レベルは、統一されたポリシーの全体的なパフォーマンスを高めるためにパラメータの更新に重点を置いている。
論文 参考訳(メタデータ) (2024-05-28T11:41:41Z) - Gradient Based Hybridization of PSO [1.1059341532498634]
Particle Swarm Optimization (PSO) は、過去30年間にわたって、強力なメタヒューリスティックなグローバル最適化アプローチとして現れてきた。
PSOは、単一目的シナリオにおける早期の停滞や、探索と搾取のバランスを取る必要性といった課題に直面している。
多様なパラダイムから確立された最適化手法と協調的な性質を統合することでPSOをハイブリダイズすることは、有望な解決策となる。
論文 参考訳(メタデータ) (2023-12-15T11:26:36Z) - Bayesian Quality-Diversity approaches for constrained optimization
problems with mixed continuous, discrete and categorical variables [0.3626013617212667]
シミュレーション予算の制限という観点から,混合変数に基づく新しい品質多様性手法を提案する。
提案手法は、複雑なシステム設計のための意思決定者にとって貴重なトレードオフを提供する。
論文 参考訳(メタデータ) (2023-09-11T14:29:47Z) - Backpropagation of Unrolled Solvers with Folded Optimization [55.04219793298687]
ディープネットワークにおけるコンポーネントとしての制約付き最適化モデルの統合は、多くの専門的な学習タスクに有望な進歩をもたらした。
1つの典型的な戦略はアルゴリズムのアンローリングであり、これは反復解法の操作による自動微分に依存している。
本稿では,非ロール最適化の後方通過に関する理論的知見を提供し,効率よく解けるバックプロパゲーション解析モデルを生成するシステムに繋がる。
論文 参考訳(メタデータ) (2023-01-28T01:50:42Z) - Reinforcement Learning for Flexibility Design Problems [77.37213643948108]
フレキシビリティ設計問題に対する強化学習フレームワークを開発した。
実験の結果、RL法は古典的手法よりも優れた解を常に見出すことがわかった。
論文 参考訳(メタデータ) (2021-01-02T02:44:39Z) - EOS: a Parallel, Self-Adaptive, Multi-Population Evolutionary Algorithm
for Constrained Global Optimization [68.8204255655161]
EOSは実数値変数の制約付きおよび制約なし問題に対する大域的最適化アルゴリズムである。
これはよく知られた微分進化(DE)アルゴリズムに多くの改良を加えている。
その結果、EOSisは、最先端の単一人口自己適応Dアルゴリズムと比較して高い性能を達成可能であることが証明された。
論文 参考訳(メタデータ) (2020-07-09T10:19:22Z) - Automatically Learning Compact Quality-aware Surrogates for Optimization
Problems [55.94450542785096]
未知パラメータで最適化問題を解くには、未知パラメータの値を予測し、これらの値を用いて問題を解くための予測モデルを学ぶ必要がある。
最近の研究によると、複雑なトレーニングモデルパイプラインのレイヤーとして最適化の問題を含めると、観測されていない意思決定の繰り返しを予測することになる。
我々は,大規模最適化問題の低次元サロゲートモデルを学習することにより,解の質を向上させることができることを示す。
論文 参考訳(メタデータ) (2020-06-18T19:11:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。