論文の概要: Adaptive operator selection utilising generalised experience
- arxiv url: http://arxiv.org/abs/2401.05350v1
- Date: Mon, 4 Dec 2023 00:27:59 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-15 09:11:17.563842
- Title: Adaptive operator selection utilising generalised experience
- Title(参考訳): 一般化経験を利用した適応演算子選択
- Authors: Mehmet Emin Aydin, Rafet Durgut and Abdur Rakib
- Abstract要約: 強化学習(Reinforcement Learning, RL)は, 高度に効果的な適応的な選択システムをカスタマイズし, 形成する方法として提案されている。
本稿では,RLをベースとした新たなアプローチを提案し,今後の利用経験の獲得,処理,活用のための汎用的なフレームワークの開発を支援する。
- 参考スコア(独自算出の注目度): 0.8287206589886879
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Optimisation problems, particularly combinatorial optimisation problems, are
difficult to solve due to their complexity and hardness. Such problems have
been successfully solved by evolutionary and swarm intelligence algorithms,
especially in binary format. However, the approximation may suffer due to the
the issues in balance between exploration and exploitation activities (EvE),
which remain as the major challenge in this context. Although the complementary
usage of multiple operators is becoming more popular for managing EvE with
adaptive operator selection schemes, a bespoke adaptive selection system is
still an important topic in research. Reinforcement Learning (RL) has recently
been proposed as a way to customise and shape up a highly effective adaptive
selection system. However, it is still challenging to handle the problem in
terms of scalability. This paper proposes and assesses a RL-based novel
approach to help develop a generalised framework for gaining, processing, and
utilising the experiences for both the immediate and future use. The
experimental results support the proposed approach with a certain level of
success.
- Abstract(参考訳): 最適化問題、特に組合せ最適化問題は、その複雑さと難しさのために解決が難しい。
このような問題は進化的および群知能アルゴリズム、特にバイナリ形式によってうまく解決された。
しかしながら、この近似は探索と搾取活動(eve)のバランスの問題により、この文脈では依然として大きな課題となっている。
適応演算子選択スキームによるeve管理では,複数演算子の補完的利用が普及しているが,研究において,個別適応選択方式が重要なトピックである。
強化学習(rl)は、高度に効果的な適応選択システムをカスタマイズし形成する方法として最近提案されている。
しかし、スケーラビリティという点では、この問題を扱うことは依然として困難である。
本稿では,RLをベースとした新たなアプローチを提案し,今後の利用経験の獲得,処理,活用のための汎用フレームワークの開発を支援する。
実験結果は,提案手法を一定の成功度で支持する。
関連論文リスト
- Learning Joint Models of Prediction and Optimization [56.04498536842065]
Predict-Then-Thenフレームワークは、機械学習モデルを使用して、最適化問題の未知のパラメータを、解決前の機能から予測する。
本稿では,共同予測モデルを用いて観測可能特徴から最適解を直接学習する手法を提案する。
論文 参考訳(メタデータ) (2024-09-07T19:52:14Z) - Learning from Offline and Online Experiences: A Hybrid Adaptive Operator Selection Framework [2.148882675821217]
本稿では,オフライン体験とオンライン体験を効果的に組み合わせることに焦点を当てる。
探索演算子を動的かつ適応的に選択する新しいハイブリッドフレームワークを提案する。
論文 参考訳(メタデータ) (2024-04-16T03:08:02Z) - Constrained Multi-objective Optimization with Deep Reinforcement Learning Assisted Operator Selection [28.088046969822543]
本研究では,Deep Reinforcement Learningを支援するオンラインオペレータ選択フレームワークを提案する。
提案手法は,現在の状況に応じて個体群の改善を最大化する演算子を適応的に選択することができる。
このフレームワークは4つの人気のあるCMOEAに組み込まれ、42のベンチマーク問題で評価されている。
論文 参考訳(メタデータ) (2024-01-15T09:51:19Z) - Analyzing and Enhancing the Backward-Pass Convergence of Unrolled
Optimization [50.38518771642365]
ディープネットワークにおけるコンポーネントとしての制約付き最適化モデルの統合は、多くの専門的な学習タスクに有望な進歩をもたらした。
この設定における中心的な課題は最適化問題の解によるバックプロパゲーションであり、しばしば閉形式を欠いている。
本稿では, 非線形最適化の後方通過に関する理論的知見を提供し, 特定の反復法による線形システムの解と等価であることを示す。
Folded Optimizationと呼ばれるシステムが提案され、非ローリングなソルバ実装からより効率的なバックプロパゲーションルールを構築する。
論文 参考訳(メタデータ) (2023-12-28T23:15:18Z) - Graph Reinforcement Learning for Operator Selection in the ALNS
Metaheuristic [0.0]
我々はマルコフ決定過程として作用素の選択を定式化する。
本稿では,ディープ強化学習とグラフニューラルネットワークに基づく実践的アプローチを提案する。
論文 参考訳(メタデータ) (2023-02-28T15:39:42Z) - Backpropagation of Unrolled Solvers with Folded Optimization [55.04219793298687]
ディープネットワークにおけるコンポーネントとしての制約付き最適化モデルの統合は、多くの専門的な学習タスクに有望な進歩をもたらした。
1つの典型的な戦略はアルゴリズムのアンローリングであり、これは反復解法の操作による自動微分に依存している。
本稿では,非ロール最適化の後方通過に関する理論的知見を提供し,効率よく解けるバックプロパゲーション解析モデルを生成するシステムに繋がる。
論文 参考訳(メタデータ) (2023-01-28T01:50:42Z) - Learning Adaptive Evolutionary Computation for Solving Multi-Objective
Optimization Problems [3.3266268089678257]
本稿では, 深層強化学習(DRL)を用いた適応パラメータ制御とMOEAを統合したフレームワークを提案する。
DRLポリシは、最適化中のソリューションに対する突然変異の強度と確率を決定する値を適応的に設定するように訓練されている。
学習されたポリシーは転送可能であることを示す。つまり、単純なベンチマーク問題で訓練されたポリシーは、複雑な倉庫最適化問題を解決するために直接適用可能である。
論文 参考訳(メタデータ) (2022-11-01T22:08:34Z) - Socio-cognitive Optimization of Time-delay Control Problems using
Evolutionary Metaheuristics [89.24951036534168]
メタヒューリスティックス(Metaheuristics)は、古典的なアプローチでは解決できない難解な問題を解くために使用される普遍的な最適化アルゴリズムである。
本稿では,キャストに基づく新しい社会認知メタヒューリスティックの構築を目標とし,このアルゴリズムのいくつかのバージョンを時間遅延システムモデルの最適化に適用する。
論文 参考訳(メタデータ) (2022-10-23T22:21:10Z) - An Interactive Knowledge-based Multi-objective Evolutionary Algorithm
Framework for Practical Optimization Problems [5.387300498478744]
本稿では,対話型知識に基づく進化的多目的最適化(IK-EMO)フレームワークを提案する。
ハイパフォーマンスなソリューションの進化から知識として隠れた変数関係を抽出し、フィードバックを受け取るためにユーザと共有し、その効率を改善するために最適化プロセスに適用する。
提案したIK-EMOの動作は、3つの大規模な実世界のエンジニアリング設計問題で実証されている。
論文 参考訳(メタデータ) (2022-09-18T16:51:01Z) - Bilevel Optimization for Differentially Private Optimization in Energy
Systems [53.806512366696275]
本稿では,入力に敏感な制約付き最適化問題に対して,差分プライバシーを適用する方法について検討する。
本稿は, 自然仮定の下では, 大規模非線形最適化問題に対して, 双レベルモデルを効率的に解けることを示す。
論文 参考訳(メタデータ) (2020-01-26T20:15:28Z) - Optimizing Wireless Systems Using Unsupervised and
Reinforced-Unsupervised Deep Learning [96.01176486957226]
無線ネットワークにおけるリソース割り当てとトランシーバーは、通常最適化問題の解決によって設計される。
本稿では,変数最適化と関数最適化の両問題を解くための教師なし・教師なし学習フレームワークを紹介する。
論文 参考訳(メタデータ) (2020-01-03T11:01:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。