論文の概要: Surrogate-Assisted Search with Competitive Knowledge Transfer for Expensive Optimization
- arxiv url: http://arxiv.org/abs/2408.07176v1
- Date: Tue, 13 Aug 2024 19:38:22 GMT
- ステータス: 処理完了
- システム内更新日: 2024-08-15 14:45:31.874690
- Title: Surrogate-Assisted Search with Competitive Knowledge Transfer for Expensive Optimization
- Title(参考訳): 競争的知識伝達を用いた費用最適化のためのサロゲート支援探索
- Authors: Xiaoming Xue, Yao Hu, Liang Feng, Kai Zhang, Linqi Song, Kay Chen Tan,
- Abstract要約: 重大最適化問題 (EOP) は, 様々な応用に応用されているため, 何十年にもわたって研究の関心が高まりつつある。
多くの高度なサロゲート支援進化アルゴリズム (SAEA) にもかかわらず、これらのアルゴリズムの多くは以前に解決されたタスクから知識を伝達する能力に欠けていた。
様々なSAEAを促進するために,プラグアンドプレイの知識伝達手法を提案する。
- 参考スコア(独自算出の注目度): 39.358699654994965
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Expensive optimization problems (EOPs) have attracted increasing research attention over the decades due to their ubiquity in a variety of practical applications. Despite many sophisticated surrogate-assisted evolutionary algorithms (SAEAs) that have been developed for solving such problems, most of them lack the ability to transfer knowledge from previously-solved tasks and always start their search from scratch, making them troubled by the notorious cold-start issue. A few preliminary studies that integrate transfer learning into SAEAs still face some issues, such as defective similarity quantification that is prone to underestimate promising knowledge, surrogate-dependency that makes the transfer methods not coherent with the state-of-the-art in SAEAs, etc. In light of the above, a plug and play competitive knowledge transfer method is proposed to boost various SAEAs in this paper. Specifically, both the optimized solutions from the source tasks and the promising solutions acquired by the target surrogate are treated as task-solving knowledge, enabling them to compete with each other to elect the winner for expensive evaluation, thus boosting the search speed on the target task. Moreover, the lower bound of the convergence gain brought by the knowledge competition is mathematically analyzed, which is expected to strengthen the theoretical foundation of sequential transfer optimization. Experimental studies conducted on a series of benchmark problems and a practical application from the petroleum industry verify the efficacy of the proposed method. The source code of the competitive knowledge transfer is available at https://github.com/XmingHsueh/SAS-CKT.
- Abstract(参考訳): 重大最適化問題 (EOP) は, 様々な応用に応用されているため, 何十年にもわたって研究の関心が高まりつつある。
このような問題を解決するために開発された多くの高度なサロゲート支援進化アルゴリズム(SAEA)にもかかわらず、これらのアルゴリズムの多くは、これまで解決されたタスクから知識を伝達し、常にゼロから検索を開始する能力に欠けており、悪名高いコールドスタート問題に悩まされている。
トランスファーラーニングをSAEAに統合するいくつかの予備的な研究は、望ましくない知識を過小評価しがちな欠陥類似性の定量化、SAEAにおける最先端技術と整合しないトランスファーメソッドのサロゲート依存性など、いくつかの問題に直面している。
本論文では,様々なSAEAを向上するために,プラグアンドプレイの知識伝達手法を提案する。
具体的には、ソースタスクからの最適化されたソリューションと、ターゲットサロゲートが獲得した有望なソリューションの両方をタスク解決の知識として扱い、両者が競い合うことによって、高価な評価のために勝者を選択することができ、ターゲットタスクの探索速度が向上する。
さらに、知識競争による収束利得の下位境界を数学的に解析し、シーケンシャルトランスファー最適化の理論的基礎を強化することが期待されている。
一連のベンチマーク問題と石油産業の実用化に関する実験研究により,提案手法の有効性が検証された。
競合する知識伝達のソースコードはhttps://github.com/XmingHsueh/SAS-CKTで公開されている。
関連論文リスト
- Towards Sample-Efficiency and Generalization of Transfer and Inverse Reinforcement Learning: A Comprehensive Literature Review [50.67937325077047]
本稿では,転送および逆強化学習(T-IRL)によるRLアルゴリズムのサンプル効率と一般化を実現するための総合的なレビューを行う。
以上の結果から,最近の研究成果の大部分は,人間のループとシム・トゥ・リアル戦略を活用することで,上記の課題に対処していることが示唆された。
IRL構造の下では、経験の少ない移行と、そのようなフレームワークのマルチエージェントおよびマルチインテンション問題への拡張を必要とするトレーニングスキームが近年研究者の優先事項となっている。
論文 参考訳(メタデータ) (2024-11-15T15:18:57Z) - WESE: Weak Exploration to Strong Exploitation for LLM Agents [95.6720931773781]
本稿では,オープンワールド対話型タスクの解法において,LLMエージェントの強化を目的としたWeak Exploration to Strong Exploitation (WESE)を提案する。
WESEは、探究と搾取のプロセスを分離し、費用対効果の弱いエージェントを用いて世界的知識の探索を行う。
次に、獲得した知識を格納し、タスク関連知識を抽出する知識グラフベースの戦略を導入する。
論文 参考訳(メタデータ) (2024-04-11T03:31:54Z) - Diverse Priors for Deep Reinforcement Learning [2.8554857235549753]
強化学習(Reinforcement Learning, RL)では、エージェントは与えられた環境における累積報酬を最大化する。
本稿では、RLの初期値関数に最大値の多様性を組み込むことができる、微妙に設計された先行NNを用いた革新的なアプローチを提案する。
提案手法は,古典的制御問題の解法や一般探索タスクにおいて,従来のランダムな手法と比較して,優れた性能を示した。
論文 参考訳(メタデータ) (2023-10-23T12:33:59Z) - Experience-Based Evolutionary Algorithms for Expensive Optimization [8.466374531816427]
我々は、関連する問題で得られる経験をよりうまく活用することで、ハード最適化の問題を効率的に扱うことができると論じる。
本稿では,コストのかかる問題の最適化効率を高めるために,経験ベースサロゲート支援進化アルゴリズム(SAEA)フレームワークを提案する。
論文 参考訳(メタデータ) (2023-04-09T05:47:14Z) - Learning (Local) Surrogate Loss Functions for Predict-Then-Optimize
Problems [58.954414264760956]
決定焦点学習(Decision-Focused Learning, DFL)は、予測モデルを下流の最適化タスクに調整するためのパラダイムである。
本稿では,(a)最適化問題を解き,一般化可能なブラックボックスオラクルへのアクセスのみを必要とする忠実なタスク固有サロゲートを学習し,(b)勾配で凸し,容易に最適化できる手法を提案する。
論文 参考訳(メタデータ) (2022-03-30T05:46:54Z) - Self-adaptive Multi-task Particle Swarm Optimization [24.72438489328286]
我々は,知識伝達適応戦略,焦点探索戦略,知識導入戦略を通じて,自己適応型マルチタスク粒子群最適化(SaMTPSO)を開発した。
SaMTPSOの結果は3つのEMTOアルゴリズムとパーティクルスウォームアルゴリズムを比較しており、SaMTPSOの優位性を示している。
論文 参考訳(メタデータ) (2021-10-09T06:45:15Z) - Contingency-Aware Influence Maximization: A Reinforcement Learning
Approach [52.109536198330126]
インフルエンス(IM)問題は、インフルエンスの普及を最大化する、ソーシャルネットワーク内のシードノードのサブセットを見つけることを目的としている。
本研究では、招待されたノードがシードであるかどうかが不確実なIM問題(contingency-aware IM)に焦点をあてる。
最初の成功にもかかわらず、より多くのコミュニティへのソリューションの推進における大きな実践上の障害は、欲張りのアルゴリズムの巨大な実行時である。
論文 参考訳(メタデータ) (2021-06-13T16:42:22Z) - Simultaneously Evolving Deep Reinforcement Learning Models using
Multifactorial Optimization [18.703421169342796]
この研究は、関連する強化学習タスクの解決に向けて、複数のDQLモデルを同時に進化させることのできるフレームワークを提案する。
フレームワークの性能を評価するために、徹底的な実験を行い、議論する。
論文 参考訳(メタデータ) (2020-02-25T10:36:57Z) - Transfer Heterogeneous Knowledge Among Peer-to-Peer Teammates: A Model
Distillation Approach [55.83558520598304]
本研究は, モデル蒸留により, 複数の学生間で経験と伝達値関数を再利用する新しい手法を提案する。
また、異種知識を活用するための効率的な通信プロトコルの設計方法について述べる。
提案するフレームワークである学習・指導カテゴリー強化は,学習の進捗を安定化・加速する上で有望な性能を示す。
論文 参考訳(メタデータ) (2020-02-06T11:31:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。