論文の概要: Improving the Data Efficiency of Multi-Objective Quality-Diversity
through Gradient Assistance and Crowding Exploration
- arxiv url: http://arxiv.org/abs/2302.12668v2
- Date: Tue, 16 May 2023 09:56:52 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-17 18:48:21.509165
- Title: Improving the Data Efficiency of Multi-Objective Quality-Diversity
through Gradient Assistance and Crowding Exploration
- Title(参考訳): 勾配支援と群集探索による多目的品質多様性のデータ効率向上
- Authors: Hannah Janmohamed, Thomas Pierrot, Antoine Cully
- Abstract要約: MOME-PGXは多目的MAP-Elitesを拡張した新しい品質多様性(QD)アルゴリズムである。
MOME-PGXは、勾配に基づく最適化を使用して、より高性能なソリューションを効率的に推進する。また、探索戦略を改善するために、群集ベースのメカニズムも導入している。
MOME-PGXはMOMEの4.3倍から42倍のデータ効率が高く,挑戦環境におけるMOME,NSGA-II,SPEA2の性能を2倍に向上させることを示した。
- 参考スコア(独自算出の注目度): 1.898523691501358
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Quality-Diversity (QD) algorithms have recently gained traction as
optimisation methods due to their effectiveness at escaping local optima and
capability of generating wide-ranging and high-performing solutions. Recently,
Multi-Objective MAP-Elites (MOME) extended the QD paradigm to the
multi-objective setting by maintaining a Pareto front in each cell of a
map-elites grid. MOME achieved a global performance that competed with NSGA-II
and SPEA2, two well-established Multi-Objective Evolutionary Algorithms (MOEA),
while also acquiring a diverse repertoire of solutions. However, MOME is
limited by non-directed genetic search mechanisms which struggle in
high-dimensional search spaces. In this work, we present Multi-Objective
MAP-Elites with Policy-Gradient Assistance and Crowding-based Exploration
(MOME-PGX): a new QD algorithm that extends MOME to improve its data efficiency
and performance. MOME-PGX uses gradient-based optimisation to efficiently drive
solutions towards higher performance. It also introduces crowding-based
mechanisms to create an improved exploration strategy and to encourage
uniformity across Pareto fronts. We evaluate MOME-PGX in four simulated robot
locomotion tasks and demonstrate that it converges faster and to a higher
performance than all other baselines. We show that MOME-PGX is between 4.3 and
42 times more data-efficient than MOME and doubles the performance of MOME,
NSGA-II and SPEA2 in challenging environments.
- Abstract(参考訳): 近年,QDアルゴリズムは,局所最適解の回避と,広範かつ高性能な解を生成する能力により,最適化手法として注目を集めている。
近年,MOME(Multi-Objective MAP-Elites)は,マップエリートグリッドの各セルにParetoフロントを保持することにより,QDパラダイムを多目的設定に拡張した。
MOME は NSGA-II と SPEA2 と競合し、MOEA (Multi-Objective Evolutionary Algorithms) と競合し、様々なソリューションのレパートリーを獲得した。
しかし、MOMEは高次元探索空間で苦労する非間接的な遺伝子探索機構によって制限されている。
本研究では,多目的MAP-Elites with Policy-Gradient Assistance and Crowding-based Exploration (MOME-PGX)を提案する。
MOME-PGXは勾配に基づく最適化を使用して、より高性能なソリューションを効率的に駆動する。
また、群衆ベースのメカニズムを導入し、改良された探索戦略を作成し、パレートフロント全体の統一を促進する。
我々は,MOME-PGXを4つのロボット動作タスクで評価し,他のすべてのベースラインよりも高速に収束し,高い性能を示す。
MOME-PGXはMOMEの4.3倍から42倍のデータ効率が高く,挑戦環境におけるMOME,NSGA-II,SPEA2の性能は2倍である。
関連論文リスト
- Optima: Optimizing Effectiveness and Efficiency for LLM-Based Multi-Agent System [75.25394449773052]
大規模言語モデル (LLM) に基づくマルチエージェントシステム (MAS) は協調的問題解決において顕著な可能性を示している。
通信効率の低下、スケーラビリティの低下、効果的なパラメータ更新方法の欠如などです。
本稿では,コミュニケーション効率とタスク効率を両立させ,これらの課題に対処する新しいフレームワークOptimaを提案する。
論文 参考訳(メタデータ) (2024-10-10T17:00:06Z) - Multiobjective Vehicle Routing Optimization with Time Windows: A Hybrid Approach Using Deep Reinforcement Learning and NSGA-II [52.083337333478674]
本稿では、時間窓を用いた多目的車両ルーティング問題(MOVRPTW)に対処するために、ウェイト・アウェア・ディープ・強化学習(WADRL)手法を提案する。
WADRLの結果を最適化するために非支配的ソート遺伝的アルゴリズム-II (NSGA-II) 法を用いる。
論文 参考訳(メタデータ) (2024-07-18T02:46:06Z) - UCB-driven Utility Function Search for Multi-objective Reinforcement Learning [75.11267478778295]
マルチオブジェクト強化学習(MORL)エージェントでは、意思決定行動の最適化を行う。
重みベクトル w でパラメータ化される線型効用関数の場合に焦点を当てる。
学習過程の異なる段階で最も有望な重みベクトルを効率的に探索する上信頼境界に基づく手法を提案する。
論文 参考訳(メタデータ) (2024-05-01T09:34:42Z) - Real-Time Image Segmentation via Hybrid Convolutional-Transformer Architecture Search [49.81353382211113]
マルチヘッド自己認識を高分解能表現CNNに効率的に組み込むという課題に対処する。
本稿では,高解像度機能の利点をフル活用したマルチターゲットマルチブランチ・スーパーネット手法を提案する。
本稿では,Hybrid Convolutional-Transformer Architecture Search (HyCTAS)法を用いて,軽量畳み込み層とメモリ効率のよい自己保持層を最適に組み合わせたモデルを提案する。
論文 参考訳(メタデータ) (2024-03-15T15:47:54Z) - Enhancing MAP-Elites with Multiple Parallel Evolution Strategies [8.585387103144825]
進化戦略(ES)に基づく新しい品質多様性(QD)アルゴリズムを提案する。
MEMESは複数の(最大100までの)同時ESプロセスを維持しており、それぞれが独立してQD最適化用に設計されている。
ブラックボックス最適化とQD強化学習において,MEMESは勾配に基づくQDアルゴリズムと突然変異に基づくQDアルゴリズムの両方より優れていることを示す。
論文 参考訳(メタデータ) (2023-03-10T18:55:02Z) - Collaborative Intelligent Reflecting Surface Networks with Multi-Agent
Reinforcement Learning [63.83425382922157]
インテリジェント・リフレクション・サーフェス(IRS)は将来の無線ネットワークに広く応用されることが想定されている。
本稿では,エネルギー収穫能力を備えた協調型IRSデバイスを用いたマルチユーザ通信システムについて検討する。
論文 参考訳(メタデータ) (2022-03-26T20:37:14Z) - Enhanced Multi-Objective A* Using Balanced Binary Search Trees [35.63053398687847]
アルゴリズムのような多目的A* (MOA*) は、そのノードに到達した非支配パスを追跡するために、検索中に任意のノードに「フロンティア」セットを保持する。
バランスの取れた二分探索木を利用して,これらのフロンティアを多目的に効率的に維持する手法を提案する。
論文 参考訳(メタデータ) (2022-02-18T02:54:58Z) - Multi-Objective Quality Diversity Optimization [2.4608515808275455]
MOME(Multi-Objective MAP-Elites)の多目的設定におけるMAP-Elitesアルゴリズムの拡張を提案する。
すなわち、MAP-Elitesグリッドアルゴリズムから受け継いだ多様性と、多目的最適化の強みを組み合わせる。
本手法は,標準的な最適化問題からロボットシミュレーションまで,いくつかのタスクで評価する。
論文 参考訳(メタデータ) (2022-02-07T10:48:28Z) - A Simple Evolutionary Algorithm for Multi-modal Multi-objective
Optimization [0.0]
マルチモーダル・多目的最適化問題(MMOP)を解くための定常進化アルゴリズムを提案する。
本報告では,1000関数評価の低計算予算を用いて,様々なテストスイートから得られた21個のMMOPの性能について報告する。
論文 参考訳(メタデータ) (2022-01-18T03:31:11Z) - Learning Space Partitions for Path Planning [54.475949279050596]
PlaLaMは2次元ナビゲーションタスクにおける既存の経路計画手法よりも優れており、特に難解な局所最適化の存在下では優れている。
これらは高マルチモーダルな実世界のタスクに移行し、コンパイラフェーズでは最大245%、分子設計では最大0.4の強いベースラインを0-1スケールで上回ります。
論文 参考訳(メタデータ) (2021-06-19T18:06:11Z) - Evolutionary Gait Transfer of Multi-Legged Robots in Complex Terrains [14.787379075870383]
本稿では、Tr-GOと呼ばれる歩行最適化のための移動学習に基づく進化的フレームワークを提案する。
この考え方は、トランスファーラーニング技術を用いて高品質な人口を初期化することを目的としており、どんな集団ベースの最適化アルゴリズムでもこのフレームワークにシームレスに統合できる。
実験の結果,3つの多目的進化アルゴリズムに基づく歩行最適化問題に対する提案手法の有効性が示された。
論文 参考訳(メタデータ) (2020-12-24T16:41:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。