論文の概要: Scaling MAP-Elites to Deep Neuroevolution
- arxiv url: http://arxiv.org/abs/2003.01825v3
- Date: Fri, 5 Jun 2020 15:59:15 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-26 21:42:11.233277
- Title: Scaling MAP-Elites to Deep Neuroevolution
- Title(参考訳): 深部神経進化へのMAP-Elitesのスケーリング
- Authors: C\'edric Colas, Joost Huizinga, Vashisht Madhavan, Jeff Clune
- Abstract要約: 本稿では、進化戦略(ES)の効率を利用してMAP-Elitesを大規模ニューラルネットワークでパラメータ化した高次元コントローラに拡張することを提案する。
我々は,ME-ESが高次元制御タスクにおける最先端探索アルゴリズムと同等に効率的な探索を行うことを示す。
- 参考スコア(独自算出の注目度): 5.332714036560255
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Quality-Diversity (QD) algorithms, and MAP-Elites (ME) in particular, have
proven very useful for a broad range of applications including enabling real
robots to recover quickly from joint damage, solving strongly deceptive maze
tasks or evolving robot morphologies to discover new gaits. However, present
implementations of MAP-Elites and other QD algorithms seem to be limited to
low-dimensional controllers with far fewer parameters than modern deep neural
network models. In this paper, we propose to leverage the efficiency of
Evolution Strategies (ES) to scale MAP-Elites to high-dimensional controllers
parameterized by large neural networks. We design and evaluate a new hybrid
algorithm called MAP-Elites with Evolution Strategies (ME-ES) for post-damage
recovery in a difficult high-dimensional control task where traditional ME
fails. Additionally, we show that ME-ES performs efficient exploration, on par
with state-of-the-art exploration algorithms in high-dimensional control tasks
with strongly deceptive rewards.
- Abstract(参考訳): 特にqd(quality-diversity)アルゴリズムやmap-elites(me)は、実際のロボットが関節損傷から素早く回復できるようにしたり、強い欺きの迷路タスクを解決したり、ロボット形態を進化させて新たな歩行を発見したりするなど、幅広いアプリケーションで非常に有用であることが証明されている。
しかし、MAP-Elitesや他のQDアルゴリズムの実装は、現代のディープニューラルネットワークモデルよりもはるかに少ないパラメータを持つ低次元コントローラに限られているようである。
本稿では,進化戦略(ES)の効率を利用してMAP-Elitesを大規模ニューラルネットワークでパラメータ化した高次元コントローラに拡張することを提案する。
従来のmeが故障する難易度の高い高次元制御タスクにおいて,map-elites with evolution strategy (me-es) と呼ばれる新しいハイブリッドアルゴリズムを設計,評価した。
さらに,ME-ESは高次元制御タスクにおける最先端探索アルゴリズムと同等の効率な探索を行うことを示す。
関連論文リスト
- Massive Dimensions Reduction and Hybridization with Meta-heuristics in Deep Learning [0.24578723416255746]
ヒストグラムに基づく微分進化(HBDE)は、パラメータを最適化するために勾配に基づくアルゴリズムと勾配のないアルゴリズムをハイブリダイズする。
HBDEは、CIFAR-10とCIFAR-100データセットに基づいて評価されたベースライン勾配と親勾配のないDEMアルゴリズムより優れている。
論文 参考訳(メタデータ) (2024-08-13T20:28:20Z) - Robust Analysis of Multi-Task Learning Efficiency: New Benchmarks on Light-Weighed Backbones and Effective Measurement of Multi-Task Learning Challenges by Feature Disentanglement [69.51496713076253]
本稿では,既存のMTL手法の効率性に焦点をあてる。
バックボーンを小さくしたメソッドの大規模な実験と,MetaGraspNetデータセットを新しいテストグラウンドとして実施する。
また,MTLにおける課題の新規かつ効率的な識別子として,特徴分散尺度を提案する。
論文 参考訳(メタデータ) (2024-02-05T22:15:55Z) - tnGPS: Discovering Unknown Tensor Network Structure Search Algorithms via Large Language Models (LLMs) [31.69308712027795]
本研究では,大規模言語モデルを用いてテンソルネットワーク構造探索(TN-SS)アルゴリズムの自動探索を行う。
人間の研究者による研究の革新を観察することにより,tnGPSと呼ばれる自動アルゴリズム発見フレームワークを提案する。
提案するフレームワークは、LCMに反復的な改良と拡張を通じて新しいTN-SSアルゴリズムを生成するよう指示する精巧なプロンプトパイプラインである。
論文 参考訳(メタデータ) (2024-02-04T12:06:13Z) - EPIM: Efficient Processing-In-Memory Accelerators based on Epitome [78.79382890789607]
畳み込みのような機能を提供する軽量神経オペレータであるEpitomeを紹介する。
ソフトウェア側では,PIMアクセラレータ上でのエピトームのレイテンシとエネルギを評価する。
ハードウェア効率を向上させるため,PIM対応層設計手法を提案する。
論文 参考訳(メタデータ) (2023-11-12T17:56:39Z) - Evolving Populations of Diverse RL Agents with MAP-Elites [1.5575376673936223]
政策だけでなく,任意の強化学習(RL)アルゴリズムの利用を可能にするフレキシブルなフレームワークを導入する。
我々は,多数のロボット制御問題に対する広範な数値実験を通じて,我々のフレームワークがもたらすメリットを実証する。
論文 参考訳(メタデータ) (2023-03-09T19:05:45Z) - Training Diverse High-Dimensional Controllers by Scaling Covariance
Matrix Adaptation MAP-Annealing [12.90845054806193]
シミュレーションでさまざまなニューラルネットワークコントローラを事前トレーニングすることで、ロボットはロボットの移動タスクの損傷にオンラインで適応することが可能になった。
進化戦略(ES)に基づく品質多様性アルゴリズムであるCMA-MAEは、これらの制限を持たず、標準的なQDベンチマークで最先端のパフォーマンスを達成した。
我々は高次元にスケールする3つの新しいCMA-MAE変種を提案する。
論文 参考訳(メタデータ) (2022-10-06T01:03:01Z) - PI-ARS: Accelerating Evolution-Learned Visual-Locomotion with Predictive
Information Representations [32.37414300338581]
進化戦略(ES)アルゴリズムは複雑なロボット制御ポリシーのトレーニングにおいて有望な結果を示している。
PI-ARSは、勾配に基づく表現学習技術、予測情報(PI)と勾配のないESアルゴリズム、拡張ランダム探索(ARS)を組み合わせた。
PI-ARS は ARS ベースラインに比べて学習効率と性能が有意に向上していることを示す。
論文 参考訳(メタデータ) (2022-07-27T00:26:15Z) - Collaborative Intelligent Reflecting Surface Networks with Multi-Agent
Reinforcement Learning [63.83425382922157]
インテリジェント・リフレクション・サーフェス(IRS)は将来の無線ネットワークに広く応用されることが想定されている。
本稿では,エネルギー収穫能力を備えた協調型IRSデバイスを用いたマルチユーザ通信システムについて検討する。
論文 参考訳(メタデータ) (2022-03-26T20:37:14Z) - MS-RANAS: Multi-Scale Resource-Aware Neural Architecture Search [94.80212602202518]
我々は,MS-RANAS(Multi-Scale Resource-Aware Neural Architecture Search)を提案する。
我々は,検索コストの削減を図るために,ワンショットのアーキテクチャ探索手法を採用した。
我々は精度-速度トレードオフの観点から最先端の結果を得る。
論文 参考訳(メタデータ) (2020-09-29T11:56:01Z) - Rectified Linear Postsynaptic Potential Function for Backpropagation in
Deep Spiking Neural Networks [55.0627904986664]
スパイキングニューラルネットワーク(SNN)は、時間的スパイクパターンを用いて情報を表現し、伝達する。
本稿では,情報符号化,シナプス可塑性,意思決定におけるスパイクタイミングダイナミクスの寄与について検討し,将来のDeepSNNやニューロモルフィックハードウェアシステムの設計への新たな視点を提供する。
論文 参考訳(メタデータ) (2020-03-26T11:13:07Z) - AutoML-Zero: Evolving Machine Learning Algorithms From Scratch [76.83052807776276]
基本数学的操作をビルディングブロックとして使うだけで,完全な機械学習アルゴリズムを自動的に発見できることが示される。
汎用的な検索空間を通じて人間のバイアスを大幅に低減する新しいフレームワークを導入することでこれを実証する。
機械学習アルゴリズムをゼロから発見する上で、これらの予備的な成功は、この分野における有望な新しい方向性を示していると信じている。
論文 参考訳(メタデータ) (2020-03-06T19:00:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。