論文の概要: Fast and stable MAP-Elites in noisy domains using deep grids
- arxiv url: http://arxiv.org/abs/2006.14253v1
- Date: Thu, 25 Jun 2020 08:47:23 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-17 02:55:47.165169
- Title: Fast and stable MAP-Elites in noisy domains using deep grids
- Title(参考訳): ディープグリッドを用いた雑音領域の高速安定マップイライト
- Authors: Manon Flageat, Antoine Cully
- Abstract要約: Deep-Grid MAP-ElitesはMAP-Elitesアルゴリズムの変種である。
この単純なアプローチは、適合性最適化の観点から競争性能を達成しつつ、動作記述子のノイズに対する耐性が著しく高いことを示す。
- 参考スコア(独自算出の注目度): 1.827510863075184
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Quality-Diversity optimisation algorithms enable the evolution of collections
of both high-performing and diverse solutions. These collections offer the
possibility to quickly adapt and switch from one solution to another in case it
is not working as expected. It therefore finds many applications in real-world
domain problems such as robotic control. However, QD algorithms, like most
optimisation algorithms, are very sensitive to uncertainty on the fitness
function, but also on the behavioural descriptors. Yet, such uncertainties are
frequent in real-world applications. Few works have explored this issue in the
specific case of QD algorithms, and inspired by the literature in Evolutionary
Computation, mainly focus on using sampling to approximate the "true" value of
the performances of a solution. However, sampling approaches require a high
number of evaluations, which in many applications such as robotics, can quickly
become impractical. In this work, we propose Deep-Grid MAP-Elites, a variant of
the MAP-Elites algorithm that uses an archive of similar previously encountered
solutions to approximate the performance of a solution. We compare our approach
to previously explored ones on three noisy tasks: a standard optimisation task,
the control of a redundant arm and a simulated Hexapod robot. The experimental
results show that this simple approach is significantly more resilient to noise
on the behavioural descriptors, while achieving competitive performances in
terms of fitness optimisation, and being more sample-efficient than other
existing approaches.
- Abstract(参考訳): 品質多様性最適化アルゴリズムは、高性能かつ多様なソリューションのコレクションの進化を可能にする。
これらのコレクションは、期待通りに動作しない場合に、素早く適応し、あるソリューションから別のソリューションに切り替えることを可能にする。
したがって、ロボット制御のような現実世界のドメイン問題には多くの応用がある。
しかし、ほとんどの最適化アルゴリズムと同様に、QDアルゴリズムはフィットネス機能に対する不確実性に対して非常に敏感である。
しかし、そのような不確実性は現実世界のアプリケーションでは頻繁に発生する。
QDアルゴリズムの特定のケースでこの問題を探求する研究はほとんどなく、進化的計算の文献に触発され、主にサンプリングを用いて解のパフォーマンスの「真の」値を近似することに焦点を当てている。
しかし、サンプリングアプローチには多くの評価が必要であり、ロボット工学などの多くの応用において、すぐに非現実的になる可能性がある。
本研究では,前に遭遇した類似解のアーカイブを用いて解の性能を近似する,map-elitesアルゴリズムの変種であるdeep-grid map-elitesを提案する。
従来の3つのノイズのあるタスク(標準最適化タスク、冗長アームの制御、シミュレートされたヘキサポッドロボット)と比較した。
実験の結果, この単純な手法は, 動作記述子のノイズに対する耐性が著しく向上する一方で, 適合度最適化の点で競争性能が向上し, 既存の手法よりもサンプル効率がよいことがわかった。
関連論文リスト
- Analysis of Quality Diversity Algorithms for the Knapsack Problem [14.12876643502492]
我々は,knapsack問題における動的プログラミング動作のシミュレーションにQDパラダイムを適用した。
予測された擬似ポリノミカル時間内に最適解を計算することができることを示す。
論文 参考訳(メタデータ) (2022-07-28T12:15:33Z) - A distributed, plug-n-play algorithm for multi-robot applications with a
priori non-computable objective functions [2.2452191187045383]
マルチロボットアプリケーションでは、ミッションのユーザ定義の目的を一般的な最適化問題として当てはめることができる。
これらの問題には標準勾配の差分型アルゴリズムは適用できない。
本稿では,各ロボットのサブコスト関数を慎重に設計するアルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-11-14T20:40:00Z) - Machine Learning for Online Algorithm Selection under Censored Feedback [71.6879432974126]
オンラインアルゴリズム選択(OAS)では、アルゴリズム問題クラスのインスタンスがエージェントに次々に提示され、エージェントは、固定された候補アルゴリズムセットから、おそらく最高のアルゴリズムを迅速に選択する必要がある。
SAT(Satisfiability)のような決定問題に対して、品質は一般的にアルゴリズムのランタイムを指す。
本研究では,OASのマルチアームバンディットアルゴリズムを再検討し,この問題に対処する能力について議論する。
ランタイム指向の損失に適応し、時間的地平線に依存しない空間的・時間的複雑さを維持しながら、部分的に検閲されたデータを可能にする。
論文 参考訳(メタデータ) (2021-09-13T18:10:52Z) - Unsupervised Behaviour Discovery with Quality-Diversity Optimisation [1.0152838128195467]
品質多様性アルゴリズム(Quality-Diversity algorithm)は、与えられた問題に対する多様な高性能なソリューションの集合を見つけるために設計された進化的アルゴリズムのクラスを指す。
ロボット工学において、そのようなアルゴリズムはロボットの動作のほとんどをカバーするコントローラーの集合を生成するのに使用できる。
本稿では,自律型ロボットの能力を実現するアルゴリズムについて紹介する。
論文 参考訳(メタデータ) (2021-06-10T10:40:18Z) - Benchmarking Simulation-Based Inference [5.3898004059026325]
確率的モデリングの最近の進歩は、確率の数値的評価を必要としないシミュレーションに基づく推論アルゴリズムを多数もたらした。
推論タスクと適切なパフォーマンス指標を備えたベンチマークを,アルゴリズムの初期選択とともに提供する。
性能指標の選択は重要であり、最先端のアルゴリズムでさえ改善の余地があり、逐次推定によりサンプリング効率が向上することがわかった。
論文 参考訳(メタデータ) (2021-01-12T18:31:22Z) - Towards Optimally Efficient Tree Search with Deep Learning [76.64632985696237]
本稿では,線形モデルから信号整数を推定する古典整数最小二乗問題について検討する。
問題はNPハードであり、信号処理、バイオインフォマティクス、通信、機械学習といった様々な応用でしばしば発生する。
本稿では, 深いニューラルネットワークを用いて, 単純化されたメモリバウンドA*アルゴリズムの最適推定を推定し, HATSアルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-01-07T08:00:02Z) - Adaptive Sampling for Best Policy Identification in Markov Decision
Processes [79.4957965474334]
本稿では,学習者が生成モデルにアクセスできる場合の,割引マルコフ決定(MDP)における最良の政治的識別の問題について検討する。
最先端アルゴリズムの利点を論じ、解説する。
論文 参考訳(メタデータ) (2020-09-28T15:22:24Z) - AP-Loss for Accurate One-Stage Object Detection [49.13608882885456]
一段階の物体検出器は、分類損失と局所化損失を同時に最適化することによって訓練される。
前者は、多数のアンカーのため、非常に前景と後方のアンカーの不均衡に悩まされる。
本稿では,一段検知器の分類タスクをランキングタスクに置き換える新しい枠組みを提案する。
論文 参考訳(メタデータ) (2020-08-17T13:22:01Z) - Beyond Worst-Case Analysis in Stochastic Approximation: Moment
Estimation Improves Instance Complexity [58.70807593332932]
近似問題に対する勾配に基づく手法のオラクル複雑性について検討する。
最悪のケースの複雑さではなく、インスタンス依存の複雑さに焦点を当てます。
提案アルゴリズムとその解析はモーメント推定の成功を理論的に正当化する。
論文 参考訳(メタデータ) (2020-06-08T09:25:47Z) - BOP-Elites, a Bayesian Optimisation algorithm for Quality-Diversity
search [0.0]
本稿では,エリートアルゴリズム(BOP-Elites)のベイズ最適化を提案する。
機能領域のユーザ定義領域を‘ニッチ’として考えることで、ニッチ毎に最適なソリューションを見つけることが私たちのタスクになります。
得られたアルゴリズムは、特徴空間におけるニッチに属する探索空間の部分を特定し、ニッチごとに最適な解を見つけるのに非常に効果的である。
論文 参考訳(メタデータ) (2020-05-08T23:49:13Z) - Active Model Estimation in Markov Decision Processes [108.46146218973189]
マルコフ決定過程(MDP)をモデル化した環境の正確なモデル学習のための効率的な探索の課題について検討する。
マルコフに基づくアルゴリズムは,本アルゴリズムと極大エントロピーアルゴリズムの両方を小サンプル方式で上回っていることを示す。
論文 参考訳(メタデータ) (2020-03-06T16:17:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。