論文の概要: Monte Carlo Elites: Quality-Diversity Selection as a Multi-Armed Bandit
Problem
- arxiv url: http://arxiv.org/abs/2104.08781v1
- Date: Sun, 18 Apr 2021 09:11:48 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-03 06:53:27.454519
- Title: Monte Carlo Elites: Quality-Diversity Selection as a Multi-Armed Bandit
Problem
- Title(参考訳): Monte Carlo Elites氏:マルチアーメッドバンド問題としての品質多様性の選択
- Authors: Konstantinos Sfikas and Antonios Liapis and Georgios N. Yannakakis
- Abstract要約: 本稿では,親の選抜をマルチアームバンディット問題として扱うことで,人気の高い品質多様性探索アルゴリズムMAP-Elitesを拡張した。
探索されていないが、潜在的に報酬のある領域から親を選別するために、上層自信のバリエーションを使用することで、新しい領域の発見を加速することができる。
- 参考スコア(独自算出の注目度): 2.0419267792711397
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: A core challenge of evolutionary search is the need to balance between
exploration of the search space and exploitation of highly fit regions.
Quality-diversity search has explicitly walked this tightrope between a
population's diversity and its quality. This paper extends a popular
quality-diversity search algorithm, MAP-Elites, by treating the selection of
parents as a multi-armed bandit problem. Using variations of the
upper-confidence bound to select parents from under-explored but potentially
rewarding areas of the search space can accelerate the discovery of new regions
as well as improve its archive's total quality. The paper tests an indirect
measure of quality for parent selection: the survival rate of a parent's
offspring. Results show that maintaining a balance between exploration and
exploitation leads to the most diverse and high-quality set of solutions in
three different testbeds.
- Abstract(参考訳): 進化的探索の核となる課題は、探索空間の探索と高度に適合した領域の活用のバランスをとる必要性である。
品質多様性の探索は、人口の多様性と品質の間の綱渡りを明示的に進めている。
本稿では,親の選抜をマルチアームバンディット問題として扱うことで,人気の高い品質多様性探索アルゴリズムMAP-Elitesを拡張した。
検索空間の未探索領域から親を選別するために拘束される上部信頼のバリエーションを利用することで、新しい領域の発見が加速し、アーカイブの総品質が向上する。
本論文は,親の親子生存率という,親子選択の質を間接的に測定する。
その結果、探索と搾取のバランスを維持することが、3つの異なるテストベッドにおいて、最も多様で高品質なソリューションセットにつながることがわかった。
関連論文リスト
- Quality with Just Enough Diversity in Evolutionary Policy Search [9.933490737578111]
JEDi(Quality with Just Enough Diversity)は、行動とフィットネスの関係を学習し、重要なソリューションに対する評価に焦点をあてるフレームワークである。
より高いフィットネス値を達成しようとすると、JEDiは迷路のようなハードな探索作業や、大きなポリシーを持つ複雑な制御問題において、QDとESの両方の手法を上回ります。
論文 参考訳(メタデータ) (2024-05-07T13:33:36Z) - Improved Solution Search Performance of Constrained MOEA/D Hybridizing
Directional Mating and Local Mating [0.0]
直接交配方法は、第1の親が選択された後、目的空間の最適方向に沿って他方の親を選択する。
第1親からの最適方向が支配するより良い解が欠如しているため、生成が進むにつれて直接交配が困難になる。
そこで本研究では,親の近辺から親を選択するために,局所的交配を用いたハイブリッド手法を提案する。
論文 参考訳(メタデータ) (2023-07-24T15:32:53Z) - A Unified Algorithm Framework for Unsupervised Discovery of Skills based
on Determinantal Point Process [53.86223883060367]
教師なしオプション発見における多様性とカバレッジは、実際には同じ数学的枠組みの下で統一可能であることを示す。
提案アルゴリズムであるODPPは,MujocoとAtariで作成した課題に対して,広範囲に評価されている。
論文 参考訳(メタデータ) (2022-12-01T01:40:03Z) - Assessing Quality-Diversity Neuro-Evolution Algorithms Performance in
Hard Exploration Problems [10.871978893808533]
QD法(Quality-Diversity method)は、高い性能のニッチ生物を生産する自然の能力に触発された進化的アルゴリズムである。
本稿では,探索困難を伴う高次元制御問題を示す3つの候補ベンチマークについて述べる。
私たちはまた、Jaxのオープンソース実装を提供し、実践者が少ない計算リソース上で高速かつ多数の実験を実行できるようにします。
論文 参考訳(メタデータ) (2022-11-24T18:04:12Z) - Best-$k$ Search Algorithm for Neural Text Generation [118.02691398555781]
本稿では,品質と多様性のバランスをとる決定論的探索アルゴリズムを提案する。
提案アルゴリズムはパラメータフリーで、軽量で、効率的で、使いやすくなっている。
論文 参考訳(メタデータ) (2022-11-22T00:26:13Z) - Niching-based Evolutionary Diversity Optimization for the Traveling
Salesperson Problem [17.268191781480745]
本稿では,旅行セールスパーソン問題(TSP)に対するツアーの集合を,所定のコスト制約を満たしつつ,多様性を最大化する問題を考える。
本研究は, ニッチ適用による多様性の最大化効果を, 単に維持することよりも検討することを目的とする。
論文 参考訳(メタデータ) (2022-01-25T13:40:27Z) - Cooperative Exploration for Multi-Agent Deep Reinforcement Learning [127.4746863307944]
深層強化学習のための協調型マルチエージェント探索(CMAE)を提案する。
ゴールは正規化エントロピーに基づく手法により、複数の射影状態空間から選択される。
CMAEが様々なタスクのベースラインを一貫して上回っていることを実証する。
論文 参考訳(メタデータ) (2021-07-23T20:06:32Z) - An Exploration of Exploration: Measuring the ability of lexicase
selection to find obscure pathways to optimality [62.997667081978825]
本稿では,探索空間探索のための選択スキームの容量を診断する探索診断手法を提案する。
我々はレキシケースの選択がトーナメントの選択を外見することを確認した。
我々は,レキシケースのエリート性をエプシロンレキシケースで緩和することで,探索をさらに改善できることを見出した。
論文 参考訳(メタデータ) (2021-07-20T20:43:06Z) - Expressivity of Parameterized and Data-driven Representations in Quality
Diversity Search [111.06379262544911]
2つの異なる検索空間で実施した品質多様性進化探索の出力多様性を比較する。
学習モデルは、未知の例への外挿や拡大よりも、既知のデータポイント間の補間が優れている。
論文 参考訳(メタデータ) (2021-05-10T10:27:43Z) - Selection-Expansion: A Unifying Framework for Motion-Planning and
Diversity Search Algorithms [69.87173070473717]
本稿では,2つの多様性探索アルゴリズム,ノベルティ探索アルゴリズムとゴール探索処理アルゴリズムの特性について検討する。
mpアルゴリズムとの関係は、ポリシーパラメータ空間と結果空間の間のマッピングの滑らかさ、あるいは滑らかさの欠如が検索効率において重要な役割を担っていることを示している。
論文 参考訳(メタデータ) (2021-04-10T13:52:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。