論文の概要: Towards QD-suite: developing a set of benchmarks for Quality-Diversity
algorithms
- arxiv url: http://arxiv.org/abs/2205.03207v1
- Date: Fri, 6 May 2022 13:33:50 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-09 14:25:21.648451
- Title: Towards QD-suite: developing a set of benchmarks for Quality-Diversity
algorithms
- Title(参考訳): QD-suiteに向けて:品質多様性アルゴリズムのためのベンチマークセットの開発
- Authors: Achkan Salehi and Stephane Doncieux
- Abstract要約: 既存のベンチマークは標準化されておらず、現在、品質多様性(QD)に匹敵するMNISTはない。
我々は、QD手法が直面する課題の特定と、目標とする、挑戦的でスケーラブルなベンチマークの開発が重要なステップであると主張している。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: While the field of Quality-Diversity (QD) has grown into a distinct branch of
stochastic optimization, a few problems, in particular locomotion and
navigation tasks, have become de facto standards. Are such benchmarks
sufficient? Are they representative of the key challenges faced by QD
algorithms? Do they provide the ability to focus on one particular challenge by
properly disentangling it from others? Do they have much predictive power in
terms of scalability and generalization? Existing benchmarks are not
standardized, and there is currently no MNIST equivalent for QD. Inspired by
recent works on Reinforcement Learning benchmarks, we argue that the
identification of challenges faced by QD methods and the development of
targeted, challenging, scalable but affordable benchmarks is an important step.
As an initial effort, we identify three problems that are challenging in sparse
reward settings, and propose associated benchmarks: (1) Behavior metric bias,
which can result from the use of metrics that do not match the structure of the
behavior space. (2) Behavioral Plateaus, with varying characteristics, such
that escaping them would require adaptive QD algorithms and (3) Evolvability
Traps, where small variations in genotype result in large behavioral changes.
The environments that we propose satisfy the properties listed above.
- Abstract(参考訳): QD(Quality-Diversity)の分野は確率的最適化の一分野に成長してきたが、特に移動やナビゲーションタスクといったいくつかの問題はデファクトスタンダードになっている。
そのようなベンチマークは十分ですか?
それらはQDアルゴリズムが直面する重要な課題を表しているか?
相手から適切に切り離すことで、特定の課題に集中する能力を提供していますか?
スケーラビリティと一般化の点で、予測力はたくさんありますか?
既存のベンチマークは標準化されておらず、現在、QDに準ずるMNISTはない。
強化学習ベンチマーク(Reinforcement Learning benchmarks)に関する最近の研究に触発されて、我々はQDメソッドが直面する課題の特定と、目標とする、挑戦的でスケーラブルで安価なベンチマークの開発が重要なステップであると主張している。
最初の試みとして,少額報酬設定において困難である3つの問題を特定し,関連するベンチマークを提案する。(1)行動計量バイアス,すなわち,行動空間の構造に適合しないメトリクスの使用によるものである。
2) 行動台地は, 多様な特性を持つため, 適応型qdアルゴリズムと(3) 進化可能性トラップが必要となる。
提案する環境は上記の特性を満たす。
関連論文リスト
- Understanding, Predicting and Better Resolving Q-Value Divergence in
Offline-RL [86.0987896274354]
まず、オフラインRLにおけるQ値推定のばらつきの主な原因として、基本パターン、自己励起を同定する。
そこで本研究では,Q-network の学習における進化特性を測定するために,SEEM(Self-Excite Eigen Value Measure)尺度を提案する。
われわれの理論では、訓練が早期に発散するかどうかを確実に決定できる。
論文 参考訳(メタデータ) (2023-10-06T17:57:44Z) - Quality Diversity under Sparse Reward and Sparse Interaction:
Application to Grasping in Robotics [0.0]
QD法(Quality-Diversity Method)は、与えられた問題に対して多種多様な高性能なソリューションセットを生成することを目的としたアルゴリズムである。
本研究は,ロボット工学における把握にQDがどう対処できるかを考察する。
ロボットグリップの2つの異なるセットアップと5つの標準オブジェクトに対応して、ドメインを10個把握する15の異なる方法の実験が行われた。
論文 参考訳(メタデータ) (2023-08-10T10:19:48Z) - On Pitfalls of Test-Time Adaptation [82.8392232222119]
TTA(Test-Time Adaptation)は、分散シフトの下で堅牢性に取り組むための有望なアプローチとして登場した。
TTABは,10の最先端アルゴリズム,多種多様な分散シフト,および2つの評価プロトコルを含むテスト時間適応ベンチマークである。
論文 参考訳(メタデータ) (2023-06-06T09:35:29Z) - Benchmark tasks for Quality-Diversity applied to Uncertain domains [1.5469452301122175]
実装が容易で軽量な8つのタスクを3つのカテゴリに分けて紹介します。
我々は、UQDベンチマークタスクを簡単に定義するための重要な不確実性を特定する。
私たちのタスクはすべて、Redundant Arm上に構築されています。
論文 参考訳(メタデータ) (2023-04-24T21:23:26Z) - Exposing and Addressing Cross-Task Inconsistency in Unified
Vision-Language Models [80.23791222509644]
一貫性のないAIモデルは、人間のユーザーによって不安定で信頼できないと見なされている。
最先端のビジョン言語モデルは、タスク間の驚くほど高い一貫性のない振る舞いに悩まされている。
本稿では,大規模で自動生成されるクロスタスクコントラスト集合上で計算されたランク相関に基づく補助訓練目標を提案する。
論文 参考訳(メタデータ) (2023-03-28T16:57:12Z) - Benchmarking Quality-Diversity Algorithms on Neuroevolution for
Reinforcement Learning [3.6350564275444173]
本稿では,ロボット制御のための強化学習領域における深部神経進化のための品質多様性ベンチマークスイートを提案する。
このベンチマークでは、カバレッジ、QDスコア、最大適合度、アーカイブプロファイルメトリックなど、標準的な品質と多様性のメトリクスを使用している。
論文 参考訳(メタデータ) (2022-11-04T00:14:42Z) - A Survey of Parameters Associated with the Quality of Benchmarks in NLP [24.6240575061124]
最近の研究では、モデルがいくつかの人気のあるベンチマークに対して、望ましいタスクを本当に学習することなく、刺激的なバイアスに過度に適合していることが示されている。
これらの問題に対する潜在的な解決策 - 量的定量化品質 - は、まだ未検討のままである。
ベンチマークのバイアスにつながる様々な相互作用を表現できる特定の言語特性を特定することで、メトリックへの第一歩を踏み出します。
論文 参考訳(メタデータ) (2022-10-14T06:44:14Z) - Learning to Walk Autonomously via Reset-Free Quality-Diversity [73.08073762433376]
品質多様性アルゴリズムは、多様かつ高いパフォーマンスのスキルからなる大規模で複雑な行動レパートリーを発見することができる。
既存のQDアルゴリズムは、手動による人間の監督と介入を必要とするエピソードリセットと同様に、多数の評価を必要とする。
本稿では,オープンエンド環境におけるロボットの自律学習に向けたステップとして,リセットフリー品質多様性最適化(RF-QD)を提案する。
論文 参考訳(メタデータ) (2022-04-07T14:07:51Z) - Modified Double DQN: addressing stability [0.2867517731896504]
Double-DQN (DDQN) アルゴリズムは元々、元のDQNアルゴリズムの過大評価問題に対処するために提案された。
DDQNアルゴリズムの安定性と過大評価の両面での性能を維持するために、3つの改良が提案されている。
論文 参考訳(メタデータ) (2021-08-09T15:27:22Z) - Contrast and Classify: Training Robust VQA Models [60.80627814762071]
本稿では,クロスエントロピーとコントラスト損失の両方を最適化する新しいトレーニングパラダイム(ConClaT)を提案する。
双方の損失を -- 交互に,あるいは共同で -- 最適化することが,効果的なトレーニングの鍵であることに気付きました。
論文 参考訳(メタデータ) (2020-10-13T00:23:59Z) - MetaIQA: Deep Meta-learning for No-Reference Image Quality Assessment [73.55944459902041]
本稿では,深層メタラーニングに基づく非参照IQA尺度を提案する。
まず、様々な歪みに対してNR-IQAタスクを収集する。
次にメタラーニングを用いて、多彩な歪みによって共有される事前知識を学習する。
大規模な実験により、提案された計量は最先端の技術を大きなマージンで上回ることを示した。
論文 参考訳(メタデータ) (2020-04-11T23:36:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。