論文の概要: Benchmarking Quality-Diversity Algorithms on Neuroevolution for
Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2211.02193v1
- Date: Fri, 4 Nov 2022 00:14:42 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-07 15:43:14.482015
- Title: Benchmarking Quality-Diversity Algorithms on Neuroevolution for
Reinforcement Learning
- Title(参考訳): 強化学習のための神経進化における品質多様性アルゴリズムのベンチマーク
- Authors: Manon Flageat, Bryan Lim, Luca Grillotti, Maxime Allard, Sim\'on C.
Smith, Antoine Cully
- Abstract要約: 本稿では,ロボット制御のための強化学習領域における深部神経進化のための品質多様性ベンチマークスイートを提案する。
このベンチマークでは、カバレッジ、QDスコア、最大適合度、アーカイブプロファイルメトリックなど、標準的な品質と多様性のメトリクスを使用している。
- 参考スコア(独自算出の注目度): 3.6350564275444173
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We present a Quality-Diversity benchmark suite for Deep Neuroevolution in
Reinforcement Learning domains for robot control. The suite includes the
definition of tasks, environments, behavioral descriptors, and fitness. We
specify different benchmarks based on the complexity of both the task and the
agent controlled by a deep neural network. The benchmark uses standard
Quality-Diversity metrics, including coverage, QD-score, maximum fitness, and
an archive profile metric to quantify the relation between coverage and
fitness. We also present how to quantify the robustness of the solutions with
respect to environmental stochasticity by introducing corrected versions of the
same metrics. We believe that our benchmark is a valuable tool for the
community to compare and improve their findings. The source code is available
online: https://github.com/adaptive-intelligent-robotics/QDax
- Abstract(参考訳): 本稿では,ロボット制御のための強化学習領域における深部神経進化のための品質多様性ベンチマークスイートを提案する。
このスイートにはタスクの定義、環境、振る舞い記述子、フィットネスが含まれている。
我々は、ディープニューラルネットワークによって制御されるタスクとエージェントの複雑さに基づいて、異なるベンチマークを指定する。
このベンチマークでは、カバレッジ、qd-score、maximum fitness、アーカイブプロファイルメトリックなど、標準的な品質多様性指標を使用して、カバレッジとフィットネスの関係を定量化している。
また,同じ測定値の修正版を導入することにより,環境確率性に関して解のロバスト性を定量化する方法について述べる。
当社のベンチマークは,コミュニティが調査結果を比較し,改善するための貴重なツールだと思います。
ソースコードはオンラインで入手できる。 https://github.com/adaptive-intelligent-robotics/QDax
関連論文リスト
- OGBench: Benchmarking Offline Goal-Conditioned RL [72.00291801676684]
オフライン目標条件強化学習(GCRL)は強化学習における大きな問題である。
オフラインゴール条件RLにおけるアルゴリズム研究のための,新しい高品質なベンチマークであるOGBenchを提案する。
論文 参考訳(メタデータ) (2024-10-26T06:06:08Z) - Benchmark tasks for Quality-Diversity applied to Uncertain domains [1.5469452301122175]
実装が容易で軽量な8つのタスクを3つのカテゴリに分けて紹介します。
我々は、UQDベンチマークタスクを簡単に定義するための重要な不確実性を特定する。
私たちのタスクはすべて、Redundant Arm上に構築されています。
論文 参考訳(メタデータ) (2023-04-24T21:23:26Z) - Efficient Quality-Diversity Optimization through Diverse Quality Species [3.428706362109921]
我々は,アーカイブの必要をなくしたり,事前の動作範囲を定義したりすることなく,多様な解の集団を見つけることができることを示す。
本稿では,アーカイブベースの品質多様性(QD)アルゴリズムの代替として,DQS(Diverse Quality Species)を提案する。
論文 参考訳(メタデータ) (2023-04-14T23:15:51Z) - LogGENE: A smooth alternative to check loss for Deep Healthcare
Inference Tasks [0.0]
本研究では、遺伝子発現のようなデータセットにおけるディープニューラルネットワークに基づく推論手法を開発する。
本研究では,特定の住宅維持遺伝子群に対する完全条件量子化を予測するために,Quantile Regressionフレームワークを採用する。
本稿では,チェック損失のスムーズな代替としてログコッシュを提案する。
論文 参考訳(メタデータ) (2022-06-19T06:46:39Z) - Towards QD-suite: developing a set of benchmarks for Quality-Diversity
algorithms [0.0]
既存のベンチマークは標準化されておらず、現在、品質多様性(QD)に匹敵するMNISTはない。
我々は、QD手法が直面する課題の特定と、目標とする、挑戦的でスケーラブルなベンチマークの開発が重要なステップであると主張している。
論文 参考訳(メタデータ) (2022-05-06T13:33:50Z) - LCS: Learning Compressible Subspaces for Adaptive Network Compression at
Inference Time [57.52251547365967]
本稿では,ニューラルネットワークの「圧縮可能な部分空間」を訓練する手法を提案する。
構造的・非構造的空間に対する推定時間における微粒な精度・効率のトレードオフを任意に達成するための結果を示す。
我々のアルゴリズムは、可変ビット幅での量子化にまで拡張し、個別に訓練されたネットワークと同等の精度を実現する。
論文 参考訳(メタデータ) (2021-10-08T17:03:34Z) - COM2SENSE: A Commonsense Reasoning Benchmark with Complementary
Sentences [21.11065466376105]
常識推論は人間にとって直感的であるが、人工知能(AI)の長期的な課題である。
事前訓練された言語モデルの最近の進歩は、いくつかのCommonsenseベンチマークデータセットで有望な結果を示している。
本稿では,自然言語真偽文からなる新しいコモンセンス推論ベンチマークデータセットを提案する。
論文 参考訳(メタデータ) (2021-06-02T06:31:55Z) - A New Score for Adaptive Tests in Bayesian and Credal Networks [64.80185026979883]
テストは、そのシークエンスと質問数とが、テイカーの推定スキルに基づいて動的に調整されるときに適応する。
後部確率のモードに基づいて、別のスコアの族を提示するので、説明し易い。
論文 参考訳(メタデータ) (2021-05-25T20:35:42Z) - GO FIGURE: A Meta Evaluation of Factuality in Summarization [131.1087461486504]
本稿では,現実性評価指標を評価するメタ評価フレームワークGO FIGUREを紹介する。
10個の実測値のベンチマーク分析により、我々のフレームワークが堅牢で効率的な評価を提供することが明らかとなった。
また、QAメトリクスは、ドメイン間の事実性を測定する標準的なメトリクスよりも一般的に改善されているが、パフォーマンスは、質問を生成する方法に大きく依存していることも明らかにしている。
論文 参考訳(メタデータ) (2020-10-24T08:30:20Z) - Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks [133.93803565077337]
検索強化生成モデルは、事前訓練されたパラメトリックメモリと非パラメトリックメモリを組み合わせて言語生成を行う。
我々は、RAGモデルが、最先端パラメトリックのみのセク2セックベースラインよりも、より具体的で、多様で、現実的な言語を生成することを示す。
論文 参考訳(メタデータ) (2020-05-22T21:34:34Z) - Uncertainty Quantification for Deep Context-Aware Mobile Activity
Recognition and Unknown Context Discovery [85.36948722680822]
我々はα-βネットワークと呼ばれる深層モデルのコンテキスト認識混合を開発する。
高レベルの文脈を識別することで、精度とFスコアを10%向上させる。
トレーニングの安定性を確保するために、公開データセットと社内データセットの両方でクラスタリングベースの事前トレーニングを使用しました。
論文 参考訳(メタデータ) (2020-03-03T19:35:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。