論文の概要: Uncertain Quality-Diversity: Evaluation methodology and new methods for
Quality-Diversity in Uncertain Domains
- arxiv url: http://arxiv.org/abs/2302.00463v1
- Date: Wed, 1 Feb 2023 14:12:04 GMT
- ステータス: 処理完了
- システム内更新日: 2023-02-02 12:58:58.610565
- Title: Uncertain Quality-Diversity: Evaluation methodology and new methods for
Quality-Diversity in Uncertain Domains
- Title(参考訳): 不確実な品質多様性:不確実な領域における品質多様性の評価手法と新しい手法
- Authors: Manon Flageat and Antoine Cully
- Abstract要約: 品質多様性最適化(QD)は、幅広いアプリケーションにわたって有望な結果をもたらすことが証明されている。
しかし、QDアプローチは、ソリューションの真のパフォーマンスとノベルティを定量化する能力に影響を与えるため、環境における不確実性の存在に苦慮する。
不確実領域に対する共通フレームワークを定式化する。
第2に、新しい世代ごとのサンプリング予算と、不確実QDに特化して設計された既存のメトリクスのセットを頼りに、不確実QDアプローチを評価するための新しい方法論を提案する。
第3に、不確実な3つの新しいQDアルゴリズム、アーカイブサンプリング、並列適応を提案する。
- 参考スコア(独自算出の注目度): 1.827510863075184
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Quality-Diversity optimisation (QD) has proven to yield promising results
across a broad set of applications. However, QD approaches struggle in the
presence of uncertainty in the environment, as it impacts their ability to
quantify the true performance and novelty of solutions. This problem has been
highlighted multiple times independently in previous literature. In this work,
we propose to uniformise the view on this problem through four main
contributions. First, we formalise a common framework for uncertain domains:
the Uncertain QD setting, a special case of QD in which fitness and descriptors
for each solution are no longer fixed values but distribution over possible
values. Second, we propose a new methodology to evaluate Uncertain QD
approaches, relying on a new per-generation sampling budget and a set of
existing and new metrics specifically designed for Uncertain QD. Third, we
propose three new Uncertain QD algorithms: Archive-sampling,
Parallel-Adaptive-sampling and Deep-Grid-sampling. We propose these approaches
taking into account recent advances in the QD community toward the use of
hardware acceleration that enable large numbers of parallel evaluations and
make sampling an affordable approach to uncertainty. Our final and fourth
contribution is to use this new framework and the associated comparison methods
to benchmark existing and novel approaches. We demonstrate once again the
limitation of MAP-Elites in uncertain domains and highlight the performance of
the existing Deep-Grid approach, and of our new algorithms. The goal of this
framework and methods is to become an instrumental benchmark for future works
considering Uncertain QD.
- Abstract(参考訳): 品質多様性最適化(QD)は、幅広いアプリケーションにわたって有望な結果をもたらすことが証明されている。
しかし、QDアプローチは、ソリューションの真のパフォーマンスとノベルティを定量化する能力に影響を与えるため、環境における不確実性の存在に苦慮する。
この問題は以前の文献で独立して何度も強調されている。
本稿では,4つの主要な貢献を通じて,この問題に対する視点を統一することを提案する。
まず、不確実な領域に対する共通フレームワークを定式化する: 不確実なQD設定、すなわち、各解に対する適合性および記述子がもはや固定値ではなく、可能な値を越えて分布する特別なQDの場合。
第2に、新しい世代ごとのサンプリング予算と、不確実QDに特化して設計された既存のメトリクスのセットを頼りに、不確実QDアプローチを評価するための新しい方法論を提案する。
第3に,アーカイブサンプリング,並列適応サンプリング,ディープグリッドサンプリングの3つの新しいQDアルゴリズムを提案する。
本稿では,QDコミュニティにおけるハードウェアアクセラレーションの最近の進歩を考慮し,多数の並列評価を可能にし,不確実性に対する安価なアプローチをサンプリングする手法を提案する。
最終および第4のコントリビューションは、この新しいフレームワークと関連する比較手法を使用して、既存のアプローチと新しいアプローチをベンチマークすることです。
我々は、不確実領域におけるMAP-Elitesの制限を再び示し、既存のDeep-Gridアプローチと新しいアルゴリズムの性能を強調した。
このフレームワークとメソッドの目標は、不確実性QDを考慮した将来の作業のためのインスツルメンタルベンチマークになることである。
関連論文リスト
- Exploring the Performance-Reproducibility Trade-off in Quality-Diversity [7.858994681440057]
品質多様性(QD)アルゴリズムは多くの領域やアプリケーションで有望な結果を示している。
しかし、複雑な実世界のアプリケーションでQDが使用される場合、ソリューションの適合性と行動推定の不確実性は依然として大きな課題である。
そこで本稿では, トレードオフに対する最適解を求める新たな4つのQDアルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-09-20T08:20:31Z) - Sound Heuristic Search Value Iteration for Undiscounted POMDPs with Reachability Objectives [16.101435842520473]
本稿では,POMDPにおける最大到達可能性確率問題(indefinite-horizon)と呼ばれる問題について検討する。
割引問題に対するポイントベース手法の成功に触発され,MRPPへの拡張について検討した。
本稿では,これらの手法の強みを有効活用し,信念空間を効率的に探索するアルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-06-05T02:33:50Z) - Using Uncertainty Quantification to Characterize and Improve Out-of-Domain Learning for PDEs [44.890946409769924]
ニューラル演算子(NO)は特に有望な量子化として出現している。
本研究では,複数のNOをアンサンブルすることで,高いエラー領域を同定し,不確実性の高い推定を行うことができることを示す。
次に、ProbConservフレームワーク内でこれらのよく校正されたUQ推定を使ってモデルを更新するOperator-ProbConservを紹介します。
論文 参考訳(メタデータ) (2024-03-15T19:21:27Z) - Q-REG: End-to-End Trainable Point Cloud Registration with Surface
Curvature [81.25511385257344]
本稿では、リッチな幾何学的情報を用いて、単一の対応から剛性ポーズを推定する新しい解Q-REGを提案する。
Q-REGは、堅牢な推定を徹底的な探索として形式化し、エンドツーエンドのトレーニングを可能にする。
実験では、Q-REGは対応マッチング法に非依存であり、推論とエンドツーエンドトレーニングの両方で使用した場合に一貫した改善を提供する。
論文 参考訳(メタデータ) (2023-09-27T20:58:53Z) - On Pitfalls of Test-Time Adaptation [82.8392232222119]
TTA(Test-Time Adaptation)は、分散シフトの下で堅牢性に取り組むための有望なアプローチとして登場した。
TTABは,10の最先端アルゴリズム,多種多様な分散シフト,および2つの評価プロトコルを含むテスト時間適応ベンチマークである。
論文 参考訳(メタデータ) (2023-06-06T09:35:29Z) - Benchmark tasks for Quality-Diversity applied to Uncertain domains [1.5469452301122175]
実装が容易で軽量な8つのタスクを3つのカテゴリに分けて紹介します。
我々は、UQDベンチマークタスクを簡単に定義するための重要な不確実性を特定する。
私たちのタスクはすべて、Redundant Arm上に構築されています。
論文 参考訳(メタデータ) (2023-04-24T21:23:26Z) - Toward Reliable Human Pose Forecasting with Uncertainty [51.628234388046195]
我々は、複数のモデルを含む人間のポーズ予測のためのオープンソースのライブラリを開発し、複数のデータセットをサポートする。
我々は、パフォーマンスを高め、より良い信頼をもたらすために、問題の2つの不確実性を考案する。
論文 参考訳(メタデータ) (2023-04-13T17:56:08Z) - Uncertainty-Driven Action Quality Assessment [67.20617610820857]
本稿では,複数の判定スコアの多様性を捉えるために,不確実性駆動型AQA (UD-AQA) という新しい確率モデルを提案する。
我々は,AQA回帰損失の再重み付けに使用される各予測の不確かさを推定する。
提案手法は,オリンピックイベントMTL-AQAとFineDivingの3つのベンチマークと,手術スキルJIGSAWSデータセットの3つのベンチマークで比較結果を得た。
論文 参考訳(メタデータ) (2022-07-29T07:21:15Z) - Towards QD-suite: developing a set of benchmarks for Quality-Diversity
algorithms [0.0]
既存のベンチマークは標準化されておらず、現在、品質多様性(QD)に匹敵するMNISTはない。
我々は、QD手法が直面する課題の特定と、目標とする、挑戦的でスケーラブルなベンチマークの開発が重要なステップであると主張している。
論文 参考訳(メタデータ) (2022-05-06T13:33:50Z) - CertainNet: Sampling-free Uncertainty Estimation for Object Detection [65.28989536741658]
ニューラルネットワークの不確実性を推定することは、安全クリティカルな設定において基本的な役割を果たす。
本研究では,オブジェクト検出のための新しいサンプリング不要不確実性推定法を提案する。
私たちはそれをCertainNetと呼び、各出力信号に対して、オブジェクト性、クラス、位置、サイズという、別の不確実性を提供するのは、これが初めてです。
論文 参考訳(メタデータ) (2021-10-04T17:59:31Z) - Few-shot Quality-Diversity Optimization [50.337225556491774]
品質多様性(QD)の最適化は、強化学習における知覚的最小値とスパース報酬を扱う上で効果的なツールであることが示されている。
本稿では,タスク分布の例から,パラメータ空間の最適化によって得られる経路の情報を利用して,未知の環境でQD手法を初期化する場合,数発の適応が可能であることを示す。
ロボット操作とナビゲーションベンチマークを用いて、疎密な報酬設定と密集した報酬設定の両方で実施された実験は、これらの環境でのQD最適化に必要な世代数を著しく削減することを示している。
論文 参考訳(メタデータ) (2021-09-14T17:12:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。