論文の概要: Benchmark tasks for Quality-Diversity applied to Uncertain domains
- arxiv url: http://arxiv.org/abs/2304.12454v1
- Date: Mon, 24 Apr 2023 21:23:26 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-26 22:34:49.070425
- Title: Benchmark tasks for Quality-Diversity applied to Uncertain domains
- Title(参考訳): 不確実領域に適用される品質多様性のベンチマークタスク
- Authors: Flageat Manon and Grillotti Luca and Cully Antoine
- Abstract要約: 実装が容易で軽量な8つのタスクを3つのカテゴリに分けて紹介します。
我々は、UQDベンチマークタスクを簡単に定義するための重要な不確実性を特定する。
私たちのタスクはすべて、Redundant Arm上に構築されています。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: While standard approaches to optimisation focus on producing a single
high-performing solution, Quality-Diversity (QD) algorithms allow large diverse
collections of such solutions to be found. If QD has proven promising across a
large variety of domains, it still struggles when faced with uncertain domains,
where quantification of performance and diversity are non-deterministic.
Previous work in Uncertain Quality-Diversity (UQD) has proposed methods and
metrics designed for such uncertain domains. In this paper, we propose a first
set of benchmark tasks to analyse and estimate the performance of UQD
algorithms. We identify the key uncertainty properties to easily define UQD
benchmark tasks: the uncertainty location, the type of distribution and its
parameters. By varying the nature of those key UQD components, we introduce a
set of 8 easy-to-implement and lightweight tasks, split into 3 main categories.
All our tasks build on the Redundant Arm: a common QD environment that is
lightweight and easily replicable. Each one of these tasks highlights one
specific limitation that arises when considering UQD domains. With this first
benchmark, we hope to facilitate later advances in UQD.
- Abstract(参考訳): 最適化の標準的なアプローチは、単一のハイパフォーマンスなソリューションを作ることに重点を置いているが、Quality-Diversity (QD)アルゴリズムは、そのようなソリューションの多様なコレクションを見つけることができる。
もしQDが様々な領域で有望であると証明されたとしても、パフォーマンスと多様性の定量化が非決定論的である不確実な領域に直面するときはまだ苦労している。
Uncertain Quality-Diversity (UQD) における以前の研究は、そのような不確実な領域のために設計された方法とメトリクスを提案している。
本稿では,uqdアルゴリズムの性能を解析・推定するベンチマークタスクの第一セットを提案する。
我々はuqdベンチマークタスクを簡単に定義するための重要な不確実性特性(不確実性位置、分布の種類、パラメータ)を特定する。
これらの重要なUQDコンポーネントの性質を変えることで、実装が容易で軽量な8つのタスクセットを導入し、3つの主要なカテゴリに分けます。
すべてのタスクは冗長なarm上に構築されています – 軽量で簡単に複製可能な,一般的なqd環境です。
これらのタスクのそれぞれが、UQDドメインを考える際に生じる1つの特定の制限を強調している。
この最初のベンチマークでは、後続のUQDの進歩を促進したいと思っています。
関連論文リスト
- Exploring the Performance-Reproducibility Trade-off in Quality-Diversity [7.858994681440057]
品質多様性(QD)アルゴリズムは多くの領域やアプリケーションで有望な結果を示している。
しかし、複雑な実世界のアプリケーションでQDが使用される場合、ソリューションの適合性と行動推定の不確実性は依然として大きな課題である。
そこで本稿では, トレードオフに対する最適解を求める新たな4つのQDアルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-09-20T08:20:31Z) - KaPQA: Knowledge-Augmented Product Question-Answering [59.096607961704656]
我々はAdobe AcrobatとPhotoshop製品に焦点を当てた2つのQAデータセットを紹介した。
また、製品QAタスクにおけるモデルの性能を高めるために、新しい知識駆動型RAG-QAフレームワークを提案する。
論文 参考訳(メタデータ) (2024-07-22T22:14:56Z) - Efficient Quality-Diversity Optimization through Diverse Quality Species [3.428706362109921]
我々は,アーカイブの必要をなくしたり,事前の動作範囲を定義したりすることなく,多様な解の集団を見つけることができることを示す。
本稿では,アーカイブベースの品質多様性(QD)アルゴリズムの代替として,DQS(Diverse Quality Species)を提案する。
論文 参考訳(メタデータ) (2023-04-14T23:15:51Z) - Don't Bet on Luck Alone: Enhancing Behavioral Reproducibility of
Quality-Diversity Solutions in Uncertain Domains [2.639902239625779]
アーカイブ再現性向上アルゴリズム(ARIA)を紹介する。
ARIAは、アーカイブに存在するソリューションの品質を改善するプラグイン・アンド・プレイのアプローチである。
提案アルゴリズムは,任意のアーカイブの品質とディスクリプタ空間のカバレッジを少なくとも50%向上させることを示す。
論文 参考訳(メタデータ) (2023-04-07T14:45:14Z) - Uncertain Quality-Diversity: Evaluation methodology and new methods for
Quality-Diversity in Uncertain Domains [1.827510863075184]
品質多様性最適化(QD)は、幅広いアプリケーションにわたって有望な結果をもたらすことが証明されている。
しかし、QDアプローチは、ソリューションの真のパフォーマンスとノベルティを定量化する能力に影響を与えるため、環境における不確実性の存在に苦慮する。
不確実領域に対する共通フレームワークを定式化する。
第2に、新しい世代ごとのサンプリング予算と、不確実QDに特化して設計された既存のメトリクスのセットを頼りに、不確実QDアプローチを評価するための新しい方法論を提案する。
第3に、不確実な3つの新しいQDアルゴリズム、アーカイブサンプリング、並列適応を提案する。
論文 参考訳(メタデータ) (2023-02-01T14:12:04Z) - IM-IAD: Industrial Image Anomaly Detection Benchmark in Manufacturing [88.35145788575348]
画像異常検出(英: Image Anomaly Detection、IAD)は、産業用コンピュータビジョンの課題である。
統一IMベンチマークの欠如は、現実世界のアプリケーションにおけるIADメソッドの開発と利用を妨げる。
7つの主要なデータセットに19のアルゴリズムを含む包括的画像異常検出ベンチマーク(IM-IAD)を構築した。
論文 参考訳(メタデータ) (2023-01-31T01:24:45Z) - Towards QD-suite: developing a set of benchmarks for Quality-Diversity
algorithms [0.0]
既存のベンチマークは標準化されておらず、現在、品質多様性(QD)に匹敵するMNISTはない。
我々は、QD手法が直面する課題の特定と、目標とする、挑戦的でスケーラブルなベンチマークの開発が重要なステップであると主張している。
論文 参考訳(メタデータ) (2022-05-06T13:33:50Z) - QAFactEval: Improved QA-Based Factual Consistency Evaluation for
Summarization [116.56171113972944]
QAベースのメトリクスのコンポーネントを慎重に選択することは、パフォーマンスにとって重要であることを示す。
提案手法は,最良性能のエンテーメントに基づく測定値を改善し,最先端の性能を実現する。
論文 参考訳(メタデータ) (2021-12-16T00:38:35Z) - Few-shot Quality-Diversity Optimization [50.337225556491774]
品質多様性(QD)の最適化は、強化学習における知覚的最小値とスパース報酬を扱う上で効果的なツールであることが示されている。
本稿では,タスク分布の例から,パラメータ空間の最適化によって得られる経路の情報を利用して,未知の環境でQD手法を初期化する場合,数発の適応が可能であることを示す。
ロボット操作とナビゲーションベンチマークを用いて、疎密な報酬設定と密集した報酬設定の両方で実施された実験は、これらの環境でのQD最適化に必要な世代数を著しく削減することを示している。
論文 参考訳(メタデータ) (2021-09-14T17:12:20Z) - SUNRISE: A Simple Unified Framework for Ensemble Learning in Deep
Reinforcement Learning [102.78958681141577]
SUNRISEは単純な統一アンサンブル法であり、様々な非政治的な深層強化学習アルゴリズムと互換性がある。
SUNRISEは, (a) アンサンブルに基づく重み付きベルマンバックアップと, (b) 最上位の自信境界を用いて行動を選択する推論手法を統合し, 効率的な探索を行う。
論文 参考訳(メタデータ) (2020-07-09T17:08:44Z) - Generating Diverse and Consistent QA pairs from Contexts with
Information-Maximizing Hierarchical Conditional VAEs [62.71505254770827]
非構造化テキストを文脈として与えられたQAペアを生成するための条件付き変分オートエンコーダ(HCVAE)を提案する。
我々のモデルは、トレーニングにわずかなデータしか使わず、両方のタスクの全てのベースラインに対して印象的なパフォーマンス向上が得られる。
論文 参考訳(メタデータ) (2020-05-28T08:26:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。