論文の概要: Objectives Are All You Need: Solving Deceptive Problems Without Explicit
Diversity Maintenance
- arxiv url: http://arxiv.org/abs/2311.02283v1
- Date: Sat, 4 Nov 2023 00:09:48 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-07 18:35:44.609804
- Title: Objectives Are All You Need: Solving Deceptive Problems Without Explicit
Diversity Maintenance
- Title(参考訳): 目的: 明確な多様性維持を伴わずに、偽りの問題を解決すること。
- Authors: Ryan Boldi, Li Ding, Lee Spector
- Abstract要約: 我々は,明らかに多様性の維持を行なわずに,偽りのドメインを解決することを約束するアプローチを提案する。
人口多様性を暗黙的に維持することが示されているため,これらの目的を最適化するためにレキシケースの選択を用いる。
目的を多くの目的に分解し、それらを最適化することで、探究する偽りの領域においてMAP-Elitesより優れていることが分かりました。
- 参考スコア(独自算出の注目度): 7.3153233408665495
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Navigating deceptive domains has often been a challenge in machine learning
due to search algorithms getting stuck at sub-optimal local optima. Many
algorithms have been proposed to navigate these domains by explicitly
maintaining diversity or equivalently promoting exploration, such as Novelty
Search or other so-called Quality Diversity algorithms. In this paper, we
present an approach with promise to solve deceptive domains without explicit
diversity maintenance by optimizing a potentially large set of defined
objectives. These objectives can be extracted directly from the environment by
sub-aggregating the raw performance of individuals in a variety of ways. We use
lexicase selection to optimize for these objectives as it has been shown to
implicitly maintain population diversity. We compare this technique with a
varying number of objectives to a commonly used quality diversity algorithm,
MAP-Elites, on a set of discrete optimization as well as reinforcement learning
domains with varying degrees of deception. We find that decomposing objectives
into many objectives and optimizing them outperforms MAP-Elites on the
deceptive domains that we explore. Furthermore, we find that this technique
results in competitive performance on the diversity-focused metrics of QD-Score
and Coverage, without explicitly optimizing for these things. Our ablation
study shows that this technique is robust to different subaggregation
techniques. However, when it comes to non-deceptive, or ``illumination"
domains, quality diversity techniques generally outperform our objective-based
framework with respect to exploration (but not exploitation), hinting at
potential directions for future work.
- Abstract(参考訳): 認識ドメインのナビゲートは、探索アルゴリズムが最適でない局所最適化で立ち往生しているため、機械学習においてしばしば困難である。
多様性を明示的に維持するか、あるいはノベルティ探索やいわゆる品質多様性アルゴリズムのような探索を促進することによって、これらの領域をナビゲートするために多くのアルゴリズムが提案されている。
本稿では,潜在的に大きな定義対象の集合を最適化することにより,明らかな多様性維持を行なわずに,擬似ドメインの解決を約束するアプローチを提案する。
これらの目標は、個人の生の性能を様々な方法でサブアグリゲーションすることで、環境から直接抽出することができる。
人口多様性を暗黙的に維持することが示されているため,これらの目的を最適化するためにレキシケースの選択を用いる。
我々は,この手法を多種多様な目的に対して,離散最適化のセット上でのmap-elites法と,多種多様なデセプションを持つ強化学習領域とを比較した。
目的を多くの目的に分解し、それらを最適化することで、探究する偽りの領域においてMAP-Elitesよりも優れることがわかった。
さらに,本手法は,QDスコアとカバレッジの多様性に着目した指標に対して,これらの指標を明示的に最適化することなく,競争性能が向上することがわかった。
我々のアブレーション研究は、この技術が異なるサブアグリゲーション技術に対して堅牢であることを示している。
しかしながら、非知覚的あるいは‘照明’なドメインの場合、品質の多様性のテクニックは一般的に、探索(搾取ではなく)に関して客観的なフレームワークを上回っており、将来の作業への潜在的な方向性を示唆しています。
関連論文リスト
- Preference-Conditioned Gradient Variations for Multi-Objective Quality-Diversity [7.799824794686343]
優先条件付きポリシー段階突然変異を用いた多目的品質多様性アルゴリズムを提案する。
提案手法は,新たに提案した疎度測定値により,よりスムーズなトレードオフを実現する。
この性能は、従来の方法に比べて計算ストレージコストが低い。
論文 参考訳(メタデータ) (2024-11-19T11:50:03Z) - Revisiting the Domain Shift and Sample Uncertainty in Multi-source
Active Domain Transfer [69.82229895838577]
Active Domain Adaptation (ADA)は、アノテートするターゲットデータの限られた数を選択することで、新しいターゲットドメインにおけるモデル適応を最大限に向上することを目的としている。
この設定は、複数のソースからトレーニングデータを収集するより実践的なシナリオを無視します。
これは、ADAを単一のソースドメインから複数のソースドメインに拡張する、新しい、挑戦的な知識転送の設定を目標にしています。
論文 参考訳(メタデータ) (2023-11-21T13:12:21Z) - Can the Problem-Solving Benefits of Quality Diversity Be Obtained
Without Explicit Diversity Maintenance? [0.0]
適切な比較は、emphmulti-objective Optimization frameworkに対して行われるべきだと我々は主張する。
本稿では, 個人に対する行動記述子の集合を自動的に決定するために, 次元還元を利用した手法を提案する。
論文 参考訳(メタデータ) (2023-05-12T21:24:04Z) - A Unified Algorithm Framework for Unsupervised Discovery of Skills based
on Determinantal Point Process [53.86223883060367]
教師なしオプション発見における多様性とカバレッジは、実際には同じ数学的枠組みの下で統一可能であることを示す。
提案アルゴリズムであるODPPは,MujocoとAtariで作成した課題に対して,広範囲に評価されている。
論文 参考訳(メタデータ) (2022-12-01T01:40:03Z) - Multi-Objective Quality Diversity Optimization [2.4608515808275455]
MOME(Multi-Objective MAP-Elites)の多目的設定におけるMAP-Elitesアルゴリズムの拡張を提案する。
すなわち、MAP-Elitesグリッドアルゴリズムから受け継いだ多様性と、多目的最適化の強みを組み合わせる。
本手法は,標準的な最適化問題からロボットシミュレーションまで,いくつかのタスクで評価する。
論文 参考訳(メタデータ) (2022-02-07T10:48:28Z) - Domain Adaptive Semantic Segmentation with Self-Supervised Depth
Estimation [84.34227665232281]
セマンティックセグメンテーションのためのドメイン適応は、ソースとターゲットドメイン間の分散シフトの存在下でモデルのパフォーマンスを向上させることを目的とする。
ドメイン間のギャップを埋めるために、両ドメインで利用可能な自己教師付き深さ推定からのガイダンスを活用します。
提案手法のベンチマークタスクSYNTHIA-to-CityscapesとGTA-to-Cityscapesの有効性を実証する。
論文 参考訳(メタデータ) (2021-04-28T07:47:36Z) - Selection-Expansion: A Unifying Framework for Motion-Planning and
Diversity Search Algorithms [69.87173070473717]
本稿では,2つの多様性探索アルゴリズム,ノベルティ探索アルゴリズムとゴール探索処理アルゴリズムの特性について検討する。
mpアルゴリズムとの関係は、ポリシーパラメータ空間と結果空間の間のマッピングの滑らかさ、あるいは滑らかさの欠如が検索効率において重要な役割を担っていることを示している。
論文 参考訳(メタデータ) (2021-04-10T13:52:27Z) - MetaAlign: Coordinating Domain Alignment and Classification for
Unsupervised Domain Adaptation [84.90801699807426]
本稿ではMetaAlignと呼ばれるメタ最適化に基づく効果的な戦略を提案する。
ドメインアライメントの目的と分類の目的をメタ学習計画におけるメタトレーニングとメタテストのタスクとして扱う。
実験結果は,アライメントに基づくベースラインアプローチを用いた提案手法の有効性を実証した。
論文 参考訳(メタデータ) (2021-03-25T03:16:05Z) - BOP-Elites, a Bayesian Optimisation algorithm for Quality-Diversity
search [0.0]
本稿では,エリートアルゴリズム(BOP-Elites)のベイズ最適化を提案する。
機能領域のユーザ定義領域を‘ニッチ’として考えることで、ニッチ毎に最適なソリューションを見つけることが私たちのタスクになります。
得られたアルゴリズムは、特徴空間におけるニッチに属する探索空間の部分を特定し、ニッチごとに最適な解を見つけるのに非常に効果的である。
論文 参考訳(メタデータ) (2020-05-08T23:49:13Z) - Optimized Generic Feature Learning for Few-shot Classification across
Domains [96.4224578618561]
我々は、ハイパーパラメータ最適化(HPO)の検証対象として、クロスドメイン、クロスタスクデータを用いることを提案する。
本手法は,領域内および領域内における少数ショット画像分類における有効性を示す。
学習した機能は、以前の数ショットとメタラーニングのアプローチよりも優れています。
論文 参考訳(メタデータ) (2020-01-22T09:31:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。