論文の概要: Geodesics, Non-linearities and the Archive of Novelty Search
- arxiv url: http://arxiv.org/abs/2205.03162v1
- Date: Fri, 6 May 2022 12:03:40 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-09 13:18:18.308334
- Title: Geodesics, Non-linearities and the Archive of Novelty Search
- Title(参考訳): 測地学、非線形性、新奇な探索のアーカイブ
- Authors: Achkan Salehi, Alexandre Coninx, Stephane Doncieux
- Abstract要約: このアーカイブの重要な効果は、不適切な行動指標の使用による探索バイアスと相反することである。
我々の観察は、サンプリングにおいてアーカイブにより積極的な役割を担っていることが有益であることを示しているように思われる。
- 参考スコア(独自算出の注目度): 69.6462706723023
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The Novelty Search (NS) algorithm was proposed more than a decade ago.
However, the mechanisms behind its empirical success are still not well
formalized/understood. This short note focuses on the effects of the archive on
exploration. Experimental evidence from a few application domains suggests that
archive-based NS performs in general better than when Novelty is solely
computed with respect to the population. An argument that is often encountered
in the literature is that the archive prevents exploration from backtracking or
cycling, i.e. from revisiting previously encountered areas in the behavior
space. We argue that this is not a complete or accurate explanation as
backtracking - beside often being desirable - can actually be enabled by the
archive. Through low-dimensional/analytical examples, we show that a key effect
of the archive is that it counterbalances the exploration biases that result,
among other factors, from the use of inadequate behavior metrics and the
non-linearities of the behavior mapping. Our observations seem to hint that
attributing a more active role to the archive in sampling can be beneficial.
- Abstract(参考訳): Novelty Search (NS)アルゴリズムは10年以上前に提案された。
しかし、その実証的な成功のメカニズムはまだ十分に定式化されていない。
この短いノートは、アーカイブが探検に与える影響に焦点を当てている。
いくつかのアプリケーションドメインからの実験的な証拠から、アーカイブベースのnsは、ノベルティが人口に対してのみ計算される場合よりも一般的に機能することが示唆される。
文献でよく見られる議論は、アーカイブがバックトラックやサイクリングの探索を妨げている、すなわち、以前遭遇した行動空間の領域を再考するのを防ぐことである。
これはバックトラッキング(しばしば望ましいこと以外)がアーカイブによって実際に有効になるため、完全で正確な説明ではない。
低次元・分析的な例を通して、このアーカイブの重要な効果は、不適切な行動指標の使用や行動マッピングの非線形性など、結果の探索バイアスと相反することである。
我々の観察は、サンプリングにおいてアーカイブにより積極的な役割を果たすことが有益であることを示唆している。
関連論文リスト
- Don't Miss Out on Novelty: Importance of Novel Features for Deep Anomaly
Detection [64.21963650519312]
異常検出(AD)は、正規性の学習モデルに適合しない観察を識別する重要なタスクである。
本稿では, 入力空間における説明不能な観測として, 説明可能性を用いた新しいAD手法を提案する。
当社のアプローチでは,複数のベンチマークにまたがる新たな最先端性を確立し,さまざまな異常な型を扱う。
論文 参考訳(メタデータ) (2023-10-01T21:24:05Z) - Cyclophobic Reinforcement Learning [2.2940141855172036]
粗末な報酬のある環境では、探索のための優れた誘導バイアスを見つけることがエージェントの成功に不可欠である。
本稿では,サイクロフォビックな新たな固有報酬を提案する。すなわち,新規性に報いるのではなく,サイクルの回避によって冗長性を罰する。
サイクロフォビックな固有報酬を階層的な表現の列で増大させることで、MiniGridおよびMiniHack環境において優れた結果を得ることができる。
論文 参考訳(メタデータ) (2023-08-30T09:38:44Z) - Latent Magic: An Investigation into Adversarial Examples Crafted in the
Semantic Latent Space [0.0]
Deep Neural Networks(DNN)に対するアドリラルアタック(Adrial attack)は、"citegoodfellow"がDNNの脆弱性を目標にして以来、残酷なトピックとなっている。
以前の作業のほとんどは、$l_p$ノルム制約に従って、ピクセル空間の逆例を作成する。
本稿では、なぜ潜伏空間における敵の例を作れば、等しく効率的かつ重要なのかを直観的に説明する。
論文 参考訳(メタデータ) (2023-05-22T10:39:54Z) - Look Beyond Bias with Entropic Adversarial Data Augmentation [4.893694715581673]
ディープニューラルネットワークは、スパイラルパターンと因果パターンを区別せず、他を無視しながら最も予測的なパターンのみを学ぶ。
ネットワークをこのような刺激的なバイアスに頑健にするためにデバイアス法が開発されたが、データセットがバイアスを受けているかどうかを事前に知る必要がある。
本稿では,「隠された」因果情報がバイアス画像に含まれる場合が多いため,このようなサンプルは必ずしも必要ではない,と論じる。
論文 参考訳(メタデータ) (2023-01-10T08:25:24Z) - Guarantees for Epsilon-Greedy Reinforcement Learning with Function
Approximation [69.1524391595912]
エプシロングレーディ、ソフトマックス、ガウシアンノイズといった神秘的な探索政策は、いくつかの強化学習タスクにおいて効率的に探索することができない。
本稿では,このような政策を理論的に分析し,筋電図探索による強化学習のための最初の後悔とサンプル複雑度境界を提供する。
論文 参考訳(メタデータ) (2022-06-19T14:44:40Z) - Deep Hierarchy in Bandits [51.22833900944146]
行動の報酬は、しばしば相関する。
統計的効率を最大化するためには,これらの相関を学習に活用することが重要である。
平均作用報酬の相関が階層的ベイズモデルで表されるこの問題のバンディット変法を定式化する。
論文 参考訳(メタデータ) (2022-02-03T08:15:53Z) - BR-NS: an Archive-less Approach to Novelty Search [70.13948372218849]
行動認識に基づく新規性探索(BR-NS)という,新規性推定の代替手法について議論する。
BR-NSはアーカイブを必要とせず、行動空間で定義できるメトリクスを前提にせず、近隣の検索に依存しません。
我々は、その実現可能性とダイナミクス、および時間複雑性の観点からアーカイブベースのnsよりも潜在的に有利な点について洞察を得るために実験を行う。
論文 参考訳(メタデータ) (2021-04-08T17:31:34Z) - Current Time Series Anomaly Detection Benchmarks are Flawed and are
Creating the Illusion of Progress [11.689905300531917]
UCR Time Series Anomaly Archiveを紹介する。
このリソースは、UCR Time Series Classification Archiveと同じような役割を果たす。
論文 参考訳(メタデータ) (2020-09-29T06:29:04Z) - DARTS-: Robustly Stepping out of Performance Collapse Without Indicators [74.21019737169675]
異なるアーキテクチャ検索は、長期にわたるパフォーマンスの不安定さに悩まされる。
ヘッセン固有値のような指標は、性能が崩壊する前に探索を止める信号として提案される。
本稿では,崩壊を解決するために,より微妙で直接的なアプローチをとる。
論文 参考訳(メタデータ) (2020-09-02T12:54:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。