論文の概要: Open-ended search for environments and adapted agents using MAP-Elites
- arxiv url: http://arxiv.org/abs/2305.01153v1
- Date: Tue, 2 May 2023 02:03:51 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-03 15:43:46.921753
- Title: Open-ended search for environments and adapted agents using MAP-Elites
- Title(参考訳): MAP-Elitesを用いた環境・適応エージェントの探索
- Authors: Emma Stensby Norstein, Kai Olav Ellefsen, Kyrre Glette
- Abstract要約: 私たちは地形と仮想生物の地図を作成し、それらを補足します。
グリッドの次元としてノベルティを用いることで、地図は継続的に発展し、新しい環境の探索を促進することができる。
地図に対する手作りの有界次元は、広い環境のより迅速な探索に繋がるが、有界と無界の両方のアプローチは、多様な地形の解決に成功している。
- 参考スコア(独自算出の注目度): 1.4502611532302039
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Creatures in the real world constantly encounter new and diverse challenges
they have never seen before. They will often need to adapt to some of these
tasks and solve them in order to survive. This almost endless world of novel
challenges is not as common in virtual environments, where artificially
evolving agents often have a limited set of tasks to solve. An exception to
this is the field of open-endedness where the goal is to create unbounded
exploration of interesting artefacts. We want to move one step closer to
creating simulated environments similar to the diverse real world, where agents
can both find solvable tasks, and adapt to them. Through the use of MAP-Elites
we create a structured repertoire, a map, of terrains and virtual creatures
that locomote through them. By using novelty as a dimension in the grid, the
map can continuously develop to encourage exploration of new environments. The
agents must adapt to the environments found, but can also search for
environments within each cell of the grid to find the one that best fits their
set of skills. Our approach combines the structure of MAP-Elites, which can
allow the virtual creatures to use adjacent cells as stepping stones to solve
increasingly difficult environments, with open-ended innovation. This leads to
a search that is unbounded, but still has a clear structure. We find that while
handcrafted bounded dimensions for the map lead to quicker exploration of a
large set of environments, both the bounded and unbounded approach manage to
solve a diverse set of terrains.
- Abstract(参考訳): 現実世界の生き物は、これまで見たことのない新しい多様な課題に常に遭遇する。
生き残るためには、これらのタスクのいくつかに適応し、解決する必要があります。
このほぼ無限の新たな課題の世界は、人工進化エージェントが解決すべきタスクセットが限られている仮想環境では一般的ではない。
例外として、興味深いアーティファクトの非有界探索を目標とするオープン・エンディネスの分野がある。
私たちは、エージェントが解決可能なタスクを見つけ、それらに適応できる、多様な現実世界に似たシミュレーション環境に一歩近づきたいと思っています。
MAP-Elitesを使用することで、構造化されたレパートリー、地図、地形、仮想生物などを作り、それらを通り抜ける。
グリッドの次元としてノベルティを用いることで、地図は継続的に発展し、新しい環境の探索を促進することができる。
エージェントは見つかった環境に適応する必要があるが、グリッドの各セル内の環境を検索して、スキルセットに最適な環境を見つけることもできる。
我々のアプローチは、マップエライトの構造を組み合わせることで、仮想生物が隣り合った細胞を足踏み石として利用し、ますます困難な環境を解決することができる。
これは非有界な検索につながるが、まだ明確な構造を持っている。
地図のための手作りの有界次元は、大規模な環境のより迅速な探索につながりますが、有界と非有界の両方のアプローチは、多様な地形の解決に役立ちます。
関連論文リスト
- ReALFRED: An Embodied Instruction Following Benchmark in Photo-Realistic Environments [13.988804095409133]
本研究では,実世界のシーン,オブジェクト,部屋のレイアウトを取り入れたReALFREDベンチマークを提案する。
具体的には、視覚領域のギャップを小さくした環境空間を更新したALFREDベンチマークを拡張する。
ReALFREDでは、以前作られたALFREDベンチマークのメソッドを分析し、すべてのメトリクスで一貫して低いパフォーマンスが得られることを観察する。
論文 参考訳(メタデータ) (2024-07-26T07:00:27Z) - AI planning in the imagination: High-level planning on learned abstract
search spaces [68.75684174531962]
我々は,エージェントが訓練中に学習する抽象的な検索空間において,エージェントが計画することを可能にする,PiZeroと呼ばれる新しい手法を提案する。
本研究では,旅行セールスマン問題,ソコバン問題,2048年,施設立地問題,パックマン問題など,複数の分野で評価を行った。
論文 参考訳(メタデータ) (2023-08-16T22:47:16Z) - Learning Hierarchical Interactive Multi-Object Search for Mobile
Manipulation [10.21450780640562]
本稿では,ロボットが扉を開けて部屋をナビゲートし,キャビネットや引き出しの中を探索し,対象物を見つける,インタラクティブな多目的探索タスクを提案する。
これらの新たな課題は、探索されていない環境での操作とナビゲーションのスキルを組み合わせる必要がある。
本研究では,探索,ナビゲーション,操作のスキルを習得する階層的強化学習手法であるHIMOSを提案する。
論文 参考訳(メタデータ) (2023-07-12T12:25:33Z) - CoDEPS: Online Continual Learning for Depth Estimation and Panoptic
Segmentation [28.782231314289174]
深層学習に基づく単眼深度推定とパノプティックセグメンテーションのための連続学習をオンラインで導入する。
そこで本研究では,パノプティカルセグメンテーションに適応する擬似ラベルを生成するための新しいドメイン混合手法を提案する。
我々は,固定サイズのリプレイバッファを構築するためのサンプリング戦略を活用することで,ロボットシステムの限られたストレージ容量に明示的に対処する。
論文 参考訳(メタデータ) (2023-03-17T17:31:55Z) - WILD-SCAV: Benchmarking FPS Gaming AI on Unity3D-based Environments [5.020816812380825]
深部強化学習(RL)の最近の進歩は,シミュレーション環境における複雑な意思決定能力を示している。
しかしながら、これらは、トレーニングやテストが行われる環境の複雑さやバリエーションが欠如しているため、より複雑な問題はほとんどありません。
我々は,このギャップを埋めるために,3次元オープンワールドFPSゲームに基づく,強力でオープンな環境であるWILD-SCAVを開発した。
エージェントは3D環境を理解し、ナビゲートし、計画し、人間のような方法で競争し、協力することができる。
論文 参考訳(メタデータ) (2022-10-14T13:39:41Z) - Spot the Difference: A Novel Task for Embodied Agents in Changing
Environments [43.52107532692226]
Embodied AIは、環境の中で動き、操作できるインテリジェントなエージェントを作ることを目指している。
本研究では,エージェントが時代遅れの環境マップにアクセス可能なEmbodied AIのための新しいタスクであるSpot the differenceを提案する。
本研究では,環境に関する過去の知見を活かし,既存のエージェントよりも迅速かつ効果的に現場の変化を識別する探索政策を提案する。
論文 参考訳(メタデータ) (2022-04-18T18:30:56Z) - EnvEdit: Environment Editing for Vision-and-Language Navigation [98.30038910061894]
Vision-and-Language Navigation (VLN)では、エージェントは自然言語命令に基づいて環境をナビゲートする必要がある。
本研究では,既存の環境を編集して新しい環境を作成するデータ拡張手法であるEnvEditを提案する。
提案手法は,事前学習および未学習のVLNエージェントにおいて,すべての指標において有意な改善が得られたことを示す。
論文 参考訳(メタデータ) (2022-03-29T15:44:32Z) - Fully Online Meta-Learning Without Task Boundaries [80.09124768759564]
この性質のオンライン問題にメタラーニングを適用する方法について検討する。
タスク境界に関する基礎的な真理知識を必要としない完全オンラインメタラーニング(FOML)アルゴリズムを提案する。
実験の結果,FOMLは最先端のオンライン学習手法よりも高速に新しいタスクを学習できることがわかった。
論文 参考訳(メタデータ) (2022-02-01T07:51:24Z) - Learning Affordance Landscapes for Interaction Exploration in 3D
Environments [101.90004767771897]
エージェントは環境の仕組みを習得できなければならない。
相互作用探索のための強化学習手法を提案する。
AI2-iTHORで私たちのアイデアを実証します。
論文 参考訳(メタデータ) (2020-08-21T00:29:36Z) - Learning to Move with Affordance Maps [57.198806691838364]
物理的な空間を自律的に探索し、ナビゲートする能力は、事実上あらゆる移動型自律エージェントの基本的な要件である。
従来のSLAMベースの探索とナビゲーションのアプローチは、主にシーン幾何学の活用に重点を置いている。
学習可能な余剰マップは探索と航法の両方において従来のアプローチの強化に利用でき、性能が大幅に向上することを示します。
論文 参考訳(メタデータ) (2020-01-08T04:05:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。