論文の概要: Spot the Difference: A Novel Task for Embodied Agents in Changing
Environments
- arxiv url: http://arxiv.org/abs/2204.08502v1
- Date: Mon, 18 Apr 2022 18:30:56 GMT
- ステータス: 処理完了
- システム内更新日: 2022-04-20 14:43:57.032582
- Title: Spot the Difference: A Novel Task for Embodied Agents in Changing
Environments
- Title(参考訳): 違いを見つける: 変化する環境における具体化エージェントのための新しいタスク
- Authors: Federico Landi, Roberto Bigazzi, Marcella Cornia, Silvia Cascianelli,
Lorenzo Baraldi and Rita Cucchiara
- Abstract要約: Embodied AIは、環境の中で動き、操作できるインテリジェントなエージェントを作ることを目指している。
本研究では,エージェントが時代遅れの環境マップにアクセス可能なEmbodied AIのための新しいタスクであるSpot the differenceを提案する。
本研究では,環境に関する過去の知見を活かし,既存のエージェントよりも迅速かつ効果的に現場の変化を識別する探索政策を提案する。
- 参考スコア(独自算出の注目度): 43.52107532692226
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Embodied AI is a recent research area that aims at creating intelligent
agents that can move and operate inside an environment. Existing approaches in
this field demand the agents to act in completely new and unexplored scenes.
However, this setting is far from realistic use cases that instead require
executing multiple tasks in the same environment. Even if the environment
changes over time, the agent could still count on its global knowledge about
the scene while trying to adapt its internal representation to the current
state of the environment. To make a step towards this setting, we propose Spot
the Difference: a novel task for Embodied AI where the agent has access to an
outdated map of the environment and needs to recover the correct layout in a
fixed time budget. To this end, we collect a new dataset of occupancy maps
starting from existing datasets of 3D spaces and generating a number of
possible layouts for a single environment. This dataset can be employed in the
popular Habitat simulator and is fully compliant with existing methods that
employ reconstructed occupancy maps during navigation. Furthermore, we propose
an exploration policy that can take advantage of previous knowledge of the
environment and identify changes in the scene faster and more effectively than
existing agents. Experimental results show that the proposed architecture
outperforms existing state-of-the-art models for exploration on this new
setting.
- Abstract(参考訳): Embodied AIは、環境内で動き、操作できるインテリジェントエージェントを作成することを目的とした、最近の研究分野である。
この分野における既存のアプローチは、エージェントに全く新しい未調査のシーンで行動するよう要求する。
しかし、この設定は、同じ環境で複数のタスクを実行する必要のある現実的なユースケースとは程遠い。
時間が経つにつれて環境が変化しても、エージェントは内部表現を現在の環境に適応させようとしながら、シーンに関するグローバルな知識をカウントすることができる。
エージェントが環境の古いマップにアクセスでき、一定の時間予算で正しいレイアウトを復元する必要がある、具体化されたaiのための新しいタスクです。
この目的のために,既存の3d空間のデータセットから新たな占有マップのデータセットを収集し,複数の可能なレイアウトを1つの環境に生成する。
このデータセットは人気のあるHabitatシミュレータで使用することができ、ナビゲーション中に再構成された占有マップを使用する既存のメソッドに完全に準拠する。
さらに,従来の環境知識を活用し,既存のエージェントよりも迅速かつ効果的にシーンの変化を識別できる探索方針を提案する。
実験結果から,提案手法は既存の最先端モデルよりも優れた性能を示すことがわかった。
関連論文リスト
- Personalized Instance-based Navigation Toward User-Specific Objects in Realistic Environments [44.6372390798904]
本稿では,特定の個人オブジェクトの位置と到達を具体化するタスクデノマイトされたパーソナライズされたパーソナライズドインスタンスベースのナビゲーション(PIN)を提案する。
各エピソードにおいて、ターゲットオブジェクトは、中性背景上の視覚的参照画像のセットと手動による注釈付きテキスト記述の2つのモードを使用してエージェントに提示される。
論文 参考訳(メタデータ) (2024-10-23T18:01:09Z) - AI planning in the imagination: High-level planning on learned abstract
search spaces [68.75684174531962]
我々は,エージェントが訓練中に学習する抽象的な検索空間において,エージェントが計画することを可能にする,PiZeroと呼ばれる新しい手法を提案する。
本研究では,旅行セールスマン問題,ソコバン問題,2048年,施設立地問題,パックマン問題など,複数の分野で評価を行った。
論文 参考訳(メタデータ) (2023-08-16T22:47:16Z) - Open-ended search for environments and adapted agents using MAP-Elites [1.4502611532302039]
私たちは地形と仮想生物の地図を作成し、それらを補足します。
グリッドの次元としてノベルティを用いることで、地図は継続的に発展し、新しい環境の探索を促進することができる。
地図に対する手作りの有界次元は、広い環境のより迅速な探索に繋がるが、有界と無界の両方のアプローチは、多様な地形の解決に成功している。
論文 参考訳(メタデータ) (2023-05-02T02:03:51Z) - CoDEPS: Online Continual Learning for Depth Estimation and Panoptic
Segmentation [28.782231314289174]
深層学習に基づく単眼深度推定とパノプティックセグメンテーションのための連続学習をオンラインで導入する。
そこで本研究では,パノプティカルセグメンテーションに適応する擬似ラベルを生成するための新しいドメイン混合手法を提案する。
我々は,固定サイズのリプレイバッファを構築するためのサンプリング戦略を活用することで,ロボットシステムの限られたストレージ容量に明示的に対処する。
論文 参考訳(メタデータ) (2023-03-17T17:31:55Z) - EnvEdit: Environment Editing for Vision-and-Language Navigation [98.30038910061894]
Vision-and-Language Navigation (VLN)では、エージェントは自然言語命令に基づいて環境をナビゲートする必要がある。
本研究では,既存の環境を編集して新しい環境を作成するデータ拡張手法であるEnvEditを提案する。
提案手法は,事前学習および未学習のVLNエージェントにおいて,すべての指標において有意な改善が得られたことを示す。
論文 参考訳(メタデータ) (2022-03-29T15:44:32Z) - Rearrangement: A Challenge for Embodied AI [229.8891614821016]
Embodied AIの研究と評価のためのフレームワークについて述べる。
我々の提案は正統的な課題である再配置に基づいている。
4つの異なるシミュレーション環境における再配置シナリオの実験的なテストベッドについて述べる。
論文 参考訳(メタデータ) (2020-11-03T19:42:32Z) - Self-Supervised Policy Adaptation during Deployment [98.25486842109936]
セルフスーパービジョンでは、報酬を使わずに、デプロイ後のトレーニングを継続することができる。
DeepMind Control スイートと ViZDoom の様々なシミュレーション環境で実証評価を行う。
提案手法は,36環境中31環境での一般化を向上し,多くの環境においてドメインランダム化に優れる。
論文 参考訳(メタデータ) (2020-07-08T17:56:27Z) - An Exploration of Embodied Visual Exploration [97.21890864063872]
身体的コンピュータビジョンは、新しい非構造環境におけるロボットに対する知覚を考慮に入れている。
既存の視覚探索アルゴリズムの分類を提示し、それらをベンチマークするための標準フレームワークを作成する。
次に,提案フレームワークを用いた4つの最先端パラダイムの徹底的な実証的研究を行った。
論文 参考訳(メタデータ) (2020-01-07T17:40:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。