論文の概要: Graph augmented Deep Reinforcement Learning in the GameRLand3D
environment
- arxiv url: http://arxiv.org/abs/2112.11731v1
- Date: Wed, 22 Dec 2021 08:48:00 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-23 18:15:56.780414
- Title: Graph augmented Deep Reinforcement Learning in the GameRLand3D
environment
- Title(参考訳): GameRLand3D環境におけるグラフ強化深部強化学習
- Authors: Edward Beeching, Maxim Peter, Philippe Marcotte, Jilles Debangoye,
Olivier Simonin, Joshua Romoff, Christian Wolf
- Abstract要約: 強化学習で訓練された低レベルポリシーとグラフに基づく高レベル古典プランナを組み合わせたハイブリッド手法を提案する。
本研究では,広範囲な環境下でのエンドツーエンドの深部RLアプローチの限界を定量的に検証する。
また、新しいベンチマークである"GameRLand3D"を導入し、間もなくリリースされる環境では、ナビゲーションタスクのための複雑な手続き型3Dマップを生成することができる。
- 参考スコア(独自算出の注目度): 11.03710870581386
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We address planning and navigation in challenging 3D video games featuring
maps with disconnected regions reachable by agents using special actions. In
this setting, classical symbolic planners are not applicable or difficult to
adapt. We introduce a hybrid technique combining a low level policy trained
with reinforcement learning and a graph based high level classical planner. In
addition to providing human-interpretable paths, the approach improves the
generalization performance of an end-to-end approach in unseen maps, where it
achieves a 20% absolute increase in success rate over a recurrent end-to-end
agent on a point to point navigation task in yet unseen large-scale maps of
size 1km x 1km. In an in-depth experimental study, we quantify the limitations
of end-to-end Deep RL approaches in vast environments and we also introduce
"GameRLand3D", a new benchmark and soon to be released environment can generate
complex procedural 3D maps for navigation tasks.
- Abstract(参考訳): 特別行動を用いたエージェントが到達可能な非接続領域の地図を特徴とする3Dゲームにおける計画とナビゲーションの課題に対処する。
この設定では、古典的な記号プランナーは適用できないか、適応が難しい。
強化学習で訓練された低レベルポリシーとグラフに基づく高レベル古典プランナを組み合わせたハイブリッド手法を提案する。
人間の解釈可能な経路を提供することに加えて、この手法は、未確認の地図におけるエンドツーエンドアプローチの一般化性能を改善し、1km×1kmの大規模地図では、ポイント・ツー・ポイント・ナビゲーションタスクにおいて、繰り返しエンド・ツー・エンドエージェントよりも20%絶対的な成功率の向上を達成する。
In-deepth experimental study, we quantify the limit of end-to-end Deep RL approach in vast environment and we also also introduced "GameRLand3D, a new benchmark and soon to release environment can generate complex procedural 3D map for navigation task。
関連論文リスト
- Versatile Navigation under Partial Observability via Value-guided Diffusion Policy [14.967107015417943]
部分観測可能条件下での2次元および3次元経路計画のための多目的拡散に基づくアプローチを提案する。
具体的には、価値誘導拡散政策は、まず様々な段階にわたって行動を予測する計画を生成する。
次に、状態推定を伴う微分可能なプランナーを用いて値関数を導出し、エージェントの探索とゴール探索の振る舞いを指示する。
論文 参考訳(メタデータ) (2024-04-01T19:52:08Z) - Deep Reinforcement Learning with Dynamic Graphs for Adaptive Informative Path Planning [22.48658555542736]
ロボットデータ取得における重要な課題は、当初未知の環境を抜けて観測を収集する計画経路である。
そこで本研究では,未知の3D環境において,ロボット経路を適応的に計画し,対象をマップする深層強化学習手法を提案する。
論文 参考訳(メタデータ) (2024-02-07T14:24:41Z) - How To Not Train Your Dragon: Training-free Embodied Object Goal
Navigation with Semantic Frontiers [94.46825166907831]
Embodied AIにおけるオブジェクトゴールナビゲーション問題に対処するためのトレーニング不要のソリューションを提案する。
本手法は,古典的な視覚的同時ローカライゼーションとマッピング(V-SLAM)フレームワークに基づく,構造化されたシーン表現を構築する。
本手法は,言語先行情報とシーン統計に基づいてシーングラフのセマンティクスを伝搬し,幾何学的フロンティアに意味知識を導入する。
論文 参考訳(メタデータ) (2023-05-26T13:38:33Z) - GraphCSPN: Geometry-Aware Depth Completion via Dynamic GCNs [49.55919802779889]
本稿では,グラフ畳み込みに基づく空間伝搬ネットワーク(GraphCSPN)を提案する。
本研究では、幾何学的表現学習において、畳み込みニューラルネットワークとグラフニューラルネットワークを相補的に活用する。
提案手法は,数段の伝搬ステップのみを使用する場合と比較して,最先端の性能を実現する。
論文 参考訳(メタデータ) (2022-10-19T17:56:03Z) - Bridging the Gap Between Learning in Discrete and Continuous
Environments for Vision-and-Language Navigation [41.334731014665316]
ヴィジュアル・アンド・ランゲージ・ナビゲーション(VLN)における既存の作業のほとんどは、離散的または連続的な環境に焦点を当てている。
ナビゲーション中に候補となるウェイポイントの集合を生成するための予測器を提案する。
予測された経路点を持つ連続環境を航行するエージェントは,低レベル動作を使用するエージェントよりも有意に優れた性能を示す。
論文 参考訳(メタデータ) (2022-03-05T14:56:14Z) - ViKiNG: Vision-Based Kilometer-Scale Navigation with Geographic Hints [94.60414567852536]
長距離航法には、計画と局所的な移動可能性の推論の両方が必要である。
学習と計画を統合する学習に基づくアプローチを提案する。
ViKiNGは、画像ベースの学習コントローラを利用できる。
論文 参考訳(メタデータ) (2022-02-23T02:14:23Z) - Landmark Policy Optimization for Object Navigation Task [77.34726150561087]
本研究は,未確認環境において,与えられたセマンティックカテゴリに関連する最も近いオブジェクトにナビゲートするオブジェクトゴールナビゲーションタスクについて研究する。
最近の研究は、エンドツーエンドの強化学習アプローチとモジュールシステムの両方において大きな成果を上げていますが、堅牢で最適なものにするには大きな前進が必要です。
本稿では,これらのランドマークを抽出する手法として,標準的なタスクの定式化とランドマークとしての付加的な地域知識を取り入れた階層的手法を提案する。
論文 参考訳(メタデータ) (2021-09-17T12:28:46Z) - Hierarchical Robot Navigation in Novel Environments using Rough 2-D Maps [21.245942227850733]
本研究では,環境の粗い2次元マップを利用して,新たな環境を探索する手法を提案する。
低レベルのコントローラはローカルな振る舞いでしか訓練されないので、このフレームワークは新しい環境に一般化することができます。
実測環境と新鮮環境の両方において,提案手法の有効性を示す実験結果が得られた。
論文 参考訳(メタデータ) (2021-06-07T14:42:51Z) - Occupancy Anticipation for Efficient Exploration and Navigation [97.17517060585875]
そこで我々は,エージェントが自我中心のRGB-D観測を用いて,その占有状態を可視領域を超えて推定する,占有予測を提案する。
エゴセントリックなビューとトップダウンマップの両方でコンテキストを活用することで、私たちのモデルは環境のより広いマップを予測できます。
われわれのアプローチは、2020 Habitat PointNav Challengeの優勝だ。
論文 参考訳(メタデータ) (2020-08-21T03:16:51Z) - Improving Target-driven Visual Navigation with Attention on 3D Spatial
Relationships [52.72020203771489]
3次元屋内シーンにおける深部強化学習(DRL)を用いた目標駆動型視覚ナビゲーションについて検討した。
提案手法は視覚特徴と3次元空間表現を組み合わせてナビゲーションポリシーを学習する。
AI2-THORで実施した我々の実験は、SRとSPLの指標において、モデルがベースラインを上回っていることを示している。
論文 参考訳(メタデータ) (2020-04-29T08:46:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。