論文の概要: Learning-Augmented Model-Based Planning for Visual Exploration
- arxiv url: http://arxiv.org/abs/2211.07898v1
- Date: Tue, 15 Nov 2022 04:53:35 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-16 15:37:11.027732
- Title: Learning-Augmented Model-Based Planning for Visual Exploration
- Title(参考訳): 視覚探索のための学習型モデルベースプランニング
- Authors: Yimeng Li, Arnab Debnath, Gregory Stein, Jana Kosecka
- Abstract要約: 学習型モデルベースプランニングを用いた新しい探索手法を提案する。
我々は、現在の地図上のフロンティアに関連する一連のサブゴールを生成し、これらのサブゴールを探索するためのベルマン方程式を導出する。
屋内シーンの視覚センシングとセマンティックマッピングの進歩を利用して、深層畳み込みニューラルネットワークをトレーニングし、各フロンティアに関連する特性を推定する。
提案したモデルベースプランナは,時間的許諾が得られれば,全シーンを探索することが保証される。
- 参考スコア(独自算出の注目度): 8.870188183999854
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We consider the problem of time-limited robotic exploration in previously
unseen environments where exploration is limited by a predefined amount of
time. We propose a novel exploration approach using learning-augmented
model-based planning. We generate a set of subgoals associated with frontiers
on the current map and derive a Bellman Equation for exploration with these
subgoals. Visual sensing and advances in semantic mapping of indoor scenes are
exploited for training a deep convolutional neural network to estimate
properties associated with each frontier: the expected unobserved area beyond
the frontier and the expected timesteps (discretized actions) required to
explore it. The proposed model-based planner is guaranteed to explore the whole
scene if time permits. We thoroughly evaluate our approach on a large-scale
pseudo-realistic indoor dataset (Matterport3D) with the Habitat simulator. We
compare our approach with classical and more recent RL-based exploration
methods, demonstrating its clear advantages in several settings.
- Abstract(参考訳): 我々は,事前定義された時間によって探索が制限された未発見環境における時間制限型ロボット探索の問題を考える。
学習型モデルベースプランニングを用いた新しい探索手法を提案する。
我々は,現在の地図上でフロンティアに関連する一連のサブゴールを生成し,これらのサブゴールを用いた探索のためのベルマン方程式を導出する。
視覚センシングと室内シーンの意味マッピングの進歩は、それぞれのフロンティアに関連する特性を推定するために深い畳み込みニューラルネットワークを訓練するために活用されている。
提案したモデルベースプランナは,時間的許諾があれば,全シーンを探索することが保証される。
habitat simulatorを用いた大規模疑似現実的屋内データセット(matterport3d)のアプローチを徹底的に評価した。
我々は,従来のRLに基づく探索手法と比較し,いくつかの設定で明らかな利点を示す。
関連論文リスト
- AI planning in the imagination: High-level planning on learned abstract
search spaces [68.75684174531962]
我々は,エージェントが訓練中に学習する抽象的な検索空間において,エージェントが計画することを可能にする,PiZeroと呼ばれる新しい手法を提案する。
本研究では,旅行セールスマン問題,ソコバン問題,2048年,施設立地問題,パックマン問題など,複数の分野で評価を行った。
論文 参考訳(メタデータ) (2023-08-16T22:47:16Z) - How To Not Train Your Dragon: Training-free Embodied Object Goal
Navigation with Semantic Frontiers [94.46825166907831]
Embodied AIにおけるオブジェクトゴールナビゲーション問題に対処するためのトレーニング不要のソリューションを提案する。
本手法は,古典的な視覚的同時ローカライゼーションとマッピング(V-SLAM)フレームワークに基づく,構造化されたシーン表現を構築する。
本手法は,言語先行情報とシーン統計に基づいてシーングラフのセマンティクスを伝搬し,幾何学的フロンティアに意味知識を導入する。
論文 参考訳(メタデータ) (2023-05-26T13:38:33Z) - Incremental 3D Scene Completion for Safe and Efficient Exploration
Mapping and Planning [60.599223456298915]
本研究では,情報,安全,解釈可能な地図作成と計画に3次元シーン補完を活用することによって,深層学習を探索に統合する新しい手法を提案する。
本手法は,地図の精度を最小限に抑えることで,ベースラインに比べて環境のカバレッジを73%高速化できることを示す。
最終地図にシーン完了が含まれていなくても、ロボットがより情報的な経路を選択するように誘導し、ロボットのセンサーでシーンの測定を35%高速化できることが示される。
論文 参考訳(メタデータ) (2022-08-17T14:19:33Z) - Focus on Impact: Indoor Exploration with Intrinsic Motivation [45.97756658635314]
そこで本研究では,純粋に本質的な報酬信号を用いたモデルによる探索指導を提案する。
ニューラルベース密度モデルを含み、従来のカウントベースの正規化を、以前に訪れた状態の擬似数で置き換える。
また,提案手法を取り入れたロボットが,ポイントゴールナビゲーションや実世界展開にシームレスに適応することを示す。
論文 参考訳(メタデータ) (2021-09-14T18:00:07Z) - MADE: Exploration via Maximizing Deviation from Explored Regions [48.49228309729319]
オンライン強化学習(RL)では、高次元環境における効率的な探索は依然として困難であり、報酬は少ない。
調査地域からの次の政策の逸脱を最大化することによる新たな探索手法を提案する。
提案手法は,最先端手法よりもサンプル効率を著しく向上させる。
論文 参考訳(メタデータ) (2021-06-18T17:57:00Z) - Deep Reinforcement Learning for Adaptive Exploration of Unknown
Environments [6.90777229452271]
私達はUAVのための1つのステップで調査および搾取間のトレードオフに適応的な調査のアプローチを開発します。
提案手法では, 環境マップを小型でトラクタブルな地図に分解するために, マップセグメンテーション手法を用いる。
その結果,本提案手法は,ランダムに生成された環境をナビゲートし,ベースラインと比較してAoIを短時間でカバーできることが示された。
論文 参考訳(メタデータ) (2021-05-04T16:29:44Z) - Autonomous UAV Exploration of Dynamic Environments via Incremental
Sampling and Probabilistic Roadmap [0.3867363075280543]
インクリメンタルサンプリングと確率的ロードマップ(PRM)を用いた未知環境探索のための新しい動的探索プランナ(DEP)を提案する。
本手法は, 動的環境を安全に探索し, 探索時間, 経路長, 計算時間でベンチマークプランナーより優れている。
論文 参考訳(メタデータ) (2020-10-14T22:52:37Z) - Latent World Models For Intrinsically Motivated Exploration [140.21871701134626]
画像に基づく観察のための自己教師付き表現学習法を提案する。
我々は、部分的に観測可能な環境の探索を導くために、エピソードおよび寿命の不確実性を考慮する。
論文 参考訳(メタデータ) (2020-10-05T19:47:04Z) - Occupancy Anticipation for Efficient Exploration and Navigation [97.17517060585875]
そこで我々は,エージェントが自我中心のRGB-D観測を用いて,その占有状態を可視領域を超えて推定する,占有予測を提案する。
エゴセントリックなビューとトップダウンマップの両方でコンテキストを活用することで、私たちのモデルは環境のより広いマップを予測できます。
われわれのアプローチは、2020 Habitat PointNav Challengeの優勝だ。
論文 参考訳(メタデータ) (2020-08-21T03:16:51Z) - Long-Term Visitation Value for Deep Exploration in Sparse Reward
Reinforcement Learning [34.38011902445557]
報酬の少ない強化学習は、依然としてオープンな課題である。
本稿では,長期訪問数を用いて,今後の探査行動を計画する新しいアプローチを提案する。
報酬と力学のモデルを使用する既存の方法とは対照的に、我々のアプローチは非政治的でモデルなしです。
論文 参考訳(メタデータ) (2020-01-01T01:01:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。