論文の概要: Object Goal Navigation using Data Regularized Q-Learning
- arxiv url: http://arxiv.org/abs/2208.13009v1
- Date: Sat, 27 Aug 2022 13:26:30 GMT
- ステータス: 処理完了
- システム内更新日: 2022-08-30 14:20:33.959174
- Title: Object Goal Navigation using Data Regularized Q-Learning
- Title(参考訳): データ正規化Q-Learningを用いたオブジェクトゴールナビゲーション
- Authors: Nandiraju Gireesh, D. A. Sasi Kiran, Snehasis Banerjee, Mohan
Sridharan, Brojeshwar Bhowmick, Madhava Krishna
- Abstract要約: Object Goal Navigationでは、ロボットが未確認の環境で対象のオブジェクトクラスのインスタンスを探し、ナビゲートする必要がある。
我々のフレームワークは、時間とともに環境のセマンティックマップを段階的に構築し、その後、長期的目標を何度も選択します。
長期的なゴール選択は、視覚に基づく深層強化学習問題として定式化される。
- 参考スコア(独自算出の注目度): 9.65323691689801
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Object Goal Navigation requires a robot to find and navigate to an instance
of a target object class in a previously unseen environment. Our framework
incrementally builds a semantic map of the environment over time, and then
repeatedly selects a long-term goal ('where to go') based on the semantic map
to locate the target object instance. Long-term goal selection is formulated as
a vision-based deep reinforcement learning problem. Specifically, an Encoder
Network is trained to extract high-level features from a semantic map and
select a long-term goal. In addition, we incorporate data augmentation and
Q-function regularization to make the long-term goal selection more effective.
We report experimental results using the photo-realistic Gibson benchmark
dataset in the AI Habitat 3D simulation environment to demonstrate substantial
performance improvement on standard measures in comparison with a state of the
art data-driven baseline.
- Abstract(参考訳): Object Goal Navigationでは、ロボットが未確認の環境で対象のオブジェクトクラスのインスタンスを探し、ナビゲートする必要がある。
私たちのフレームワークは、時間とともに環境のセマンティックマップを段階的に構築し、ターゲットオブジェクトインスタンスを見つけるためのセマンティックマップに基づいて、長期目標('どこへ行くか')を繰り返し選択します。
長期目標選択はビジョンに基づく深層強化学習問題として定式化されている。
具体的には、エンコーダネットワークを訓練して、セマンティックマップからハイレベルな特徴を抽出し、長期的な目標を選択する。
さらに,長期目標選択をより効果的にするために,データ拡張とq関数正規化が組み込まれている。
本稿では,AI Habitat 3Dシミュレーション環境におけるフォトリアリスティックGibsonベンチマークデータセットを用いた実験結果について報告する。
関連論文リスト
- Probable Object Location (POLo) Score Estimation for Efficient Object
Goal Navigation [15.623723522165731]
本稿では,POLo(Probable Object Location)スコアを中心とした新しいフレームワークを提案する。
計算集約的なPOLoスコアを近似するためにトレーニングされたニューラルネットワークであるPOLoNetを導入することで、フレームワークの実用性をさらに向上する。
OVMM 2023チャレンジの第1フェーズを含む実験では,POLoNetを組み込んだエージェントが,幅広いベースライン手法を著しく上回ることを示した。
論文 参考訳(メタデータ) (2023-11-14T08:45:32Z) - NoMaD: Goal Masked Diffusion Policies for Navigation and Exploration [57.15811390835294]
本稿では,目標指向ナビゲーションと目標非依存探索の両方を扱うために,単一の統合拡散政策をトレーニングする方法について述べる。
この統一された政策は、新しい環境における目標を視覚的に示す際に、全体的な性能が向上することを示す。
実世界の移動ロボットプラットフォーム上で実施した実験は,5つの代替手法と比較して,見えない環境における効果的なナビゲーションを示す。
論文 参考訳(メタデータ) (2023-10-11T21:07:14Z) - How To Not Train Your Dragon: Training-free Embodied Object Goal
Navigation with Semantic Frontiers [94.46825166907831]
Embodied AIにおけるオブジェクトゴールナビゲーション問題に対処するためのトレーニング不要のソリューションを提案する。
本手法は,古典的な視覚的同時ローカライゼーションとマッピング(V-SLAM)フレームワークに基づく,構造化されたシーン表現を構築する。
本手法は,言語先行情報とシーン統計に基づいてシーングラフのセマンティクスを伝搬し,幾何学的フロンティアに意味知識を導入する。
論文 参考訳(メタデータ) (2023-05-26T13:38:33Z) - LTS-NET: End-to-end Unsupervised Learning of Long-Term 3D Stable objects [7.491472577165315]
本稿では,静的なオブジェクトと動的オブジェクトを区別した,オブジェクトの長期的安定性を決定するエンドツーエンドのデータ駆動パイプラインを提案する。
私たちのパイプラインには、環境からの履歴データを利用してニューラルネットワークのトレーニングデータを生成するラベル付け手法が含まれています。
NCLTデータセットの2つの駐車場から得られる点雲データを用いて,提案手法が静的安定度と動的オブジェクト分類の分類モデルの直接訓練より優れていることを示す。
論文 参考訳(メタデータ) (2023-01-09T15:24:19Z) - Long-HOT: A Modular Hierarchical Approach for Long-Horizon Object
Transport [83.06265788137443]
我々は、時間的拡張ナビゲーションのための新しいオブジェクトトランスポートタスクと新しいモジュラーフレームワークを提案することで、長距離探査と航法を具現化する上で重要な課題に対処する。
私たちの最初の貢献は、深層探査と長期計画に焦点を当てた新しいLong-HOT環境の設計である。
重み付けされたフロンティアの助けを借りて探索を行うために,シーンのトポロジカルグラフを構築するモジュラー階層輸送ポリシー(HTP)を提案する。
論文 参考訳(メタデータ) (2022-10-28T05:30:49Z) - Navigating to Objects in Unseen Environments by Distance Prediction [16.023495311387478]
推定距離マップに基づいて経路計画を直接実行可能なオブジェクトゴールナビゲーションフレームワークを提案する。
具体的には,鳥眼のセマンティックマップを入力として,地図セルから対象物までの距離を推定する。
推定距離マップを用いて、エージェントは環境を探索し、人間設計または学習されたナビゲーションポリシーに基づいて対象物に移動することができる。
論文 参考訳(メタデータ) (2022-02-08T09:22:50Z) - Landmark Policy Optimization for Object Navigation Task [77.34726150561087]
本研究は,未確認環境において,与えられたセマンティックカテゴリに関連する最も近いオブジェクトにナビゲートするオブジェクトゴールナビゲーションタスクについて研究する。
最近の研究は、エンドツーエンドの強化学習アプローチとモジュールシステムの両方において大きな成果を上げていますが、堅牢で最適なものにするには大きな前進が必要です。
本稿では,これらのランドマークを抽出する手法として,標準的なタスクの定式化とランドマークとしての付加的な地域知識を取り入れた階層的手法を提案する。
論文 参考訳(メタデータ) (2021-09-17T12:28:46Z) - TDIOT: Target-driven Inference for Deep Video Object Tracking [0.2457872341625575]
本研究では,事前訓練したMask R-CNNディープオブジェクト検出器をベースラインとして採用する。
本研究では,Mask R-CNNのFPN-ResNet101バックボーン上に新しい推論アーキテクチャを導入し,検出と追跡を共同で行う。
提案する単一オブジェクトトラッカであるtdiotは、データアソシエーションに外観類似性に基づく時間マッチングを適用する。
論文 参考訳(メタデータ) (2021-03-19T20:45:06Z) - Learning Long-term Visual Dynamics with Region Proposal Interaction
Networks [75.06423516419862]
オブジェクト間およびオブジェクト環境間の相互作用を長距離にわたってキャプチャするオブジェクト表現を構築します。
単純だが効果的なオブジェクト表現のおかげで、我々の手法は先行手法よりも大幅に優れている。
論文 参考訳(メタデータ) (2020-08-05T17:48:00Z) - Object Goal Navigation using Goal-Oriented Semantic Exploration [98.14078233526476]
本研究は,未確認環境における対象カテゴリーのインスタンスにナビゲートするオブジェクトゴールナビゲーションの問題を研究する。
本稿では,表層的なセマンティックマップを構築し,効率的に環境を探索する「ゴール指向セマンティック探索」というモジュールシステムを提案する。
論文 参考訳(メタデータ) (2020-07-01T17:52:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。