論文の概要: Deep Reinforcement Learning Based Navigation with Macro Actions and Topological Maps
- arxiv url: http://arxiv.org/abs/2504.18300v1
- Date: Fri, 25 Apr 2025 12:19:35 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-02 19:15:53.76253
- Title: Deep Reinforcement Learning Based Navigation with Macro Actions and Topological Maps
- Title(参考訳): マクロアクションとトポロジカルマップを用いた深層強化学習に基づくナビゲーション
- Authors: Simon Hakenes, Tobias Glasmachers,
- Abstract要約: 本稿では,広角で視覚的に複雑な環境でのナビゲーションの課題に対処する。
本稿では,トポロジカルマップ上に構築されたオブジェクト指向マクロアクションを用いて,簡単なQ-Networkで効果的なナビゲーションポリシーを学習する手法を提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: This paper addresses the challenge of navigation in large, visually complex environments with sparse rewards. We propose a method that uses object-oriented macro actions grounded in a topological map, allowing a simple Deep Q-Network (DQN) to learn effective navigation policies. The agent builds a map by detecting objects from RGBD input and selecting discrete macro actions that correspond to navigating to these objects. This abstraction drastically reduces the complexity of the underlying reinforcement learning problem and enables generalization to unseen environments. We evaluate our approach in a photorealistic 3D simulation and show that it significantly outperforms a random baseline under both immediate and terminal reward conditions. Our results demonstrate that topological structure and macro-level abstraction can enable sample-efficient learning even from pixel data.
- Abstract(参考訳): 本稿では,広角で視覚的に複雑な環境でのナビゲーションの課題に対処する。
本稿では,トポロジカルマップ上に構築されたオブジェクト指向マクロアクションを用いて,DQN(Deep Q-Network)を用いて効果的なナビゲーションポリシーを学習する手法を提案する。
エージェントは、RGBD入力からオブジェクトを検出し、これらのオブジェクトへのナビゲートに対応する個別のマクロアクションを選択することで、マップを構築する。
この抽象化は、基礎となる強化学習問題の複雑さを大幅に減らし、目に見えない環境への一般化を可能にする。
本研究では,フォトリアリスティックな3Dシミュレーションにおけるアプローチを評価し,即時および終末の報酬条件下でのランダムなベースラインよりも有意に優れていることを示す。
その結果, トポロジ的構造とマクロレベルの抽象化により, 画素データからでもサンプル効率のよい学習が可能であることが示唆された。
関連論文リスト
- Online Embedding Multi-Scale CLIP Features into 3D Maps [2.624282086797512]
本研究では,マルチスケールCLIP機能を3次元地図にオンライン埋め込みする手法を提案する。
CLIPを活用することで、この手法は従来の語彙制限手法の制約を超越する。
基本的に,本手法は,不慣れな環境のリアルタイムなオブジェクト探索とマッピングを同時に実現している。
論文 参考訳(メタデータ) (2024-03-27T01:12:31Z) - Hierarchical Spatial Proximity Reasoning for Vision-and-Language Navigation [1.2473780585666772]
多くのVision-and-Language Navigation (VLN)アルゴリズムは、視覚的常識の欠如と限られた推論能力のために不正確な決定をする傾向がある。
本稿では,階層的空間近接の知識基盤構築を支援するために,階層的空間近接推論(HSPR)手法を提案する。
我々は、REVERIE、SOON、R2R、R4Rなどの公開データセットで実験を行い、我々のアプローチを検証する。
論文 参考訳(メタデータ) (2024-03-18T07:51:22Z) - Leveraging Topological Maps in Deep Reinforcement Learning for
Multi-Object Navigation [0.0]
本研究は,Reinforcement Learning (RL) によるスパース報酬による拡張空間のナビゲートという課題に対処する。
トポロジカルマップを用いて、基本動作をオブジェクト指向マクロアクションに高め、単純な深層Q-Network (DQN) エージェントが事実上不可能な環境を解決できるようにする。
論文 参考訳(メタデータ) (2023-10-16T10:19:45Z) - Object Goal Navigation with Recursive Implicit Maps [92.6347010295396]
対象目標ナビゲーションのための暗黙的な空間マップを提案する。
提案手法は, 挑戦的なMP3Dデータセット上での技量を著しく上回る。
我々は、実際のロボットにモデルをデプロイし、実際のシーンでオブジェクトゴールナビゲーションの結果を奨励する。
論文 参考訳(メタデータ) (2023-08-10T14:21:33Z) - Weakly-supervised Contrastive Learning for Unsupervised Object Discovery [52.696041556640516]
ジェネリックな方法でオブジェクトを発見できるため、教師なしのオブジェクト発見は有望である。
画像から高レベルな意味的特徴を抽出する意味誘導型自己教師学習モデルを設計する。
オブジェクト領域のローカライズのための主成分分析(PCA)を導入する。
論文 参考訳(メタデータ) (2023-07-07T04:03:48Z) - Representations and Exploration for Deep Reinforcement Learning using
Singular Value Decomposition [29.237357850947433]
ドメインの基底となる遷移構造を保存する表現を得るために,特異値分解に基づく手法を提案する。
これらの表現は、状態訪問の相対的な頻度をキャプチャし、擬似カウントを無償で見積もることも示している。
一部観測可能な領域を用いたマルチタスク設定実験により,提案手法はDM-Lab-30環境上で有用な表現を学習できるだけでなく,DM-Hard-8環境におけるハードな探索作業にも有効であることを示す。
論文 参考訳(メタデータ) (2023-05-01T04:26:03Z) - Landmark Policy Optimization for Object Navigation Task [77.34726150561087]
本研究は,未確認環境において,与えられたセマンティックカテゴリに関連する最も近いオブジェクトにナビゲートするオブジェクトゴールナビゲーションタスクについて研究する。
最近の研究は、エンドツーエンドの強化学習アプローチとモジュールシステムの両方において大きな成果を上げていますが、堅牢で最適なものにするには大きな前進が必要です。
本稿では,これらのランドマークを抽出する手法として,標準的なタスクの定式化とランドマークとしての付加的な地域知識を取り入れた階層的手法を提案する。
論文 参考訳(メタデータ) (2021-09-17T12:28:46Z) - Deep Structured Prediction for Facial Landmark Detection [59.60946775628646]
本稿では,深層畳み込みネットワークと条件付きランダムフィールドを組み合わせた深層構造顔のランドマーク検出手法を提案する。
顔のランドマーク検出における最先端技術よりも優れた性能を示す。
論文 参考訳(メタデータ) (2020-10-18T17:09:24Z) - Visuomotor Mechanical Search: Learning to Retrieve Target Objects in
Clutter [43.668395529368354]
本稿では,教師支援による探索,特権情報による批判,中間レベルの表現を組み合わせた新しい深部RL手順を提案する。
我々のアプローチは、ベースラインやアブレーションよりも高速に学習し、より効率的な解の発見に収束する。
論文 参考訳(メタデータ) (2020-08-13T18:23:00Z) - Object Goal Navigation using Goal-Oriented Semantic Exploration [98.14078233526476]
本研究は,未確認環境における対象カテゴリーのインスタンスにナビゲートするオブジェクトゴールナビゲーションの問題を研究する。
本稿では,表層的なセマンティックマップを構築し,効率的に環境を探索する「ゴール指向セマンティック探索」というモジュールシステムを提案する。
論文 参考訳(メタデータ) (2020-07-01T17:52:32Z) - Neural Topological SLAM for Visual Navigation [112.73876869904]
意味論を生かし、近似幾何学的推論を行う空間のトポロジ的表現を設計する。
本稿では,ノイズのあるアクティベーションの下でそのような表現を構築し,維持し,使用することができる教師付き学習ベースアルゴリズムについて述べる。
論文 参考訳(メタデータ) (2020-05-25T17:56:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。