論文の概要: FH-DRL: Exponential-Hyperbolic Frontier Heuristics with DRL for accelerated Exploration in Unknown Environments
- arxiv url: http://arxiv.org/abs/2407.18892v2
- Date: Thu, 13 Feb 2025 02:46:13 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-14 13:44:23.740935
- Title: FH-DRL: Exponential-Hyperbolic Frontier Heuristics with DRL for accelerated Exploration in Unknown Environments
- Title(参考訳): FH-DRL:未知環境における高速探査のためのDRLを用いた指数双曲フロンティアヒューリスティックス
- Authors: Seunghyeop Nam, Tuan Anh Nguyen, Eunmi Choi, Dugki Min,
- Abstract要約: 本稿では、FH-DRLという、フロンティア検出のためのカスタマイズ可能な機能と、連続的かつ高速なローカルナビゲーションのためのTwin Delayed DDPG(TD3)エージェントを統合する新しいフレームワークを紹介する。
FH-DRLを複数のシミュレーションおよび実世界のシナリオで徹底的に評価し,旅行距離と完了時間の明確な改善を実証した。
その結果、FH-DRLは、大規模または部分的に知られている環境におけるフロンティアベースの探索の効率的で一般的なアプローチであることがわかった。
- 参考スコア(独自算出の注目度): 1.8749305679160366
- License:
- Abstract: Autonomous robot exploration in large-scale or cluttered environments remains a central challenge in intelligent vehicle applications, where partial or absent prior maps constrain reliable navigation. This paper introduces FH-DRL, a novel framework that integrates a customizable heuristic function for frontier detection with a Twin Delayed DDPG (TD3) agent for continuous, high-speed local navigation. The proposed heuristic relies on an exponential-hyperbolic distance score, which balances immediate proximity against long-range exploration gains, and an occupancy-based stochastic measure, accounting for environmental openness and obstacle densities in real time. By ranking frontiers using these adaptive metrics, FH-DRL targets highly informative yet tractable waypoints, thereby minimizing redundant paths and total exploration time. We thoroughly evaluate FH-DRL across multiple simulated and real-world scenarios, demonstrating clear improvements in travel distance and completion time over frontier-only or purely DRL-based exploration. In structured corridor layouts and maze-like topologies, our architecture consistently outperforms standard methods such as Nearest Frontier, Cognet Frontier Exploration, and Goal Driven Autonomous Exploration. Real-world tests with a Turtlebot3 platform further confirm robust adaptation to previously unseen or cluttered indoor spaces. The results highlight FH-DRL as an efficient and generalizable approach for frontier-based exploration in large or partially known environments, offering a promising direction for various autonomous driving, industrial, and service robotics tasks.
- Abstract(参考訳): 大規模または散在した環境における自律ロボットの探索は、部分的または欠落した事前マップが信頼性の高いナビゲーションを制限しているインテリジェントな車両アプリケーションにおいて、依然として中心的な課題である。
本稿では、フロンティア検出のためのカスタマイズ可能なヒューリスティック関数と、連続的かつ高速なローカルナビゲーションのためのTwin Delayed DDPG(TD3)エージェントを統合する新しいフレームワークであるFH-DRLを紹介する。
提案したヒューリスティックは、遠距離探査利得と即時近接する指数的双曲的距離スコアと、環境開放性と障害物密度をリアルタイムに考慮した占有に基づく確率尺度に依存している。
これらの適応的指標を用いてフロンティアをランク付けすることで、FH-DRLは高度に情報に富むが、難解な経路を目標とし、冗長な経路と全探査時間を最小化する。
我々はFH-DRLを複数のシミュレーションおよび実世界のシナリオで徹底的に評価し、フロンティアのみまたは純粋にDRLに基づく探索よりも旅行距離と完了時間を明確に改善した。
構造化された廊下レイアウトと迷路のようなトポロジでは、私たちのアーキテクチャは、Nearest Frontier、Cagnet Frontier Exploration、Goal Driven Self Explorationといった標準メソッドよりも一貫して優れています。
Turtlebot3プラットフォームを用いた実世界のテストでは、以前は見えなかった、あるいは散らかった屋内空間へのロバストな適応がさらに確認された。
その結果、FH-DRLは、大規模または部分的に知られている環境におけるフロンティアベースの探索のための効率的で一般化可能なアプローチであり、様々な自動運転、産業、サービスロボティクスのタスクに有望な方向性を提供する。
関連論文リスト
- FrontierNet: Learning Visual Cues to Explore [54.8265603996238]
この研究は、3Dマップからゴールポーズを抽出する制限に対処するため、効率的な自律探索に2Dビジュアルキューを活用することを目的としている。
本研究では,FrontierNetをコアコンポーネントとする画像のみのフロンティア探索システムを提案する。
提案手法は既存の3次元探査システムに代わるもので,早期探査効率が16%向上した。
論文 参考訳(メタデータ) (2025-01-08T16:25:32Z) - D5RL: Diverse Datasets for Data-Driven Deep Reinforcement Learning [99.33607114541861]
ロボット操作と移動環境の現実的なシミュレーションに焦点を当てたオフラインRLのための新しいベンチマークを提案する。
提案するベンチマークでは、状態ベースドメインと画像ベースドメインを対象とし、オフラインRLとオンライン微調整評価の両方をサポートしている。
論文 参考訳(メタデータ) (2024-08-15T22:27:00Z) - OTO Planner: An Efficient Only Travelling Once Exploration Planner for Complex and Unknown Environments [6.128246045267511]
オンリートラベル・ワン・プランナー」は複雑な環境下で繰り返し経路を減少させる効率的な探索プランナーである。
高速フロンティア更新、視点評価、視点改善が含まれる。
探査時間と移動距離を10%から20%削減し、フロンティア検出の速度を6~9倍向上させる。
論文 参考訳(メタデータ) (2024-06-11T14:23:48Z) - Aquatic Navigation: A Challenging Benchmark for Deep Reinforcement Learning [53.3760591018817]
ゲームエンジンとDeep Reinforcement Learningの統合の最近の進歩を利用して,水上ナビゲーションのための新しいベンチマーク環境を提案する。
具体的には、最も広く受け入れられているアルゴリズムの一つであるPPOに着目し、先進的なトレーニング手法を提案する。
実験により,これらの成分をうまく組み合わせることで,有望な結果が得られることが示された。
論文 参考訳(メタデータ) (2024-05-30T23:20:23Z) - Efficient Real-time Smoke Filtration with 3D LiDAR for Search and Rescue
with Autonomous Heterogeneous Robotic Systems [56.838297900091426]
スモークとダストは、搭載された知覚システムに依存するため、あらゆる移動ロボットプラットフォームの性能に影響を与える。
本稿では,重みと空間情報に基づく新しいモジュラー計算フィルタを提案する。
論文 参考訳(メタデータ) (2023-08-14T16:48:57Z) - Learning-Augmented Model-Based Planning for Visual Exploration [8.870188183999854]
学習型モデルベースプランニングを用いた新しい探索手法を提案する。
室内シーンの視覚センシングとセマンティックマッピングの進歩が活用される。
提案手法は,2.1%,RLに基づく探査手法8.4%を網羅的に上回っている。
論文 参考訳(メタデータ) (2022-11-15T04:53:35Z) - AirDet: Few-Shot Detection without Fine-tuning for Autonomous
Exploration [16.032316550612336]
本稿では,支援画像とのクラス関係の学習による微調整が不要なAirDetを提案する。
AirDetは、徹底的に微調整された方法と同等またはそれ以上の結果を達成し、ベースラインで最大40~60%の改善を実現している。
DARPA潜水試験における実地探査実験の評価結果について述べる。
論文 参考訳(メタデータ) (2021-12-03T06:41:07Z) - Successor Feature Landmarks for Long-Horizon Goal-Conditioned
Reinforcement Learning [54.378444600773875]
大規模で高次元の環境を探索するフレームワークであるSFL(Successor Feature Landmarks)を紹介する。
SFLは、状態のノベルティを推定して探索を推進し、状態空間を非パラメトリックなランドマークベースのグラフとして抽象化することで、高レベルな計画を可能にする。
我々は,MiniGrid と ViZDoom の実験において,SFL が大規模高次元状態空間の効率的な探索を可能にすることを示す。
論文 参考訳(メタデータ) (2021-11-18T18:36:05Z) - Focus on Impact: Indoor Exploration with Intrinsic Motivation [45.97756658635314]
そこで本研究では,純粋に本質的な報酬信号を用いたモデルによる探索指導を提案する。
ニューラルベース密度モデルを含み、従来のカウントベースの正規化を、以前に訪れた状態の擬似数で置き換える。
また,提案手法を取り入れたロボットが,ポイントゴールナビゲーションや実世界展開にシームレスに適応することを示す。
論文 参考訳(メタデータ) (2021-09-14T18:00:07Z) - Rule-Based Reinforcement Learning for Efficient Robot Navigation with
Space Reduction [8.279526727422288]
本稿では,強化学習(RL)技術を用いた効率的なナビゲーションに焦点を当てた。
軌道を縮小するために減速ルールを採用し、冗長な探査空間を効果的に削減します。
ヘックスグリッド環境における実際のロボットナビゲーション問題に対する実験は、RuRLが航法性能を向上させることを実証している。
論文 参考訳(メタデータ) (2021-04-15T07:40:27Z) - Occupancy Anticipation for Efficient Exploration and Navigation [97.17517060585875]
そこで我々は,エージェントが自我中心のRGB-D観測を用いて,その占有状態を可視領域を超えて推定する,占有予測を提案する。
エゴセントリックなビューとトップダウンマップの両方でコンテキストを活用することで、私たちのモデルは環境のより広いマップを予測できます。
われわれのアプローチは、2020 Habitat PointNav Challengeの優勝だ。
論文 参考訳(メタデータ) (2020-08-21T03:16:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。