論文の概要: EnCoMP: Enhanced Covert Maneuver Planning using Offline Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2403.20016v1
- Date: Fri, 29 Mar 2024 07:03:10 GMT
- ステータス: 処理完了
- システム内更新日: 2024-04-01 16:15:12.263302
- Title: EnCoMP: Enhanced Covert Maneuver Planning using Offline Reinforcement Learning
- Title(参考訳): EnCoMP:オフライン強化学習を用いたカバートマニキュア計画の強化
- Authors: Jumman Hossain, Abu-Zaher Faridee, Nirmalya Roy,
- Abstract要約: 本研究では,ロボットが自然環境や人工環境の特徴をカバーとして識別し,活用するためのナビゲーションシステムを提案する。
我々の知覚パイプラインはLiDARデータを利用して高忠実度カバーマップと潜在的な脅威マップを生成する。
実環境から収集した多様なデータセットを用いてオフラインの強化学習モデルを訓練する。
- 参考スコア(独自算出の注目度): 0.8192907805418581
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Cover navigation in complex environments is a critical challenge for autonomous robots, requiring the identification and utilization of environmental cover while maintaining efficient navigation. We propose an enhanced navigation system that enables robots to identify and utilize natural and artificial environmental features as cover, thereby minimizing exposure to potential threats. Our perception pipeline leverages LiDAR data to generate high-fidelity cover maps and potential threat maps, providing a comprehensive understanding of the surrounding environment. We train an offline reinforcement learning model using a diverse dataset collected from real-world environments, learning a robust policy that evaluates the quality of candidate actions based on their ability to maximize cover utilization, minimize exposure to threats, and reach the goal efficiently. Extensive real-world experiments demonstrate the superiority of our approach in terms of success rate, cover utilization, exposure minimization, and navigation efficiency compared to state-of-the-art methods.
- Abstract(参考訳): 複雑な環境におけるカバーナビゲーションは、自律ロボットにとって重要な課題であり、効率的なナビゲーションを維持しながら、環境カバーの識別と利用が必要である。
本研究では,ロボットが自然環境や人工環境の特徴をカバーとして識別・活用し,潜在的な脅威への曝露を最小限に抑えるためのナビゲーションシステムを提案する。
我々の知覚パイプラインはLiDARデータを利用して高忠実度カバーマップと潜在的な脅威マップを生成し、周囲の環境を包括的に理解する。
実環境から収集した多様なデータセットを用いてオフラインの強化学習モデルをトレーニングし、カバー利用の最大化、脅威への曝露の最小化、目標達成の効率を高める能力に基づいて、候補行動の品質を評価する堅牢なポリシーを学習する。
広汎な実世界の実験は、最先端の手法と比較して、成功率、カバー利用率、露出最小化、ナビゲーション効率の観点から、我々のアプローチの優位性を実証している。
関連論文リスト
- Evaluating Robustness of Reinforcement Learning Algorithms for Autonomous Shipping [2.9109581496560044]
本稿では,自律型海運シミュレータにおける内陸水路輸送(IWT)のために実装されたベンチマークディープ強化学習(RL)アルゴリズムのロバスト性について検討する。
モデルのないアプローチはシミュレーターで適切なポリシーを達成でき、訓練中に遭遇したことのないポート環境をナビゲートすることに成功した。
論文 参考訳(メタデータ) (2024-11-07T17:55:07Z) - Deep-Sea A*+: An Advanced Path Planning Method Integrating Enhanced A* and Dynamic Window Approach for Autonomous Underwater Vehicles [1.3807821497779342]
深海環境における極度の環境は、水中での作戦に重大な課題をもたらす。
改良されたA*アルゴリズムと動的ウィンドウアプローチ(DWA)を統合した高度な経路計画手法を提案する。
提案手法は,経路の滑らかさ,障害物回避,リアルタイム性能の観点から,従来のA*アルゴリズムを超越した手法である。
論文 参考訳(メタデータ) (2024-10-22T07:29:05Z) - Research on Autonomous Robots Navigation based on Reinforcement Learning [13.559881645869632]
我々は、経路計画と意思決定プロセスを最適化するために、Deep Q Network (DQN) と Proximal Policy Optimization (PPO) モデルを使用します。
様々な複雑なシナリオにおいて,これらのモデルの有効性とロバスト性を検証した。
論文 参考訳(メタデータ) (2024-07-02T00:44:06Z) - Aquatic Navigation: A Challenging Benchmark for Deep Reinforcement Learning [53.3760591018817]
ゲームエンジンとDeep Reinforcement Learningの統合の最近の進歩を利用して,水上ナビゲーションのための新しいベンチマーク環境を提案する。
具体的には、最も広く受け入れられているアルゴリズムの一つであるPPOに着目し、先進的なトレーニング手法を提案する。
実験により,これらの成分をうまく組み合わせることで,有望な結果が得られることが示された。
論文 参考訳(メタデータ) (2024-05-30T23:20:23Z) - VAPOR: Legged Robot Navigation in Outdoor Vegetation Using Offline
Reinforcement Learning [53.13393315664145]
本研究では,非構造で密集した屋外環境における自律脚ロボットナビゲーションのための新しい手法であるVAPORを提案する。
本手法は,アクター・クリティカル・ネットワークと実際の屋外植生で収集された任意のデータを用いて,新しいRLポリシーを訓練する。
VAPORの動作は成功率を最大40%向上させ、平均電流消費量を最大2.9%削減し、正規化軌道長を最大11.2%削減する。
論文 参考訳(メタデータ) (2023-09-14T16:21:27Z) - CoverNav: Cover Following Navigation Planning in Unstructured Outdoor
Environment with Deep Reinforcement Learning [1.0499611180329804]
オフロード地形やジャングル環境における隠蔽およびナビゲート可能な軌道を識別するための,Deep Reinforcement Learning に基づく新しいアルゴリズム CoverNav を提案する。
CoverNavは、ロボットエージェントが報酬関数を使って低い標高の地形を学習するのを助ける。
また,カバーナブの最大目標距離12mと,カバーオブジェクトの有無による異なる標高シナリオにおける成功率について検討した。
論文 参考訳(メタデータ) (2023-08-12T15:19:49Z) - ETPNav: Evolving Topological Planning for Vision-Language Navigation in
Continuous Environments [56.194988818341976]
視覚言語ナビゲーションは、エージェントが環境中をナビゲートするための指示に従う必要があるタスクである。
本研究では,1)環境を抽象化し,長距離航法計画を生成する能力,2)連続環境における障害物回避制御能力の2つの重要なスキルに焦点を当てたETPNavを提案する。
ETPNavは、R2R-CEとRxR-CEデータセットの先行技術よりも10%以上、20%改善されている。
論文 参考訳(メタデータ) (2023-04-06T13:07:17Z) - Incremental 3D Scene Completion for Safe and Efficient Exploration
Mapping and Planning [60.599223456298915]
本研究では,情報,安全,解釈可能な地図作成と計画に3次元シーン補完を活用することによって,深層学習を探索に統合する新しい手法を提案する。
本手法は,地図の精度を最小限に抑えることで,ベースラインに比べて環境のカバレッジを73%高速化できることを示す。
最終地図にシーン完了が含まれていなくても、ロボットがより情報的な経路を選択するように誘導し、ロボットのセンサーでシーンの測定を35%高速化できることが示される。
論文 参考訳(メタデータ) (2022-08-17T14:19:33Z) - Visual-Language Navigation Pretraining via Prompt-based Environmental
Self-exploration [83.96729205383501]
本稿では,言語埋め込みの高速適応を実現するために,プロンプトベースの学習を導入する。
我々のモデルは、VLNやREVERIEを含む多様な視覚言語ナビゲーションタスクに適応することができる。
論文 参考訳(メタデータ) (2022-03-08T11:01:24Z) - Transferable Deep Reinforcement Learning Framework for Autonomous
Vehicles with Joint Radar-Data Communications [69.24726496448713]
本稿では,AVの最適決定を支援するために,マルコフ決定プロセス(MDP)に基づくインテリジェントな最適化フレームワークを提案する。
そこで我々は,近年の深層強化学習技術を活用した効果的な学習アルゴリズムを開発し,AVの最適方針を見出す。
提案手法は,従来の深部強化学習手法と比較して,AVによる障害物ミス検出確率を最大67%削減することを示す。
論文 参考訳(メタデータ) (2021-05-28T08:45:37Z) - Robust Autonomous Landing of UAV in Non-Cooperative Environments based
on Dynamic Time Camera-LiDAR Fusion [11.407952542799526]
低コストLiDARと双眼カメラを備えたUAVシステムを構築し,非協調環境における自律着陸を実現する。
我々は,LiDARの非繰り返し走査と高いFOVカバレッジ特性を利用して,動的時間深度補完アルゴリズムを考案した。
深度マップに基づいて, 傾斜, 粗度, 安全領域の大きさなどの高層地形情報を導出する。
論文 参考訳(メタデータ) (2020-11-27T14:47:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。