論文の概要: EnCoMP: Enhanced Covert Maneuver Planning using Offline Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2403.20016v1
- Date: Fri, 29 Mar 2024 07:03:10 GMT
- ステータス: 処理完了
- システム内更新日: 2024-04-01 16:15:12.263302
- Title: EnCoMP: Enhanced Covert Maneuver Planning using Offline Reinforcement Learning
- Title(参考訳): EnCoMP:オフライン強化学習を用いたカバートマニキュア計画の強化
- Authors: Jumman Hossain, Abu-Zaher Faridee, Nirmalya Roy,
- Abstract要約: 本研究では,ロボットが自然環境や人工環境の特徴をカバーとして識別し,活用するためのナビゲーションシステムを提案する。
我々の知覚パイプラインはLiDARデータを利用して高忠実度カバーマップと潜在的な脅威マップを生成する。
実環境から収集した多様なデータセットを用いてオフラインの強化学習モデルを訓練する。
- 参考スコア(独自算出の注目度): 0.8192907805418581
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Cover navigation in complex environments is a critical challenge for autonomous robots, requiring the identification and utilization of environmental cover while maintaining efficient navigation. We propose an enhanced navigation system that enables robots to identify and utilize natural and artificial environmental features as cover, thereby minimizing exposure to potential threats. Our perception pipeline leverages LiDAR data to generate high-fidelity cover maps and potential threat maps, providing a comprehensive understanding of the surrounding environment. We train an offline reinforcement learning model using a diverse dataset collected from real-world environments, learning a robust policy that evaluates the quality of candidate actions based on their ability to maximize cover utilization, minimize exposure to threats, and reach the goal efficiently. Extensive real-world experiments demonstrate the superiority of our approach in terms of success rate, cover utilization, exposure minimization, and navigation efficiency compared to state-of-the-art methods.
- Abstract(参考訳): 複雑な環境におけるカバーナビゲーションは、自律ロボットにとって重要な課題であり、効率的なナビゲーションを維持しながら、環境カバーの識別と利用が必要である。
本研究では,ロボットが自然環境や人工環境の特徴をカバーとして識別・活用し,潜在的な脅威への曝露を最小限に抑えるためのナビゲーションシステムを提案する。
我々の知覚パイプラインはLiDARデータを利用して高忠実度カバーマップと潜在的な脅威マップを生成し、周囲の環境を包括的に理解する。
実環境から収集した多様なデータセットを用いてオフラインの強化学習モデルをトレーニングし、カバー利用の最大化、脅威への曝露の最小化、目標達成の効率を高める能力に基づいて、候補行動の品質を評価する堅牢なポリシーを学習する。
広汎な実世界の実験は、最先端の手法と比較して、成功率、カバー利用率、露出最小化、ナビゲーション効率の観点から、我々のアプローチの優位性を実証している。
関連論文リスト
- Towards Scenario- and Capability-Driven Dataset Development and Evaluation: An Approach in the Context of Mapless Automated Driving [0.0]
本稿では,自動走行における環境認識のためのデータセット開発プロセスに焦点を当てる。
本稿では,データセット開発におけるシナリオと能力に基づくアプローチを提案する。
この方法論を、既存のレーン検出データセットの幅広い範囲に適用することにより、現在のデータセットにおける重要な制限を特定します。
論文 参考訳(メタデータ) (2024-04-30T15:52:49Z) - Deep Reinforcement Learning with Dynamic Graphs for Adaptive Informative
Path Planning [25.137104841642305]
ロボットデータ取得における重要な課題は、当初未知の環境を抜けて観測を収集する計画経路である。
そこで本研究では,未知の3D環境において,ロボット経路を適応的に計画し,対象をマップする深層強化学習手法を提案する。
論文 参考訳(メタデータ) (2024-02-07T14:24:41Z) - AI-Based Energy Transportation Safety: Pipeline Radial Threat Estimation
Using Intelligent Sensing System [52.93806509364342]
本稿では,分散光ファイバーセンシング技術に基づくエネルギーパイプラインの放射状脅威推定手法を提案する。
本稿では,包括的信号特徴抽出のための連続的マルチビュー・マルチドメイン機能融合手法を提案する。
本研究では,事前学習モデルによる伝達学習の概念を取り入れ,認識精度と学習効率の両立を図る。
論文 参考訳(メタデータ) (2023-12-18T12:37:35Z) - VAPOR: Legged Robot Navigation in Outdoor Vegetation Using Offline
Reinforcement Learning [53.13393315664145]
本研究では,非構造で密集した屋外環境における自律脚ロボットナビゲーションのための新しい手法であるVAPORを提案する。
本手法は,アクター・クリティカル・ネットワークと実際の屋外植生で収集された任意のデータを用いて,新しいRLポリシーを訓練する。
VAPORの動作は成功率を最大40%向上させ、平均電流消費量を最大2.9%削減し、正規化軌道長を最大11.2%削減する。
論文 参考訳(メタデータ) (2023-09-14T16:21:27Z) - Incremental 3D Scene Completion for Safe and Efficient Exploration
Mapping and Planning [60.599223456298915]
本研究では,情報,安全,解釈可能な地図作成と計画に3次元シーン補完を活用することによって,深層学習を探索に統合する新しい手法を提案する。
本手法は,地図の精度を最小限に抑えることで,ベースラインに比べて環境のカバレッジを73%高速化できることを示す。
最終地図にシーン完了が含まれていなくても、ロボットがより情報的な経路を選択するように誘導し、ロボットのセンサーでシーンの測定を35%高速化できることが示される。
論文 参考訳(メタデータ) (2022-08-17T14:19:33Z) - Visual-Language Navigation Pretraining via Prompt-based Environmental
Self-exploration [83.96729205383501]
本稿では,言語埋め込みの高速適応を実現するために,プロンプトベースの学習を導入する。
我々のモデルは、VLNやREVERIEを含む多様な視覚言語ナビゲーションタスクに適応することができる。
論文 参考訳(メタデータ) (2022-03-08T11:01:24Z) - Robust Autonomous Landing of UAV in Non-Cooperative Environments based
on Dynamic Time Camera-LiDAR Fusion [11.407952542799526]
低コストLiDARと双眼カメラを備えたUAVシステムを構築し,非協調環境における自律着陸を実現する。
我々は,LiDARの非繰り返し走査と高いFOVカバレッジ特性を利用して,動的時間深度補完アルゴリズムを考案した。
深度マップに基づいて, 傾斜, 粗度, 安全領域の大きさなどの高層地形情報を導出する。
論文 参考訳(メタデータ) (2020-11-27T14:47:02Z) - Indoor Point-to-Point Navigation with Deep Reinforcement Learning and
Ultra-wideband [1.6799377888527687]
移動障害や非視線発生はノイズや信頼性の低い信号を生成する。
深部強化学習(RL)で学習した電力効率のよい局所プランナーが,ノイズショートレンジ誘導システムの完全解法として頑健かつ弾力性を持つことを示す。
この結果から, 計算効率のよいエンドツーエンドポリシは, 堅牢でスケーラブルで, 最先端の低コストナビゲーションシステムを実現することができることがわかった。
論文 参考訳(メタデータ) (2020-11-18T12:30:36Z) - Guided Uncertainty-Aware Policy Optimization: Combining Learning and
Model-Based Strategies for Sample-Efficient Policy Learning [75.56839075060819]
従来のロボットのアプローチは、環境の正確なモデル、タスクの実行方法の詳細な説明、現在の状態を追跡するための堅牢な認識システムに依存している。
強化学習アプローチは、タスクを記述するための報酬信号だけで、生の感覚入力から直接操作することができるが、非常にサンプル非効率で脆弱である。
本研究では,ロボットの知覚・運動パイプラインにおける不正確さを克服できる一般的な手法を得るために,モデルに基づく手法の強みと学習に基づく手法の柔軟性を組み合わせる。
論文 参考訳(メタデータ) (2020-05-21T19:47:05Z) - Enhanced Adversarial Strategically-Timed Attacks against Deep
Reinforcement Learning [91.13113161754022]
本稿では,DRLに基づくナビゲーションシステムに対して,選択した時間フレーム上の物理ノイズパターンを妨害することにより,タイミングに基づく逆方向戦略を導入する。
実験結果から, 対向タイミング攻撃は性能低下を引き起こす可能性が示唆された。
論文 参考訳(メタデータ) (2020-02-20T21:39:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。