Fugu-MT 論文翻訳(概要): EnCoMP: Enhanced Covert Maneuver Planning using Offline Reinforcement Learning

論文の概要: EnCoMP: Enhanced Covert Maneuver Planning using Offline Reinforcement Learning

arxiv url: http://arxiv.org/abs/2403.20016v1
Date: Fri, 29 Mar 2024 07:03:10 GMT
ステータス: 翻訳完了
システム内更新日: 2024-04-01 16:15:12.263302
Title: EnCoMP: Enhanced Covert Maneuver Planning using Offline Reinforcement Learning
Title（参考訳）: EnCoMP:オフライン強化学習を用いたカバートマニキュア計画の強化
Authors: Jumman Hossain, Abu-Zaher Faridee, Nirmalya Roy,
Abstract要約: 本研究では,ロボットが自然環境や人工環境の特徴をカバーとして識別し,活用するためのナビゲーションシステムを提案する。我々の知覚パイプラインはLiDARデータを利用して高忠実度カバーマップと潜在的な脅威マップを生成する。実環境から収集した多様なデータセットを用いてオフラインの強化学習モデルを訓練する。
参考スコア（独自算出の注目度）: 0.8192907805418581
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Cover navigation in complex environments is a critical challenge for autonomous robots, requiring the identification and utilization of environmental cover while maintaining efficient navigation. We propose an enhanced navigation system that enables robots to identify and utilize natural and artificial environmental features as cover, thereby minimizing exposure to potential threats. Our perception pipeline leverages LiDAR data to generate high-fidelity cover maps and potential threat maps, providing a comprehensive understanding of the surrounding environment. We train an offline reinforcement learning model using a diverse dataset collected from real-world environments, learning a robust policy that evaluates the quality of candidate actions based on their ability to maximize cover utilization, minimize exposure to threats, and reach the goal efficiently. Extensive real-world experiments demonstrate the superiority of our approach in terms of success rate, cover utilization, exposure minimization, and navigation efficiency compared to state-of-the-art methods.
Abstract（参考訳）: 複雑な環境におけるカバーナビゲーションは、自律ロボットにとって重要な課題であり、効率的なナビゲーションを維持しながら、環境カバーの識別と利用が必要である。本研究では,ロボットが自然環境や人工環境の特徴をカバーとして識別・活用し,潜在的な脅威への曝露を最小限に抑えるためのナビゲーションシステムを提案する。我々の知覚パイプラインはLiDARデータを利用して高忠実度カバーマップと潜在的な脅威マップを生成し、周囲の環境を包括的に理解する。実環境から収集した多様なデータセットを用いてオフラインの強化学習モデルをトレーニングし、カバー利用の最大化、脅威への曝露の最小化、目標達成の効率を高める能力に基づいて、候補行動の品質を評価する堅牢なポリシーを学習する。広汎な実世界の実験は、最先端の手法と比較して、成功率、カバー利用率、露出最小化、ナビゲーション効率の観点から、我々のアプローチの優位性を実証している。

関連論文リスト

AerialMind: Towards Referring Multi-Object Tracking in UAV Scenarios [64.51320327698231]
UAVシナリオにおける最初の大規模RMOTベンチマークであるAerialMindを紹介する。我々は、革新的な半自動協調型エージェントベースラベリングアシスタントフレームワークを開発した。また,視覚言語表現学習を協調的に強化する新しい手法であるHawkEyeTrackを提案する。
論文参考訳（メタデータ） (2025-11-26T04:44:27Z)
Secure Low-altitude Maritime Communications via Intelligent Jamming [53.42658269206017]
低高度無線ネットワーク (LAWN) は海上通信の有効なソリューションとして登場している。オープンで明確なUAV通信チャネルは、海上のLAWNを盗聴攻撃に対して脆弱にする。本稿では,動的盗難対策にインテリジェントジャミングを用いた低高度海上通信システムを提案する。
論文参考訳（メタデータ） (2025-11-10T03:16:19Z)
ZeST: an LLM-based Zero-Shot Traversability Navigation for Unknown Environments [7.419243375193223]
ロボットを危険にさらすことなく、リアルタイムで移動可能なマップを作成するための新しいアプローチであるZeSTを提案する。提案手法は,ゼロショットトラバーサビリティを実現し,実際のデータ収集に伴うリスクを軽減するだけでなく,高度なナビゲーションシステムの開発も促進する。
論文参考訳（メタデータ） (2025-08-26T15:30:19Z)
NOVA: Navigation via Object-Centric Visual Autonomy for High-Speed Target Tracking in Unstructured GPS-Denied Environments [56.35569661650558]
我々はNOVAというオブジェクト中心のフレームワークを導入し、ロバストな目標追跡と衝突認識ナビゲーションを可能にした。グローバルマップを構築するのではなく、NOVAはターゲットの参照フレーム内での知覚、推定、制御を定式化する。我々は,都市迷路や森林の小道,間欠的なGPS損失を伴う建物内の繰り返し遷移など,現実の挑戦的なシナリオにまたがってNOVAを検証する。
論文参考訳（メタデータ） (2025-06-23T14:28:30Z)
Designing Control Barrier Function via Probabilistic Enumeration for Safe Reinforcement Learning Navigation [55.02966123945644]
本稿では,ニューラルネットワーク検証技術を利用して制御障壁関数(CBF)とポリシー修正機構の設計を行う階層型制御フレームワークを提案する。提案手法は,安全なCBFベースの制御層を構築するために使用される,安全でない操作領域を特定するための確率的列挙に依存する。これらの実験は、効率的なナビゲーション動作を維持しながら、安全でない動作を補正する提案手法の能力を実証するものである。
論文参考訳（メタデータ） (2025-04-30T13:47:25Z)
Depth-Constrained ASV Navigation with Deep RL and Limited Sensing [45.77464360746532]
本研究では,深度制約下でのASVナビゲーションのための強化学習フレームワークを提案する。環境意識を高めるため,GPレグレッションをRLフレームワークに統合する。我々は,実世界の水環境に対して,訓練された政策が適切に一般化されることを保証する効果的なシミュレート・トゥ・リアル・トランスファーを実証する。
論文参考訳（メタデータ） (2025-04-25T10:56:56Z)
Hierarchical Reinforcement Learning for Safe Mapless Navigation with Congestion Estimation [7.339743259039457]
本稿では,階層的強化学習(HRL)を利用した安全な地図レスナビゲーションフレームワークを提案する。その結果,HRLに基づくナビゲーションフレームワークは静的シナリオと動的シナリオの両方で優れていることがわかった。本研究では,物理的な検証実験を行うために,TurtleBot3ロボット上にHRLベースのナビゲーションフレームワークを実装した。
論文参考訳（メタデータ） (2025-03-15T08:03:50Z)
Vision-Based Deep Reinforcement Learning of UAV Autonomous Navigation Using Privileged Information [6.371251946803415]
DPRLは、部分的に観測可能な環境下での高速無人無人飛行の課題に対処するために設計されたエンドツーエンドのポリシーである。非対称なアクター・クライブアーキテクチャを利用して、トレーニング中にエージェントに特権情報を提供する。我々は、DPRLアルゴリズムを最先端のナビゲーションアルゴリズムと比較し、様々なシナリオにまたがって広範なシミュレーションを行う。
論文参考訳（メタデータ） (2024-12-09T09:05:52Z)
Evaluating Robustness of Reinforcement Learning Algorithms for Autonomous Shipping [2.9109581496560044]
本稿では,自律型海運シミュレータにおける内陸水路輸送(IWT)のために実装されたベンチマークディープ強化学習(RL)アルゴリズムのロバスト性について検討する。モデルのないアプローチはシミュレーターで適切なポリシーを達成でき、訓練中に遭遇したことのないポート環境をナビゲートすることに成功した。
論文参考訳（メタデータ） (2024-11-07T17:55:07Z)
Deep-Sea A*+: An Advanced Path Planning Method Integrating Enhanced A* and Dynamic Window Approach for Autonomous Underwater Vehicles [1.3807821497779342]
深海環境における極度の環境は、水中での作戦に重大な課題をもたらす。改良されたA*アルゴリズムと動的ウィンドウアプローチ(DWA)を統合した高度な経路計画手法を提案する。提案手法は,経路の滑らかさ,障害物回避,リアルタイム性能の観点から,従来のA*アルゴリズムを超越した手法である。
論文参考訳（メタデータ） (2024-10-22T07:29:05Z)
Research on Autonomous Robots Navigation based on Reinforcement Learning [13.559881645869632]
我々は、経路計画と意思決定プロセスを最適化するために、Deep Q Network (DQN) と Proximal Policy Optimization (PPO) モデルを使用します。様々な複雑なシナリオにおいて,これらのモデルの有効性とロバスト性を検証した。
論文参考訳（メタデータ） (2024-07-02T00:44:06Z)
Aquatic Navigation: A Challenging Benchmark for Deep Reinforcement Learning [53.3760591018817]
ゲームエンジンとDeep Reinforcement Learningの統合の最近の進歩を利用して,水上ナビゲーションのための新しいベンチマーク環境を提案する。具体的には、最も広く受け入れられているアルゴリズムの一つであるPPOに着目し、先進的なトレーニング手法を提案する。実験により,これらの成分をうまく組み合わせることで,有望な結果が得られることが示された。
論文参考訳（メタデータ） (2024-05-30T23:20:23Z)
VAPOR: Legged Robot Navigation in Outdoor Vegetation Using Offline Reinforcement Learning [53.13393315664145]
本研究では,非構造で密集した屋外環境における自律脚ロボットナビゲーションのための新しい手法であるVAPORを提案する。本手法は,アクター・クリティカル・ネットワークと実際の屋外植生で収集された任意のデータを用いて,新しいRLポリシーを訓練する。 VAPORの動作は成功率を最大40%向上させ、平均電流消費量を最大2.9%削減し、正規化軌道長を最大11.2%削減する。
論文参考訳（メタデータ） (2023-09-14T16:21:27Z)
CoverNav: Cover Following Navigation Planning in Unstructured Outdoor Environment with Deep Reinforcement Learning [1.0499611180329804]
オフロード地形やジャングル環境における隠蔽およびナビゲート可能な軌道を識別するための,Deep Reinforcement Learning に基づく新しいアルゴリズム CoverNav を提案する。 CoverNavは、ロボットエージェントが報酬関数を使って低い標高の地形を学習するのを助ける。また,カバーナブの最大目標距離12mと,カバーオブジェクトの有無による異なる標高シナリオにおける成功率について検討した。
論文参考訳（メタデータ） (2023-08-12T15:19:49Z)
ETPNav: Evolving Topological Planning for Vision-Language Navigation in Continuous Environments [56.194988818341976]
視覚言語ナビゲーションは、エージェントが環境中をナビゲートするための指示に従う必要があるタスクである。本研究では,1)環境を抽象化し,長距離航法計画を生成する能力,2)連続環境における障害物回避制御能力の2つの重要なスキルに焦点を当てたETPNavを提案する。 ETPNavは、R2R-CEとRxR-CEデータセットの先行技術よりも10%以上、20%改善されている。
論文参考訳（メタデータ） (2023-04-06T13:07:17Z)
Incremental 3D Scene Completion for Safe and Efficient Exploration Mapping and Planning [60.599223456298915]
本研究では,情報,安全,解釈可能な地図作成と計画に3次元シーン補完を活用することによって,深層学習を探索に統合する新しい手法を提案する。本手法は,地図の精度を最小限に抑えることで,ベースラインに比べて環境のカバレッジを73%高速化できることを示す。最終地図にシーン完了が含まれていなくても、ロボットがより情報的な経路を選択するように誘導し、ロボットのセンサーでシーンの測定を35%高速化できることが示される。
論文参考訳（メタデータ） (2022-08-17T14:19:33Z)
Visual-Language Navigation Pretraining via Prompt-based Environmental Self-exploration [83.96729205383501]
本稿では,言語埋め込みの高速適応を実現するために,プロンプトベースの学習を導入する。我々のモデルは、VLNやREVERIEを含む多様な視覚言語ナビゲーションタスクに適応することができる。
論文参考訳（メタデータ） (2022-03-08T11:01:24Z)
Transferable Deep Reinforcement Learning Framework for Autonomous Vehicles with Joint Radar-Data Communications [69.24726496448713]
本稿では,AVの最適決定を支援するために,マルコフ決定プロセス(MDP)に基づくインテリジェントな最適化フレームワークを提案する。そこで我々は,近年の深層強化学習技術を活用した効果的な学習アルゴリズムを開発し,AVの最適方針を見出す。提案手法は,従来の深部強化学習手法と比較して,AVによる障害物ミス検出確率を最大67%削減することを示す。
論文参考訳（メタデータ） (2021-05-28T08:45:37Z)
Robust Autonomous Landing of UAV in Non-Cooperative Environments based on Dynamic Time Camera-LiDAR Fusion [11.407952542799526]
低コストLiDARと双眼カメラを備えたUAVシステムを構築し,非協調環境における自律着陸を実現する。我々は,LiDARの非繰り返し走査と高いFOVカバレッジ特性を利用して,動的時間深度補完アルゴリズムを考案した。深度マップに基づいて, 傾斜, 粗度, 安全領域の大きさなどの高層地形情報を導出する。
論文参考訳（メタデータ） (2020-11-27T14:47:02Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。