論文の概要: Deep Reinforcement Learning based Autonomous Decision-Making for Cooperative UAVs: A Search and Rescue Real World Application
- arxiv url: http://arxiv.org/abs/2502.20326v1
- Date: Thu, 27 Feb 2025 17:53:16 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-28 14:56:21.079506
- Title: Deep Reinforcement Learning based Autonomous Decision-Making for Cooperative UAVs: A Search and Rescue Real World Application
- Title(参考訳): 協調型UAVのための深層強化学習に基づく自律的意思決定-実世界の探索と救助-
- Authors: Thomas Hickling, Maxwell Hogan, Abdulla Tammam, Nabil Aouf,
- Abstract要約: 本稿では, 自律誘導, ナビゲーション, タスク分散のための総合的な枠組みを提案する。
我々は,2つの遅延型Deep Deterministic Policy Gradientアルゴリズムを利用して,DRLに基づく指導機構を提唱する。
DRL学習グラフ畳み込みネットワーク(GCN)による協調型UAV間のタスク分散問題に取り組む。
- 参考スコア(独自算出の注目度): 3.206131271136423
- License:
- Abstract: This paper proposes a holistic framework for autonomous guidance, navigation, and task distribution among multi-drone systems operating in Global Navigation Satellite System (GNSS)-denied indoor settings. We advocate for a Deep Reinforcement Learning (DRL)-based guidance mechanism, utilising the Twin Delayed Deep Deterministic Policy Gradient algorithm. To improve the efficiency of the training process, we incorporate an Artificial Potential Field (APF)-based reward structure, enabling the agent to refine its movements, thereby promoting smoother paths and enhanced obstacle avoidance in indoor contexts. Furthermore, we tackle the issue of task distribution among cooperative UAVs through a DRL-trained Graph Convolutional Network (GCN). This GCN represents the interactions between drones and tasks, facilitating dynamic and real-time task allocation that reflects the current environmental conditions and the capabilities of the drones. Such an approach fosters effective coordination and collaboration among multiple drones during search and rescue operations or other exploratory endeavours. Lastly, to ensure precise odometry in environments lacking GNSS, we employ Light Detection And Ranging Simultaneous Localisation and Mapping complemented by a depth camera to mitigate the hallway problem. This integration offers robust localisation and mapping functionalities, thereby enhancing the systems dependability in indoor navigation. The proposed multi-drone framework not only elevates individual navigation capabilities but also optimises coordinated task allocation in complex, obstacle-laden environments. Experimental evaluations conducted in a setup tailored to meet the requirements of the NATO Sapience Autonomous Cooperative Drone Competition demonstrate the efficacy of the proposed system, yielding outstanding results and culminating in a first-place finish in the 2024 Sapience competition.
- Abstract(参考訳): 本稿では,GNSS(Global Navigation Satellite System)を用いた屋内環境下でのマルチドローンシステム間の自律誘導,ナビゲーション,タスク分散のための総合的枠組みを提案する。
我々は,2つの遅延型Deep Deterministic Policy Gradientアルゴリズムを利用して,DRLに基づく指導機構を提唱する。
トレーニングプロセスの効率を向上させるため,我々は人工電位場(APF)ベースの報酬構造を導入し,エージェントの動作を改良し,よりスムーズな経路の促進と屋内環境における障害物回避の強化を実現した。
さらに、DRL学習グラフ畳み込みネットワーク(GCN)を用いて、協調型UAV間のタスク分散の問題に取り組む。
このGCNは、ドローンとタスク間の相互作用を表し、現在の環境条件とドローンの能力を反映した動的およびリアルタイムなタスク割り当てを促進する。
このようなアプローチは、探索および救助活動やその他の探索活動において、複数のドローン間の効果的な協調と協調を促進する。
最後に, GNSSを欠いた環境において, 高精度なオドメトリを確実にするために, 光検出とランキング同時位置決めとデプスカメラで補完されたマッピングを用いて廊下問題を緩和する。
この統合は、ロバストなローカライゼーションとマッピング機能を提供し、それによって屋内ナビゲーションにおけるシステムの信頼性を高める。
提案するマルチドローンフレームワークは,個々のナビゲーション能力を高めるだけでなく,複雑な障害物環境下での協調タスク割り当てを最適化する。
NATOサピエンス自律協力型ドローンコンペティション(NATOサピエンス自律協力型ドローンコンペティション)の要件を満たすように調整された設定で実施された実験的な評価は、提案システムの有効性を実証し、優れた結果をもたらし、2024年サピエンスコンペティションで1位に終わった。
関連論文リスト
- MAGNNET: Multi-Agent Graph Neural Network-based Efficient Task Allocation for Autonomous Vehicles with Deep Reinforcement Learning [2.5022287664959446]
本稿では,グラフニューラルネットワーク(GNN)を一元的トレーニングと分散実行(CTDE)パラダイムに統合する新しいフレームワークを提案する。
本手法により,無人航空機 (UAV) と無人地上車両 (UGV) は, 中央調整を必要とせず, 効率よくタスクを割り当てることができる。
論文 参考訳(メタデータ) (2025-02-04T13:29:56Z) - Low-altitude Friendly-Jamming for Satellite-Maritime Communications via Generative AI-enabled Deep Reinforcement Learning [72.72954660774002]
低地球軌道(LEO)衛星は、海上無線通信で広範囲にわたるデータ通信を支援するために使用できる。
LEO衛星を広範囲にカバーし、チャネルの開放性と組み合わせることで、通信プロセスはセキュリティ上のリスクに悩まされる可能性がある。
本稿では無人航空機による低高度衛星通信システムLEOについて述べる。
論文 参考訳(メタデータ) (2025-01-26T10:13:51Z) - Application of Deep Reinforcement Learning to UAV Swarming for Ground Surveillance [0.0]
マルチエージェント集中型Swarmアーキテクチャに深層強化学習を統合するハイブリッドAIシステムを提案する。
提案システムは、特定のエリアの監視、地上目標の探索と追跡、セキュリティおよび法執行機関の応用に適したシステムである。
論文 参考訳(メタデータ) (2025-01-15T08:46:20Z) - Cluster-Based Multi-Agent Task Scheduling for Space-Air-Ground Integrated Networks [60.085771314013044]
低高度経済は、コミュニケーションやセンシングなどの分野で発展する大きな可能性を秘めている。
本稿では,SAGINにおけるマルチUAV協調タスクスケジューリング問題に対処するため,クラスタリングに基づく多エージェントDeep Deterministic Policy Gradient (CMADDPG)アルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-12-14T06:17:33Z) - Vision-Based Deep Reinforcement Learning of UAV Autonomous Navigation Using Privileged Information [6.371251946803415]
DPRLは、部分的に観測可能な環境下での高速無人無人飛行の課題に対処するために設計されたエンドツーエンドのポリシーである。
非対称なアクター・クライブアーキテクチャを利用して、トレーニング中にエージェントに特権情報を提供する。
我々は、DPRLアルゴリズムを最先端のナビゲーションアルゴリズムと比較し、様々なシナリオにまたがって広範なシミュレーションを行う。
論文 参考訳(メタデータ) (2024-12-09T09:05:52Z) - A Cross-Scene Benchmark for Open-World Drone Active Tracking [54.235808061746525]
Drone Visual Active Trackingは、視覚的な観察に基づいてモーションシステムを制御することで、対象物を自律的に追跡することを目的としている。
DATと呼ばれるオープンワールドドローンアクティブトラッキングのためのクロスシーンクロスドメインベンチマークを提案する。
また、R-VATと呼ばれる強化学習に基づくドローン追跡手法を提案する。
論文 参考訳(メタデータ) (2024-12-01T09:37:46Z) - Target Search and Navigation in Heterogeneous Robot Systems with Deep
Reinforcement Learning [3.3167319223959373]
未知の環境下での探索・救助ミッションのためのUAVとUGVからなる異種ロボットシステムを設計する。
このシステムは、深い強化学習アルゴリズムによって学習されたポリシーを用いて、迷路のような鉱山環境でターゲットを探索し、それらをナビゲートすることができる。
論文 参考訳(メタデータ) (2023-08-01T07:09:14Z) - DC-MRTA: Decentralized Multi-Robot Task Allocation and Navigation in
Complex Environments [55.204450019073036]
本稿では,倉庫環境における移動ロボットのためのタスク割り当てと分散ナビゲーションアルゴリズムを提案する。
本稿では,共同分散タスク割り当てとナビゲーションの問題について考察し,それを解決するための2段階のアプローチを提案する。
ロボットの衝突のない軌道の計算では,タスク完了時間において最大14%の改善と最大40%の改善が観察される。
論文 参考訳(メタデータ) (2022-09-07T00:35:27Z) - Collaborative Target Search with a Visual Drone Swarm: An Adaptive
Curriculum Embedded Multistage Reinforcement Learning Approach [0.0]
適応型カリキュラム組込み多段階学習(ACEMSL)という,データ効率の高い深層強化学習(DRL)手法を提案する。
我々は、協調対象探索タスクを、個別の障害物回避、対象探索、エージェント間協調を含むいくつかのサブタスクに分解し、多段階学習でエージェントを段階的に訓練する。
我々は、訓練されたモデルを実際の視覚ドローン群に展開し、微調整なしでCTS操作を行う。
論文 参考訳(メタデータ) (2022-04-26T09:32:22Z) - A Multi-UAV System for Exploration and Target Finding in Cluttered and
GPS-Denied Environments [68.31522961125589]
複雑なGPSを用いた複雑な環境において,UAVのチームが協調して目標を探索し,発見するための枠組みを提案する。
UAVのチームは自律的にナビゲートし、探索し、検出し、既知の地図で散らばった環境でターゲットを見つける。
その結果, 提案方式は, 時間的コスト, 調査対象地域の割合, 捜索・救助ミッションの成功率などの面で改善されていることがわかった。
論文 参考訳(メタデータ) (2021-07-19T12:54:04Z) - Path Design and Resource Management for NOMA enhanced Indoor Intelligent
Robots [58.980293789967575]
通信可能な屋内知的ロボット(IR)サービスフレームワークを提案する。
室内レイアウトとチャネル状態を決定論的に記述できるレゴモデリング手法が提案されている。
調査対象の無線マップは、強化学習エージェントを訓練するための仮想環境として呼び出される。
論文 参考訳(メタデータ) (2020-11-23T21:45:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。