論文の概要: Application of Deep Reinforcement Learning to UAV Swarming for Ground Surveillance
- arxiv url: http://arxiv.org/abs/2501.08655v1
- Date: Wed, 15 Jan 2025 08:46:20 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-01-16 15:51:55.282264
- Title: Application of Deep Reinforcement Learning to UAV Swarming for Ground Surveillance
- Title(参考訳): 深部強化学習のUAVスワーミングへの適用
- Authors: Raúl Arranz, David Carramiñana, Gonzalo de Miguel, Juan A. Besada, Ana M. Bernardos,
- Abstract要約: マルチエージェント集中型Swarmアーキテクチャに深層強化学習を統合するハイブリッドAIシステムを提案する。
提案システムは、特定のエリアの監視、地上目標の探索と追跡、セキュリティおよび法執行機関の応用に適したシステムである。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: This paper summarizes in depth the state of the art of aerial swarms, covering both classical and new reinforcement-learning-based approaches for their management. Then, it proposes a hybrid AI system, integrating deep reinforcement learning in a multi-agent centralized swarm architecture. The proposed system is tailored to perform surveillance of a specific area, searching and tracking ground targets, for security and law enforcement applications. The swarm is governed by a central swarm controller responsible for distributing different search and tracking tasks among the cooperating UAVs. Each UAV agent is then controlled by a collection of cooperative sub-agents, whose behaviors have been trained using different deep reinforcement learning models, tailored for the different task types proposed by the swarm controller. More specifically, proximal policy optimization (PPO) algorithms were used to train the agents' behavior. In addition, several metrics to assess the performance of the swarm in this application were defined. The results obtained through simulation show that our system searches the operation area effectively, acquires the targets in a reasonable time, and is capable of tracking them continuously and consistently.
- Abstract(参考訳): 本稿は,航空群の最新技術について概説し,古典的および新しい強化学習に基づく管理手法について概説する。
そして、マルチエージェント集中型Swarmアーキテクチャに深層強化学習を統合するハイブリッドAIシステムを提案する。
提案システムは、特定のエリアの監視、地上目標の探索と追跡、セキュリティおよび法執行機関の応用に適したシステムである。
Swarmは中央のSwarmコントローラによって管理され、協力するUAV間で異なる検索タスクと追跡タスクを分散する。
それぞれのUAVエージェントは、Swarmコントローラによって提案される様々なタスクタイプに合わせて、異なる深層強化学習モデルを用いて、振る舞いを訓練された協調サブエージェントのコレクションによって制御される。
より具体的には、エージェントの振る舞いを訓練するためにPPOアルゴリズムが用いられた。
さらに、このアプリケーションにおけるSwarmのパフォーマンスを評価するためのいくつかの指標を定義した。
シミュレーションによって得られた結果から,本システムは動作領域を効果的に探索し,適正な時間で目標を把握し,連続的に連続的に追跡できることが示唆された。
関連論文リスト
- Multi-Target Radar Search and Track Using Sequence-Capable Deep Reinforcement Learning [0.26999000177990923]
この研究はレーダーシステムのセンサタスク管理に対処する。
強化学習を用いて、複数のターゲットを効率的に探索し、追跡することに焦点を当てている。
重要な貢献は、強化学習がセンサー管理をどのように最適化できるかを示すことである。
論文 参考訳(メタデータ) (2025-02-19T09:55:38Z) - Cluster-Based Multi-Agent Task Scheduling for Space-Air-Ground Integrated Networks [60.085771314013044]
低高度経済は、コミュニケーションやセンシングなどの分野で発展する大きな可能性を秘めている。
本稿では,SAGINにおけるマルチUAV協調タスクスケジューリング問題に対処するため,クラスタリングに基づく多エージェントDeep Deterministic Policy Gradient (CMADDPG)アルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-12-14T06:17:33Z) - Cooperative Cognitive Dynamic System in UAV Swarms: Reconfigurable Mechanism and Framework [80.39138462246034]
UAVスワムの管理を最適化するための協調認知力学システム(CCDS)を提案する。
CCDSは階層的かつ協調的な制御構造であり、リアルタイムのデータ処理と意思決定を可能にする。
さらに、CCDSは、UAVスワムのタスクを効率的に割り当てるための生体模倣機構と統合することができる。
論文 参考訳(メタデータ) (2024-05-18T12:45:00Z) - UAV-enabled Collaborative Beamforming via Multi-Agent Deep Reinforcement Learning [79.16150966434299]
本稿では,UAVを用いた協調ビームフォーミング多目的最適化問題 (UCBMOP) を定式化し,UAVの伝送速度を最大化し,全UAVのエネルギー消費を最小化する。
ヘテロジニアス・エージェント・信頼領域ポリシー最適化(HATRPO)を基本フレームワークとし,改良されたHATRPOアルゴリズム,すなわちHATRPO-UCBを提案する。
論文 参考訳(メタデータ) (2024-04-11T03:19:22Z) - Distributed multi-agent target search and tracking with Gaussian process
and reinforcement learning [26.499110405106812]
分散プロセスに基づくターゲットマップ構築によるマルチエージェント強化学習手法を提案する。
シミュレーションにおける訓練された方針の性能と伝達性を評価し, 小型無人航空機の群集上での手法を実証した。
論文 参考訳(メタデータ) (2023-08-29T01:53:14Z) - Efficient Domain Coverage for Vehicles with Second-Order Dynamics via
Multi-Agent Reinforcement Learning [9.939081691797858]
本稿では,2次動的エージェントを含む多エージェント効率ドメインカバレッジ問題に対する強化学習(RL)手法を提案する。
提案するネットワークアーキテクチャには,LSTMと自己注意が組み込まれている。
論文 参考訳(メタデータ) (2022-11-11T01:59:12Z) - Hierarchical Reinforcement Learning with Opponent Modeling for
Distributed Multi-agent Cooperation [13.670618752160594]
深層強化学習(DRL)はエージェントと環境の相互作用を通じて多エージェント協調に有望なアプローチを提供する。
従来のDRLソリューションは、ポリシー探索中に連続的なアクション空間を持つ複数のエージェントの高次元に悩まされる。
効率的な政策探索のための高レベル意思決定と低レベル個別制御を用いた階層型強化学習手法を提案する。
論文 参考訳(メタデータ) (2022-06-25T19:09:29Z) - Optimization for Master-UAV-powered Auxiliary-Aerial-IRS-assisted IoT
Networks: An Option-based Multi-agent Hierarchical Deep Reinforcement
Learning Approach [56.84948632954274]
本稿では,無人航空機(MUAV)搭載のIoT(Internet of Things)ネットワークについて検討する。
本稿では、インテリジェント反射面(IRS)を備えた充電可能な補助UAV(AUAV)を用いて、MUAVからの通信信号を強化することを提案する。
提案モデルでは,IoTネットワークの蓄積スループットを最大化するために,これらのエネルギー制限されたUAVの最適協調戦略について検討する。
論文 参考訳(メタデータ) (2021-12-20T15:45:28Z) - Decentralized Reinforcement Learning for Multi-Target Search and
Detection by a Team of Drones [12.055303570215335]
対象の探索と検出は、カバレッジ、監視、探索、観測、追跡回避など、さまざまな決定問題を含む。
我々は,未知の領域における静的な目標のセットを特定するために,航空機群(ドローン)を協調させるマルチエージェント深部強化学習法(MADRL)を開発した。
論文 参考訳(メタデータ) (2021-03-17T09:04:47Z) - Efficient UAV Trajectory-Planning using Economic Reinforcement Learning [65.91405908268662]
UAV間でタスクを分散するための経済取引に触発された新しい強化学習アルゴリズムであるREPlannerを紹介します。
エージェントが協力し、リソースを競うことができるマルチエージェント経済ゲームとして、パス計画問題を策定します。
UAV協力によるタスク分布の計算を行うため、Swarmサイズの変化に対して非常に耐性が高い。
論文 参考訳(メタデータ) (2021-03-03T20:54:19Z) - Model-based Reinforcement Learning for Decentralized Multiagent
Rendezvous [66.6895109554163]
目標を他のエージェントと整合させる人間の能力の下にあるのは、他人の意図を予測し、自分たちの計画を積極的に更新する能力である。
分散型マルチエージェントレンデブーのためのモデルに基づく強化学習手法である階層型予測計画(HPP)を提案する。
論文 参考訳(メタデータ) (2020-03-15T19:49:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。