論文の概要: Energy-Aware Multi-Agent Reinforcement Learning for Collaborative Execution in Mission-Oriented Drone Networks
- arxiv url: http://arxiv.org/abs/2410.22578v1
- Date: Tue, 29 Oct 2024 22:43:26 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-10-31 14:23:35.132861
- Title: Energy-Aware Multi-Agent Reinforcement Learning for Collaborative Execution in Mission-Oriented Drone Networks
- Title(参考訳): ミッション指向ドローンネットワークにおける協調実行のためのエネルギーを考慮したマルチエージェント強化学習
- Authors: Ying Li, Changling Li, Jiyao Chen, Christine Roinou,
- Abstract要約: ミッション指向ドローンネットワークは、構造検査、災害監視、国境監視などに広く利用されている。
ドローンのバッテリ容量が限られているため、ミッション実行戦略はネットワークの性能とミッション完了に影響を及ぼす。
本研究では,マルチエージェント強化学習(MARL)を活用し,その課題を管理する。
- 参考スコア(独自算出の注目度): 3.4918110778972458
- License:
- Abstract: Mission-oriented drone networks have been widely used for structural inspection, disaster monitoring, border surveillance, etc. Due to the limited battery capacity of drones, mission execution strategy impacts network performance and mission completion. However, collaborative execution is a challenging problem for drones in such a dynamic environment as it also involves efficient trajectory design. We leverage multi-agent reinforcement learning (MARL) to manage the challenge in this study, letting each drone learn to collaboratively execute tasks and plan trajectories based on its current status and environment. Simulation results show that the proposed collaborative execution model can successfully complete the mission at least 80% of the time, regardless of task locations and lengths, and can even achieve a 100% success rate when the task density is not way too sparse. To the best of our knowledge, our work is one of the pioneer studies on leveraging MARL on collaborative execution for mission-oriented drone networks; the unique value of this work lies in drone battery level driving our model design.
- Abstract(参考訳): ミッション指向ドローンネットワークは、構造検査、災害監視、国境監視などに広く利用されている。
ドローンのバッテリ容量が限られているため、ミッション実行戦略はネットワークの性能とミッション完了に影響を及ぼす。
しかし、協調実行は、効率的な軌道設計も含むため、このような動的な環境でのドローンにとって難しい問題である。
本研究では,マルチエージェント強化学習(MARL)を活用して課題を管理し,各ドローンがタスクを協調的に実行し,現在の状況と環境に基づいてトラジェクトリを計画できるようにする。
シミュレーションの結果、提案した協調実行モデルは、タスク位置や長さに関わらず、少なくとも80%の時間でミッションを完了でき、タスク密度があまり疎かでない場合、100%の成功率さえ達成できることがわかった。
私たちの研究は、ミッション指向ドローンネットワークの協調実行にMARLを活用する先駆的な研究の1つです。
関連論文リスト
- Autonomous Decision Making for UAV Cooperative Pursuit-Evasion Game with Reinforcement Learning [50.33447711072726]
本稿では,マルチロールUAV協調追従ゲームにおける意思決定のための深層強化学習モデルを提案する。
提案手法は,追従回避ゲームシナリオにおけるUAVの自律的意思決定を可能にする。
論文 参考訳(メタデータ) (2024-11-05T10:45:30Z) - COHERENT: Collaboration of Heterogeneous Multi-Robot System with Large Language Models [49.24666980374751]
COHERENTは、異種マルチロボットシステムの協調のための新しいLCMベースのタスク計画フレームワークである。
提案-実行-フィードバック-調整機構は,個々のロボットに対して動作を分解・割り当てするように設計されている。
実験の結果,我々の研究は,成功率と実行効率の面で,従来の手法をはるかに上回っていることが明らかとなった。
論文 参考訳(メタデータ) (2024-09-23T15:53:41Z) - Scheduling Drone and Mobile Charger via Hybrid-Action Deep Reinforcement Learning [7.577251571044739]
ドローンは一定の関心点を観察するために配置され、充電器はドローンのバッテリーを充電するために移動することができる。
我々は、ドローンと移動充電器のルートと充電スケジュールに焦点を合わせ、可能な限り短時間で高観測ユーティリティーを得る。
本稿では、標準ポリシー学習アルゴリズムを用いて遅延連続動作を生成するハイブリッドアクション深層強化学習フレームワークHaDMCを提案する。
論文 参考訳(メタデータ) (2024-03-16T01:51:42Z) - Human-Centric Aware UAV Trajectory Planning in Search and Rescue
Missions Employing Multi-Objective Reinforcement Learning with AHP and
Similarity-Based Experience Replay [0.0]
本稿では,UAV軌道計画における人中心的要因の影響について検討する。
包括的調査を通じて,UAV設計におけるジェンダー・キューと人格化が公衆の受容と信頼に与える影響を調査した。
論文 参考訳(メタデータ) (2024-02-28T17:10:22Z) - DC-MRTA: Decentralized Multi-Robot Task Allocation and Navigation in
Complex Environments [55.204450019073036]
本稿では,倉庫環境における移動ロボットのためのタスク割り当てと分散ナビゲーションアルゴリズムを提案する。
本稿では,共同分散タスク割り当てとナビゲーションの問題について考察し,それを解決するための2段階のアプローチを提案する。
ロボットの衝突のない軌道の計算では,タスク完了時間において最大14%の改善と最大40%の改善が観察される。
論文 参考訳(メタデータ) (2022-09-07T00:35:27Z) - DL-DRL: A double-level deep reinforcement learning approach for
large-scale task scheduling of multi-UAV [65.07776277630228]
分割・征服フレームワーク(DCF)に基づく二重レベル深層強化学習(DL-DRL)手法を提案する。
特に,上層部DRLモデルにおけるエンコーダ・デコーダ構成ポリシネットワークを設計し,タスクを異なるUAVに割り当てる。
また、低レベルDRLモデルにおける別の注意に基づくポリシーネットワークを利用して、各UAVの経路を構築し、実行されたタスク数を最大化する。
論文 参考訳(メタデータ) (2022-08-04T04:35:53Z) - Collaborative Target Search with a Visual Drone Swarm: An Adaptive
Curriculum Embedded Multistage Reinforcement Learning Approach [0.0]
適応型カリキュラム組込み多段階学習(ACEMSL)という,データ効率の高い深層強化学習(DRL)手法を提案する。
我々は、協調対象探索タスクを、個別の障害物回避、対象探索、エージェント間協調を含むいくつかのサブタスクに分解し、多段階学習でエージェントを段階的に訓練する。
我々は、訓練されたモデルを実際の視覚ドローン群に展開し、微調整なしでCTS操作を行う。
論文 参考訳(メタデータ) (2022-04-26T09:32:22Z) - Solving reward-collecting problems with UAVs: a comparison of online
optimization and Q-learning [2.4251007104039006]
与えられたスタートからゴールまでの短い経路を識別し、すべての報酬を集め、グリッド上でランダムに動く敵を避けるという課題について検討する。
本稿では,Deep Q-Learningモデル,$varepsilon$-greedyタブ状Q-Learningモデル,オンライン最適化フレームワークの3つの方法の比較を行った。
我々の実験は、ランダムな逆数を持つ単純なグリッドワールド環境を用いて設計され、これらの手法がどのように機能するかを示し、性能、精度、計算時間の観点から比較する。
論文 参考訳(メタデータ) (2021-11-30T22:27:24Z) - A Multi-UAV System for Exploration and Target Finding in Cluttered and
GPS-Denied Environments [68.31522961125589]
複雑なGPSを用いた複雑な環境において,UAVのチームが協調して目標を探索し,発見するための枠組みを提案する。
UAVのチームは自律的にナビゲートし、探索し、検出し、既知の地図で散らばった環境でターゲットを見つける。
その結果, 提案方式は, 時間的コスト, 調査対象地域の割合, 捜索・救助ミッションの成功率などの面で改善されていることがわかった。
論文 参考訳(メタデータ) (2021-07-19T12:54:04Z) - Efficient UAV Trajectory-Planning using Economic Reinforcement Learning [65.91405908268662]
UAV間でタスクを分散するための経済取引に触発された新しい強化学習アルゴリズムであるREPlannerを紹介します。
エージェントが協力し、リソースを競うことができるマルチエージェント経済ゲームとして、パス計画問題を策定します。
UAV協力によるタスク分布の計算を行うため、Swarmサイズの変化に対して非常に耐性が高い。
論文 参考訳(メタデータ) (2021-03-03T20:54:19Z) - Time-Efficient Mars Exploration of Simultaneous Coverage and Charging
with Multiple Drones [14.160624396972707]
本稿では,複数のドローンとローバーの協調による火星探査の時間効率向上手法を提案する。
限られたエネルギー、センサーモデル、通信範囲、安全半径を考慮した総合的な枠組みが開発されている。
TIME-SC2の顕著な性能を示すために大規模なシミュレーションが行われた。
論文 参考訳(メタデータ) (2020-11-16T07:28:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。