論文の概要: Efficient UAV Trajectory-Planning using Economic Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2103.02676v1
- Date: Wed, 3 Mar 2021 20:54:19 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-07 18:24:42.598509
- Title: Efficient UAV Trajectory-Planning using Economic Reinforcement Learning
- Title(参考訳): 経済強化学習による効率的なUAV軌道計画
- Authors: Alvi Ataur Khalil, Alexander J Byrne, Mohammad Ashiqur Rahman,
Mohammad Hossein Manshaei
- Abstract要約: UAV間でタスクを分散するための経済取引に触発された新しい強化学習アルゴリズムであるREPlannerを紹介します。
エージェントが協力し、リソースを競うことができるマルチエージェント経済ゲームとして、パス計画問題を策定します。
UAV協力によるタスク分布の計算を行うため、Swarmサイズの変化に対して非常に耐性が高い。
- 参考スコア(独自算出の注目度): 65.91405908268662
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Advances in unmanned aerial vehicle (UAV) design have opened up applications
as varied as surveillance, firefighting, cellular networks, and delivery
applications. Additionally, due to decreases in cost, systems employing fleets
of UAVs have become popular. The uniqueness of UAVs in systems creates a novel
set of trajectory or path planning and coordination problems. Environments
include many more points of interest (POIs) than UAVs, with obstacles and
no-fly zones. We introduce REPlanner, a novel multi-agent reinforcement
learning algorithm inspired by economic transactions to distribute tasks
between UAVs. This system revolves around an economic theory, in particular an
auction mechanism where UAVs trade assigned POIs. We formulate the path
planning problem as a multi-agent economic game, where agents can cooperate and
compete for resources. We then translate the problem into a Partially
Observable Markov decision process (POMDP), which is solved using a
reinforcement learning (RL) model deployed on each agent. As the system
computes task distributions via UAV cooperation, it is highly resilient to any
change in the swarm size. Our proposed network and economic game architecture
can effectively coordinate the swarm as an emergent phenomenon while
maintaining the swarm's operation. Evaluation results prove that REPlanner
efficiently outperforms conventional RL-based trajectory search.
- Abstract(参考訳): 無人航空機(UAV)の設計の進歩は、監視、ファイアファイアファイティング、セルラーネットワーク、配送アプリケーションなど様々な用途に応用を広げている。
さらに、コストの低下により、UAVを運用するシステムも人気を博している。
システムにおけるuavの特異性は、軌道や経路計画や協調問題の新しい集合を生み出す。
環境にはUAVよりも多くの関心点(POI)が含まれており、障害物や飛行禁止区域がある。
UAV間でタスクを分散するための経済トランザクションに触発された新しいマルチエージェント強化学習アルゴリズムであるREPlannerを紹介します。
このシステムは経済理論、特にUAVがPOIを割り当てたオークション機構を中心に展開している。
エージェントが協力し、リソースを競うことができるマルチエージェント経済ゲームとして、パス計画問題を策定します。
次に,この問題を部分可観測マルコフ決定プロセス(pomdp)に変換し,各エージェントにデプロイした強化学習(rl)モデルを用いて解決する。
UAV協力によるタスク分布の計算を行うため、Swarmサイズの変化に対して非常に耐性が高い。
提案するネットワークおよび経済ゲームアーキテクチャは,Swarmの動作を維持しながら,Swarmを創発的な現象として効果的にコーディネートすることができる。
評価の結果, replanner は従来の rl ベースの軌道探索を効率良く上回ることがわかった。
関連論文リスト
- Autonomous Decision Making for UAV Cooperative Pursuit-Evasion Game with Reinforcement Learning [50.33447711072726]
本稿では,マルチロールUAV協調追従ゲームにおける意思決定のための深層強化学習モデルを提案する。
提案手法は,追従回避ゲームシナリオにおけるUAVの自律的意思決定を可能にする。
論文 参考訳(メタデータ) (2024-11-05T10:45:30Z) - UAV-enabled Collaborative Beamforming via Multi-Agent Deep Reinforcement Learning [79.16150966434299]
本稿では,UAVを用いた協調ビームフォーミング多目的最適化問題 (UCBMOP) を定式化し,UAVの伝送速度を最大化し,全UAVのエネルギー消費を最小化する。
ヘテロジニアス・エージェント・信頼領域ポリシー最適化(HATRPO)を基本フレームワークとし,改良されたHATRPOアルゴリズム,すなわちHATRPO-UCBを提案する。
論文 参考訳(メタデータ) (2024-04-11T03:19:22Z) - Anti-Jamming Path Planning Using GCN for Multi-UAV [0.0]
UAVスワーミングの有効性は、ジャミング技術によって著しく損なわれる可能性がある。
UAV群集が集団知能を利用してジャム領域を予測する手法が提案されている。
マルチエージェント制御アルゴリズムを使用して、UAVスワムを分散し、ジャミングを回避し、ターゲットに到達すると再グループ化する。
論文 参考訳(メタデータ) (2024-03-13T07:28:05Z) - Multi-Objective Optimization for UAV Swarm-Assisted IoT with Virtual
Antenna Arrays [55.736718475856726]
無人航空機(UAV)ネットワークはIoT(Internet-of-Things)を支援するための有望な技術である
既存のUAV支援データ収集および普及スキームでは、UAVはIoTとアクセスポイントの間を頻繁に飛行する必要がある。
協調ビームフォーミングをIoTとUAVに同時に導入し、エネルギーと時間効率のデータ収集と普及を実現した。
論文 参考訳(メタデータ) (2023-08-03T02:49:50Z) - Joint Optimization of Deployment and Trajectory in UAV and IRS-Assisted
IoT Data Collection System [25.32139119893323]
無人航空機(UAV)は多くのモノのインターネット(IoT)システムに適用できる。
UAV-IoT無線チャネルは、時には木や高層建築物によってブロックされることがある。
本稿では,UAVの展開と軌道を最適化することで,システムのエネルギー消費を最小化することを目的とする。
論文 参考訳(メタデータ) (2022-10-27T06:27:40Z) - Towards On-Device AI and Blockchain for 6G enabled Agricultural
Supply-chain Management [10.189149128814096]
農業用サプライチェーン管理のための無人航空機(UAV)、AI、ブロックチェーンの組み合わせに基づくアーキテクチャを提案する。
完全な畳み込みニューラルネットワーク(FCN)モデルは、UAVが捉えた画像によるバイオマス推定に使用される。
6G対応ダイナミックUAVネットワークにおける飛行障害の影響を軽減するため,提案したモデル選択戦略は,実行時リソース要求に基づいて,UAVの更新を支援する。
論文 参考訳(メタデータ) (2022-03-12T15:36:23Z) - Multi-Agent Deep Reinforcement Learning For Optimising Energy Efficiency
of Fixed-Wing UAV Cellular Access Points [3.502112118170715]
固定翼UAVセルアクセスポイントのエネルギー効率を最適化する多エージェント深部強化学習手法を提案する。
提案手法では,UAVの3次元軌道を一連の時間経過で調整できるDueling Deep Q-Network (DDQN) エージェントを備える。
論文 参考訳(メタデータ) (2021-11-03T14:49:17Z) - A Multi-UAV System for Exploration and Target Finding in Cluttered and
GPS-Denied Environments [68.31522961125589]
複雑なGPSを用いた複雑な環境において,UAVのチームが協調して目標を探索し,発見するための枠組みを提案する。
UAVのチームは自律的にナビゲートし、探索し、検出し、既知の地図で散らばった環境でターゲットを見つける。
その結果, 提案方式は, 時間的コスト, 調査対象地域の割合, 捜索・救助ミッションの成功率などの面で改善されていることがわかった。
論文 参考訳(メタデータ) (2021-07-19T12:54:04Z) - Federated Learning in the Sky: Joint Power Allocation and Scheduling
with UAV Swarms [98.78553146823829]
無人航空機(UAV)は様々なタスクを実行するために機械学習(ML)を利用する必要がある。
本稿では,UAVスワム内に分散学習(FL)アルゴリズムを実装するための新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2020-02-19T14:04:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。